如何在 arff 文件中表示 n 元语法特征



我一直在网上搜索这个问题,但一直找不到解决方案。问题是:我首先在java中使用Weka API来提取n-gram特征,我可以举例说明其中之一是

"not good"

问题从这里开始:arff 文件的标头如下所示:

@relation words
@attribute {0,1} not good
但是在创建arff文件

后,当我想处理文件时,出现了异常,这意味着arff文件的结构不正确。

属性名称和可能值的顺序不正确。 此外,包含空格的属性名称必须用引号括起来。 应该加载下面的示例 .arff 文件。

http://www.cs.waikato.ac.nz/ml/weka/arff.html

@relation words
@attribute 'not good' {0,1}
@data
0
1
0
1

最新更新