如何在python中为sklearn dump_svmlight_file指定功能名称



文档:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.dump_svmlight_file.html

svmlight遵循数据格式:

<target> <feature:value> <feature:value>

带数据:

a = [[1,2,3],[4,5,6]]
b = [8,9]

运行命令:

dump_svmlight_file(a,b,'test.txt')

输出以下内容:

8 0:1 1:2 2:3
9 0:4 1:5 2:6

我想知道是否有一种方法可以指定功能名称,而不是从0开始递增,我希望得到如下结果:

1 10:5 50:15 100:50
0 10:15 25:5 75:15
1 20:5 40:5 60:5

dump_svmlight_file命令有这样的功能吗?

否。dump_svmlight_file没有内置该选项。源代码

您只需使用参数zero_based指定要素名称是从0开始还是从1开始。文档

我建议您不要尝试用实际的功能名称转储文件,这会不必要地增加文件的大小。相反,将您的功能名称单独提取,然后将它们合并。

相关内容

  • 没有找到相关文章

最新更新