在scikit learn中,提供了两个功能来加载和转储SVM^light格式的文件:
sklearn.datasets.load_svmlight_file和sklearn.ddatasets.dump_svmlightfile
文档显示(并且函数支持)load_svmlight_file可以加载多标签数据,即目标类别用逗号分隔,而不是只有一个类别作为目标但是,dump_svmlight_file似乎不支持此功能。
我是看错了,还是由于某种原因dump_svmlight_file不支持这一点?甚至不可能通过传递带有基于字符串的目标值的y向量来"欺骗它",因为文件编写器需要值的浮点值。转储文件代码位于https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py从线路230到262。
没错,dump_svmlight_file
目前不支持多标签任务。这是一个遗漏;您可以为它提交一份错误报告,尽管一个好的补丁(pull请求)会导致更快的操作。
(签名,该模块的作者之一。)