我使用谷歌云平台上的自然语言模块,更具体地说,AUTOML用于文本分类。当我完成导入数据并处理文本时,我遇到了这个错误,我不理解:
错误:数据集的注释规范太多,允许的最大数量为5000。
这是什么意思?你已经拿到了吗?
感谢
看看AutoML配额&限制文档以更好地理解。
似乎您已经达到了每个数据集标签的最高限制。检查AutoML限制-->每个数据集的标签-->2-5000(用于分类(。
要考虑到,与配额不同,限额是不能增加的。
当我确信我的标签数量低于5000时,我也遇到了这个错误。事实证明,这是我的CSV格式错误。
当您在Pandas中使用to_csv((创建文本数据时,它只会引用包含逗号的文本数据部分,而AutoML text希望您引用文本的所有行。我已经在这个堆栈溢出回答中编写了解决方案