短文本情感分类任务所需的最小训练集大小是多少



我正在尝试训练一个LSTM模型,用于对产品评论和推文等短文本进行情感分类。

我正在寻找一个标记积极/消极/中性的训练集,有没有这样的东西(免费研究)真的是基于人类标签,而不是基于开头或表情符号?Ive只发现了一些小的训练,这让我的成绩很差。Iv'e试图增加我的网络和堆叠层的大小,但没有改进。

为了开始获得合理的结果(F1>0.8),这样的训练集的最小大小是多少。

你只需要列出100个左右的否定形容词和肯定形容词。

请参阅:
http://na2english.wikispaces.com/file/view/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf/400672720/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf

http://arxiv.org/ftp/arxiv/papers/1011/1011.4623.pdf

如果你使用它们,显然会引用它们,但语言是免费的,所以你可以在工作中使用它们。

可能比您构建的数据库的大小更重要的是,选择针对特定应用程序的单词以提高效率。

你是将这个项目用于特定的商业用途,还是作为一项更广泛的研究工作?

相关内容

  • 没有找到相关文章

最新更新