用于文本情感检测的数据集

我正在实现一个可以检测文本中人类情感的系统。是否有手动标注的数据集可用于监督学习和测试?

下面是一些有趣的数据集:https://dataturks.com/projects/trending

文本情感检测这一领域仍然是一个非常新的领域，文献在不同领域的许多不同期刊上都是碎片化的。真的很难看清外面有什么。

注意，有几个情绪理论心理学。因此，在计算中有不同的建模/表示情感的方法。大多数时候，"情绪"指的是一种现象，比如愤怒、恐惧或喜悦。其他理论认为，所有的情绪都可以在多维空间中表现出来(所以有无限多的情绪)。

以下是我所知道的(已更新的)一些(公开可用的)数据集:

EmoBank。1万句标有效价、唤醒和支配值的句子(披露:我是作者之一)。https://github.com/JULIELab/EmoBank
来自WASSA 2017共享任务的"tweet中的情感强度"数据集。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html
Preotiuc-Pietro和其他:http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv
The impact data by Cecilia Ovesdotter Alm:http://people.rc.rit.edu/coagla affectdata/index . html
The Emotion in Text data set by CrowdFlowerhttps://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv
ISEAR:http://emotion - research.net/toolbox/toolboxdatabase.2006 10 - 13.2581092615
SemEval 2007测试语料库(情感文本任务)http://web.eecs.umich.edu/mihalcea/downloads.html
用情绪重新注释SemEval姿态数据:http://www.ims.uni-stuttgart.de/data/ssec

如果你想更深入地了解这个话题，这里有一些我推荐的调查(披露:我是第一个作者)。

Buechel, S， &Hahn, U.(2016)。情绪分析作为一个回归问题——维度模型及其对情绪表征和测量评价的启示。ECAI 2016.22欧洲人工智能会议(pp. 1114-1122)。荷兰海牙(网址:http://ebooks.iospress.nl/volumearticle/44864)
Canales, L.， &Martínez-Barco, P.(未注明日期)。从文本中识别情感:一项调查。

相关内容