用于文本情感检测的数据集



我正在实现一个可以检测文本中人类情感的系统。是否有手动标注的数据集可用于监督学习和测试?

下面是一些有趣的数据集:https://dataturks.com/projects/trending

文本情感检测这一领域仍然是一个非常新的领域,文献在不同领域的许多不同期刊上都是碎片化的。真的很难看清外面有什么。

注意,有几个情绪理论心理学。因此,在计算中有不同的建模/表示情感的方法。大多数时候,"情绪"指的是一种现象,比如愤怒、恐惧或喜悦。其他理论认为,所有的情绪都可以在多维空间中表现出来(所以有无限多的情绪)。

以下是我所知道的(已更新的)一些(公开可用的)数据集:

  1. EmoBank。1万句标有效价、唤醒和支配值的句子(披露:我是作者之一)。https://github.com/JULIELab/EmoBank

  2. 来自WASSA 2017共享任务的"tweet中的情感强度"数据集。http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Preotiuc-Pietro和其他:http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. The impact data by Cecilia Ovesdotter Alm:http://people.rc.rit.edu/coagla affectdata/index . html

  5. The Emotion in Text data set by CrowdFlowerhttps://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR:http://emotion - research.net/toolbox/toolboxdatabase.2006 10 - 13.2581092615

  7. SemEval 2007测试语料库(情感文本任务)http://web.eecs.umich.edu/mihalcea/downloads.html

  8. 用情绪重新注释SemEval姿态数据:http://www.ims.uni-stuttgart.de/data/ssec

如果你想更深入地了解这个话题,这里有一些我推荐的调查(披露:我是第一个作者)。

  1. Buechel, S, &Hahn, U.(2016)。情绪分析作为一个回归问题——维度模型及其对情绪表征和测量评价的启示。ECAI 2016.22欧洲人工智能会议(pp. 1114-1122)。荷兰海牙(网址:http://ebooks.iospress.nl/volumearticle/44864)

  2. Canales, L., &Martínez-Barco, P.(未注明日期)。从文本中识别情感:一项调查。

  3. 第5个信息系统研究工作天的处理(JISIC 2014), 37(可查阅:http://www.aclweb.org/anthology/W14-6905)。

最新更新