是否有基于新闻文章和标题的免费语料库?
我正在寻找可以进行文本挖掘和分析的领域,我需要相关数据的语料库。
我在哪里可以免费下载它们?
如前所述,这种类型的问题对于 SO 来说是题外话,但由于我知道您可能感兴趣的一个很好的数据集,所以我正在分享这些信息。
纽约时报 2013 (NYT2013(
- 纽约时报,CNN和BBC的新闻文章和用户对2014年发生的四件重大事件的评论。
- 2013年《纽约时报》新闻文章和用户评论。
用于工作 - 复杂事件的社会知情时间线生成。数据集可以从这里下载。