新闻文章和标题的自由文本挖掘语料库



是否有基于新闻文章和标题的免费语料库?

我正在寻找可以进行文本挖掘和分析的领域,我需要相关数据的语料库。

我在哪里可以免费下载它们?

如前所述,这种类型的问题对于 SO 来说是题外话,但由于我知道您可能感兴趣的一个很好的数据集,所以我正在分享这些信息。

纽约时报 2013 (NYT2013(

  • 纽约时报,CNN和BBC的新闻文章和用户对2014年发生的四件重大事件的评论。
  • 2013年《纽约时报》新闻文章和用户评论。

用于工作 - 复杂事件的社会知情时间线生成。数据集可以从这里下载。

最新更新