使用从文本中提取特征创建数据集



我正在尝试从恐怖事件的文本数据中提取一些特征来创建数据集。使用名称实体识别,我已经成功提取了名称、地点、组织等特征,现在我想提取事件中涉及的成员数量。

The 2008 Mumbai attacks (also referred to as 26/11) were a series of terrorist attacks that took place in
November 2008, when 10 members of Lashkar-e-Taiba, a terrorist organization based in Pakistan,
carried out 12 coordinated shooting and bombing attacks lasting four days across Mumbai.

从上面的文字中,我如何提取10 名虔诚军成员并将 10 名放在攻击者人数列中。 使用nlp技术甚至可能吗?

在您的情况下可能有用的两种技术是 - 依赖项分析和语义角色标记。您可能还想查找基于方面的情绪分析。这三者都可以帮助识别句子中单词之间的关系。

最新更新