斯坦福核心NLP分类器:NER训练上下文



在斯坦福大学的CoreNLP分类器中,我看到的所有例子都包含了人们不想识别的单词(用O表示(。例如,以下"某些"和"之前"不确认为资产:

certain O       O
Apple   ASSET   ASSET
products       ASSET   ASSET
macOS   ASSET   ASSET
before  O       O

1(我是否需要提供上下文的单词,例如"确定"和"之前"?

2( 订单重要吗?我是否可以,而不是

"某些,Apple,产品,macOS,之前"的顺序"做"之前,某些,Apple,macOS,产品"?3( 如果需要上下文,一旦我添加了足够的训练数据,我是否可以在没有上下文的情况下添加更多资产?

AD 1。如果您的分类与上下文相关,则上下文非常有用。

广告 2.在引擎盖下,斯坦福CoreNLP分类器使用CRF(条件随机场(算法,该算法也使用单词的顺序来正确分类。

广告 3.见第1点。- 必要性取决于您的问题和数据。您可以重用以前的上下文,看看这会提高还是降低分类准确性。

最新更新