如何用Spacy(Python)提取法语句子中的所有名词短语



我正在尝试使用Spacy从法语句子中提取所有名词短语。在我尝试的所有情况下,我的代码似乎都无法正常工作。例如,

nlp = spacy.load("fr_core_news_sm")
doc = nlp("Il y a plusieurs petits restaurants dans cette ville.")
for chunk in doc.noun_chunks:
print(chunk)

返回

[Il y a plusieurs petits restaurants dans cette ville.]作为名词短语,这似乎是不正确的,因为这里的名词短语是petits restaurants dans cette ville

当我尝试其他短语集时,如J'ai trouvé une jolie petite chambre.,它返回了3个短语,[J' , une jolie, petite chambre],这似乎也不正确

最后,对于Les deux dernières semaines, il était à Paris..,它返回了似乎正确的[Les deux dernières semaines, il]

对于如何确保前两个示例的代码正确工作,我将非常感谢任何帮助或指导。

首先尝试更新您的SpaCy 版本

pip install spacy --upgrade

将您的型号从小型fr_core_news_sm更改为大型fr_core_news_lg

安装:

-python -m spacy download fr_core_news_lg

或者直接从SpaCy的模型库(例如(进行pip安装

pip install https://github.com/explosion/spacy-models/releases/download/fr_core_news_lg-2.3.0/fr_core_news_lg-2.3.0.tar.gz

较大的模型通常在大多数NLP任务上具有更好的准确性。

最新更新