如何使用ChemDataExtractor提取化学实体



我正在尝试通过ChemDataExtractor(Python(处理用于提取化学实体的文本。就是一个可能的例子

from chemdataextractor import Document
doc = Document('UV-vis spectrum of 5,10,15,20-Tetra(4-carboxyphenyl)porphyrin in Tetrahydrofuran (THF).')

并且键入doc.cems,结果是以下列表

[Span('THF', 82, 85),
Span('5,10,15,20-Tetra(4-carboxyphenyl)porphyrin', 19, 61),
Span('Tetrahydrofuran', 65, 80)]

我想只提取'THF''5,10,15,20-Tetra(4-carboxyphenyl)porphyrin''Tetrahydrofuran',而不提取"span元素"。我该怎么做?

解决方案是:

doc.cems[0].text
doc.cems[1].text
doc.cems[2].text

最新更新