我正在尝试通过ChemDataExtractor(Python(处理用于提取化学实体的文本。就是一个可能的例子
from chemdataextractor import Document
doc = Document('UV-vis spectrum of 5,10,15,20-Tetra(4-carboxyphenyl)porphyrin in Tetrahydrofuran (THF).')
并且键入doc.cems
,结果是以下列表
[Span('THF', 82, 85),
Span('5,10,15,20-Tetra(4-carboxyphenyl)porphyrin', 19, 61),
Span('Tetrahydrofuran', 65, 80)]
我想只提取'THF'
、'5,10,15,20-Tetra(4-carboxyphenyl)porphyrin'
、'Tetrahydrofuran'
,而不提取"span元素"。我该怎么做?
解决方案是:
doc.cems[0].text
doc.cems[1].text
doc.cems[2].text