NLP:如何使用Gensim获取文本摘要的确切句子数



我正在尝试在python中使用Gensim总结一些文本,并希望在我的摘要中恰好有3个句子。似乎没有执行此操作的选项,因此我执行了以下解决方法:

with open ('speeches//'+speech, "r") as myfile:
    speech=myfile.read()
    sentences = speech.count('.')
    x = gensim.summarization.summarize(speech, ratio=3.0/sentences)

然而,这段代码只给了我两句话。此外,当我逐渐增加 3 到 5 时,仍然没有任何反应。

任何帮助将不胜感激。

您可能无法为此使用"比率"。如果你给出 ratio=0.3,并且你有 10 个句子(假设每个句子中的字数相同),你的输出将有 3 个句子,6 个句子表示 20 个,依此类推。

根据通用西姆文档比率(浮点型,可选)– 介于 0 和 1 之间的数字,用于确定要为摘要选择的原始文本句子数的比例。

相反,您可能想尝试使用word_count摘要(语音,word_count=60)

这个问题有点旧了,如果你找到更好的解决方案,请分享。

最新更新