NLP:如何使用Gensim获取文本摘要的确切句子数

我正在尝试在python中使用Gensim总结一些文本，并希望在我的摘要中恰好有3个句子。似乎没有执行此操作的选项，因此我执行了以下解决方法：

with open ('speeches//'+speech, "r") as myfile:
    speech=myfile.read()
    sentences = speech.count('.')
    x = gensim.summarization.summarize(speech, ratio=3.0/sentences)

然而，这段代码只给了我两句话。此外，当我逐渐增加 3 到 5 时，仍然没有任何反应。

任何帮助将不胜感激。

您可能无法为此使用"比率"。如果你给出 ratio=0.3，并且你有 10 个句子（假设每个句子中的字数相同），你的输出将有 3 个句子，6 个句子表示 20 个，依此类推。

根据通用西姆文档比率（浮点型，可选）– 介于 0 和 1 之间的数字，用于确定要为摘要选择的原始文本句子数的比例。

相反，您可能想尝试使用word_count，摘要（语音，word_count=60）

这个问题有点旧了，如果你找到更好的解决方案，请分享。

相关内容

最新更新

热门标签：