我正在尝试在python中使用Gensim总结一些文本,并希望在我的摘要中恰好有3个句子。似乎没有执行此操作的选项,因此我执行了以下解决方法:
with open ('speeches//'+speech, "r") as myfile:
speech=myfile.read()
sentences = speech.count('.')
x = gensim.summarization.summarize(speech, ratio=3.0/sentences)
然而,这段代码只给了我两句话。此外,当我逐渐增加 3 到 5 时,仍然没有任何反应。
任何帮助将不胜感激。
您可能无法为此使用"比率"。如果你给出 ratio=0.3,并且你有 10 个句子(假设每个句子中的字数相同),你的输出将有 3 个句子,6 个句子表示 20 个,依此类推。
根据通用西姆文档比率(浮点型,可选)– 介于 0 和 1 之间的数字,用于确定要为摘要选择的原始文本句子数的比例。
相反,您可能想尝试使用word_count,摘要(语音,word_count=60)
这个问题有点旧了,如果你找到更好的解决方案,请分享。