我看了很多帖子,但似乎都没有帮助。
我想计算术语频率&反向文档频率;深度学习中使用的单词袋技术。这个代码的目的只是计算公式。我在这里没有实现ANN。
下面是一个最小的代码示例。在for循环之后,我遇到了这个问题。
import math
docs = 1000
words_per_doc = 100 # length of doc
#word_freq = 10
#doc_freq = 100
dp = 4
print('Term Frequency Inverse Document Frequency')
# term, word_freq, doc_freq
words = [['the', 10, 100], ['python', 10, 900]]
tfidf_ = []
for idx, val in enumerate(words):
print(words[idx][0] + ':')
word_freq = words[idx][1]
doc_freq = words[idx][2]
tf = round(word_freq/words_per_doc, dp)
idf = round(math.log10(docs/doc_freq), dp)
tfidf = round((tf*idf), dp)
print(str(tf) + ' * ' + str(idf) + ' = ' + str(tfidf))
tfidf_.append(tfidf)
print()
max_val = max(tfidf)
max_idx = tfidf.index(max_val)
#max_idx = tfidf.index(max(tfidf))
lowest_idx = 1 - max_idx
print('Therefore, '' + words[max_idx][0] + '' semantically is more important than '' + words[lowest_idx][0] + ''.')
#print('log(N/|{d∈D:w∈W}|)')
错误:
line 25, in <module>
max_val = max(tfidf)
TypeError: 'float' object is not iterable
您正试图在函数上传递tfidf,而不是tfidf_
tfidf是int,tfidf_是您的列表
所以代码应该是
max_val = max(tfidf_)
max_idx = tfidf_.index(max_val)