我正在使用Word2vec和gensim,进行项目
model = gensim.models.Word2Vec(
documents = 'userDataFile.txt',
size=150,
window=10,
min_count=2,
workers=10)
model = gensim.model.Word2Vec.load("word2vec.model")
model.train(documents, total_examples=len(documents), epochs=10)
model.save("word2vec.model")
这是我现在的零件代码,我在下面得到了这个错误
Traceback (most recent call last): File "C:UsersUserDesktopInstaSubProjecttemplatesHashtagData.py", line 37, in <module> workers=10) TypeError: __init__() got an unexpected keyword argument 'documents'
UserDataFile.txt
是我存储从web抓取中获得的输出结果数据的文件。
我真的不确定我需要解决什么问题。
提前谢谢!
今年是2021年,如果你来这里的原因和我一样,那是因为你在size
参数上遇到了同样的错误。
您需要使用vector_size
。
使用vector_size而不是大小strongtext
# creating a word to vector model
model_w2v = gensim.models.Word2Vec(
tokenize_data,
vector_size=200)
__init__()
是Word2Vec的类构造函数,当您用gensim.models.Word2Vec()
实例化类时,参数documents
实际上不是必需的
试试这个:
model = gensim.models.Word2Vec(
size=150,
window=10,
min_count=2,
workers=10)
看起来该模型在初始化时没有使用关键字参数documents
。我认为你可以尝试以下任何一种来代替你的documents=
声明:
corpus_file = 'userDataFile.txt'
或
sentences = # your iterable of sentences here
根据您使用的格式