我的代码是:
from sklearn.feature_extraction.text import CountVectorizer
count_vect = CountVectorizer()
new_text = ["with with hello hello hello house"]
X_new_counts = count_vect.fit_transform(new_text)
i = count_vect.vocabulary_.get('hello')
print(X_new_counts.shape)
c = X_new_counts.getcol(0)
print(c)
由X_new_counts = count_vect.fit_transform(new_text)
生成的矩阵的形状为:(1,3)
使用i = count_vect.vocabulary_.get('hello')
,我得到hello词汇表中的索引。
我的目标是从索引相对计数的矩阵中获取值。我怎么能?如果我输入:
value = X_new_counts.getcol(i)
返回:
(0, 0) 3
,其中"3"是正确的值,但我不想要(0,0)。那么,我怎样才能从矩阵中得到这个值呢?
X_new_counts是一个(稀疏)矩阵,因此您可以使用:
获取i, j中的值:X_new_counts[i, j]