Sci-Kit Learn:从CountVectorizer.fit_transofrm() (PYTHON)生成的矩阵



我的代码是:

from sklearn.feature_extraction.text import CountVectorizer
count_vect = CountVectorizer()
new_text = ["with with hello hello hello house"]
X_new_counts = count_vect.fit_transform(new_text)

i = count_vect.vocabulary_.get('hello')
print(X_new_counts.shape)
c = X_new_counts.getcol(0)
print(c)

X_new_counts = count_vect.fit_transform(new_text)生成的矩阵的形状为:(1,3)

使用i = count_vect.vocabulary_.get('hello'),我得到hello词汇表中的索引。

我的目标是从索引相对计数的矩阵中获取值。我怎么能?如果我输入:

value = X_new_counts.getcol(i)

返回:

(0, 0) 3

,其中"3"是正确的值,但我不想要(0,0)。那么,我怎样才能从矩阵中得到这个值呢?

X_new_counts是一个(稀疏)矩阵,因此您可以使用:

获取i, j中的值:
X_new_counts[i, j]

相关内容

  • 没有找到相关文章

最新更新