用作索引的数组必须是整型(或布尔型)



错误如下:

Traceback (most recent call last):
  File "NearestCentroid.py", line 53, in <module>
    clf.fit(X_train.todense(),y_train)
  File "/usr/local/lib/python2.7/dist-packages/scikit_learn-0.13.1-py2.7-linux-i686.egg/sklearn/neighbors/nearest_centroid.py", line 115, in fit
    variance = np.array(np.power(X - self.centroids_[y], 2))
IndexError: arrays used as indices must be of integer (or boolean) type

代码如下:

distancemetric=['euclidean','l2']
for mtrc in distancemetric:
for shrkthrshld in [None]:
#shrkthrshld=0
#while (shrkthrshld <=1.0):
    clf = NearestCentroid(metric=mtrc,shrink_threshold=shrkthrshld)
    clf.fit(X_train.todense(),y_train)
    y_predicted = clf.predict(X_test.todense())

我使用的是scikit-learn包,X-trainy_train是LIBSVM格式,X是特征:值对,y_train是目标/标签,X_train是CSR矩阵格式,shrink_threshold不支持CSR稀疏矩阵,所以我在X_train中添加了.todense(),然后我得到了这个错误,有人能帮我修复吗?非常感谢!

我在使用Pystruct pystruct.learners.OneSlackSSVM时遇到了类似的问题。

之所以出现这种情况,是因为我的训练标签是浮点值,而不是整数。在我的例子中,这是因为我用np.ones初始化了标签,而没有指定dtype=np.int8。希望能有所帮助。

通常情况下,索引数组的创建方式应该是明确的integer类型,但在传递空列表的情况下,它将成为默认的float,程序员可能不会考虑这种情况。例如:

>>> np.array(xrange(1))
>>> array([0])                #integer type as expected
>>> np.array(xrange(0))
>>> array([], dtype=float64)  #does not generalize to the empty list

因此,应该始终在数组构造函数中明确定义dtype

有时你的数据是整数,每件事都是正确的,但这是因为你的一个数据序列是空数组,所以你可以使用这个条件:

if len(X_train.todense())> 0:

相关内容

  • 没有找到相关文章

最新更新