我试图通过以下方式聚集超过200k个点:
km = KMeans(n_clusters=5)
km.fit_transform(ends)
但我得到以下错误:km.fit_transform(结束)
所以矩阵维数是200kX2
File "/Users/fleh/anaconda/lib/python2.7/site-packages/sklearn/cluster/k_means_.py", line 814, in fit_transform
X = self._check_fit_data(X)
...
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
就我一直在追踪数据而言…这些数字并没有那么大。我怎么解决这个问题?由于
如果使用pandas进行数据处理,可以这样运行:
import pandas as pd
df = pd.DataFrame(ends)
df.replace([np.inf, -np.inf], np.nan)
df.info()
info()函数会告诉你是否有不可计算的值