MiniBatchKMeans Python



我正在使用scikitlearn的MiniBatchKMeans()函数。好吧,在它的文档中有:

batch_size: int,可选,默认值:100小批量的大小。

init_size: int,可选,默认值:3 * batch_size为了加快初始化(有时以牺牲准确性为代价)而随机采样的样本数量:唯一的算法是通过在数据的随机子集上运行批处理KMeans来初始化的。需要大于n_clusters

我不太明白,因为看起来迷你批处理的最终尺寸是3*batch_size,而不是batch_size参数指定的尺寸。

我误解了什么吗?如果是这样,有人可以解释这两个论点。如果我是对的,为什么会有这两个论点,因为它们似乎是多余的。

谢谢! !

批大小由batch_size定义,句号。此外,您可以定义init_size,这是用于初始化进程的的样本大小,并且默认为3* batch_size。您可以简单地设置bath_size=100init_size=10,然后使用10个样本来执行初始化(kmeans不是全局收敛的,在初始化阶段有许多技术来处理它),然后在算法执行期间将使用100个批量。

相关内容

  • 没有找到相关文章

最新更新