如何使用任何分类器对每个数据点由一组浮动值组成的数据进行分类

我有这种格式的数据-

[0.266465 0.9203907 1.007363…0。0.09623989 0.39632136]

它是第一行和第一列的值。

它是第一行第二列的值：

[0.9042176 1.135085 1.2988662…0。0.13614458 0.28000486]

我有2200行这样的行，我想训练一个分类器来识别这两组值是否相似？

p.S.-这些是提取的特征向量值。

如果您假设两个提取的特征向量之间的关系是线性的，您可以尝试使用Pearson相关性：

import numpy as np
from scipy.stats import pearsonr
list1 = np.random.random(100)
list2 = np.random.random(100)
pearsonr(list1, list2)

输出示例为：

(0.0746901299996632, 0.4601843257734832)

其中第一个值指相关性(7%(，第二个值指其显著性(当>0.05时，您接受在显著性水平alfa=5%时相关性不显著的零假设(。如果向量是相关的，它们在某种程度上是相似的。有关方法的详细信息，请点击此处。

此外，我遇到了归一化互相关，它用于识别图片之间的相似性(不是专家，所以请检查一下(。

相关内容