如何将数据归一化为具有相同的平均平方和



在我所在领域的许多文章中,都重复了这句话:"2个矩阵已被归一化,以具有相同的平均平方和(在所有受试者和每个模态的所有体素中计算)"。假设我们有两个矩阵,行定义不同的主题,列是特征(体素)。在这些文章中,并没有找到太多关于规范化方法的解释。有人知道我应该如何将数据归一化为"相同的平均平方和"吗?我一点也不明白。感谢

首先,本文中的规范化也称为特征缩放,这在很大程度上概括了它。你缩放你的特征,你的数据,以消除方差和值的范围,这最终会干扰你的算法和结果。

https://en.wikipedia.org/wiki/Feature_scaling

在数据处理中,规范化非常有用(取决于应用程序)。例如,在基于距离的机器学习算法中,您应该规范化您的特征,以便对算法的结果做出比例贡献,而与特征所包含的值范围无关。

为此,您可以使用不同的统计测量,如平方和:

SUM_i(Xi-Xbar)²

除此之外,您可以使用数据的方差或标准差。

https://www.westgard.com/lesson35.htm#4

然后,这些统计术语可以用于规范数据,以提高算法的聚类质量。使用哪个术语和哪种方法在很大程度上取决于你正在使用的算法和数据以及你的目标。这里有一篇论文比较了一些可以选择的聚类方法:

http://maxwellsci.com/print/rjaset/v6-3299-3303.pdf

我希望这能对你有所帮助。

相关内容

  • 没有找到相关文章

最新更新