如果我使用基于相似性的算法(如pearson相关分数)来比较两个特征向量我想知道那些在特征集中非常不同的维度/特征字段,那么要使用的算法是什么?我正在使用Mahout,这是一个用于Java 的机器学习库
好吧,这只是两个向量差异最大的维度——其中向量值在维度中的差异的绝对值最大。这真的是你的全部意思吗?还是你在寻找更微妙的东西?
如果我使用基于相似性的算法(如pearson相关分数)来比较两个特征向量我想知道那些在特征集中非常不同的维度/特征字段,那么要使用的算法是什么?我正在使用Mahout,这是一个用于Java 的机器学习库
好吧,这只是两个向量差异最大的维度——其中向量值在维度中的差异的绝对值最大。这真的是你的全部意思吗?还是你在寻找更微妙的东西?
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium