Python距离矩阵



我想创建一个基于我的CSV文件的距离矩阵。矩阵是一个MxN数据帧。我使用distance_matrix函数来完成计算,但我正在寻找一种能够识别坐标的方法,因为我将对最小的结果距离值进行排序,因此我需要知道坐标。

是csv
pca=pd.read_csv(yourpath,sep=' ',header=0)的原始数据帧的示例
这会产生下面的示例

<表类> IID PC1 PC2 tbody><<tr>0HG00096-0.0117910.0241081HG00097-0.0113050.0251502HG00099-0.0117450.022634

融化它!

你想使用熊猫的熔化功能,例如

df = pd.DataFrame( np.random.random((3,3)), columns=list("abc"), index=list('xyz') )
print(df.melt(ignore_index=False))

输出
variable     value
x        a  0.417710
y        a  0.353251
z        a  0.650867
x        b  0.254477
y        b  0.986522
z        b  0.196494
x        c  0.738882
y        c  0.187359
z        c  0.710457

关于如何保持ID在一起的例子,请参阅melt。

请包含一些随机生成的样本数据,以便下次使用。

相关内容

  • 没有找到相关文章

最新更新