我想创建一个基于我的CSV文件的距离矩阵。矩阵是一个MxN数据帧。我使用distance_matrix函数来完成计算,但我正在寻找一种能够识别坐标的方法,因为我将对最小的结果距离值进行排序,因此我需要知道坐标。
是csvpca=pd.read_csv(yourpath,sep=' ',header=0)
的原始数据帧的示例
这会产生下面的示例
<表类>
IID
PC1
PC2
tbody><<tr>0 HG00096 -0.011791 0.024108 1HG00097 -0.011305 0.025150 2HG00099 -0.011745 0.022634 表类>
融化它!
你想使用熊猫的熔化功能,例如
df = pd.DataFrame( np.random.random((3,3)), columns=list("abc"), index=list('xyz') )
print(df.melt(ignore_index=False))
输出variable value
x a 0.417710
y a 0.353251
z a 0.650867
x b 0.254477
y b 0.986522
z b 0.196494
x c 0.738882
y c 0.187359
z c 0.710457
关于如何保持ID在一起的例子,请参阅melt。
请包含一些随机生成的样本数据,以便下次使用。