如何从.csv文件中提取数据并创建绘图



我有一个.csv文件,其中有24列x 514行数据。每一列都代表不同的参数,我希望研究不同参数之间的趋势。

我使用genfromtxt将数据导入为numpy数组,这样我就可以绘制两个特定列的值(例如,第9列与第11列)。以下是我目前所拥有的:

import matplotlib.pyplot as plt
import numpy as np

data = np.genfromtxt('output_burnin.csv', delimiter=',')
impactparameter=data[:,11]
planetradius=data[:,9]
plt.plot(planetradius,impactparameter,'bo')
plt.title('Impact Parameter vs. Planet Radius')
plt.xlabel('R$_P$/R$_Jup$')
plt.ylabel('b/R$_star$')
plt.show()

使用此代码,我在第12行遇到错误:

    impactparameter=data[:,11]
IndexError: too many indices

这里可能有什么问题?

此外,我一直在尝试如何在.csv文件中为每一列提供一个标题。因此,当我进行绘图时,我可以直接调用特定列的名称,而不是计算列编号。有办法做到这一点吗?

我是一个完全的Python新手,任何帮助都将不胜感激,谢谢!

此外,我一直在尝试如何在.csv文件中为每一列提供一个标题。因此,当我进行绘图时,我可以直接调用特定列的名称,而不是计算列编号。有办法做到这一点吗?

要在数组中指定列的名称,需要使其成为结构化数组。

这里有一个简单的例子:

a = np.zeros(5, dtype='f4, f4, f4')
a.dtype.names = ('col1', 'col2', 'col3')
print a[0]  # prints [0, 0, 0], the first row (record)
print a['col1']  # prints [0, 0, 0, 0, 0], the first column

如果您在CSV文件的开头有列名,并在np.genfromtxt中设置names=True,则Numpy将自动为您创建一个具有正确名称的结构化数组。

相关内容

  • 没有找到相关文章

最新更新