for 循环生成错误'cannot insert {}, already exists'具体取决于 Pandas 数据帧定义



我有一系列天文观测,这些观测被放置在每个观测年(即df2015,df2016等(的程序生成的数据帧中。这些数据帧需要在后续进程中修改,我将它们全部放在列表中。用于定义列表的方法会有所不同。显式定义的列表

dfs = [df2015, df2016, df2017, df2018, df2019]

允许进一步的DF修改,但它不同意代码的目的 - 无论年限如何,都可以自动处理标准数据集。程序生成的列表

for yr in years:
exec('dfs = [df' + yr + ' for yr in years]')

似乎大部分时间都在工作,如:

for df in dfs:
dfX = df.dtypes
for index, val2 in dfX.items():
if val2 == 'float64':
df.iloc[:,index] = df.iloc[:,index].fillna(0).astype('int64')

,但在某些情况下会失败,例如:

for df in dfs:
i=1
for i in range(1, 13):
ncol = i + (i-1) *2
if i < 10:
nmon = '0' + str(i)
else:
nmon = '' + str(i)
df.insert(ncol, 'M' + nmon, nmon)
i += 1

当带有插入语句的 for 循环导致错误时:

ValueError: cannot insert M01, already exists

我尝试过列表理解而不是 for 循环,尝试更改循环嵌套顺序(以防万一(等。

上述参考步骤的目的是转换以下内容:


0   1   2   3   4   5   6   7   8   9   ... 15  16  17  18  19  20  21  22  23  24
0   1   713 1623    658.0   1659.0  619 1735    526.0   1810.0  439 ... 437 1903    510.0   1818.0  542 1725    618.0   1637.0  654 1613
1   2   714 1624    657.0   1700.0  618 1736    525.0   1812.0  438 ... 438 1902    511.0   1816.0  543 1724    619.0   1636.0  655 1613
2   3   714 1625    655.0   1702.0  616 1737    523.0   1813.0  437 ... 439 1901    512.0   1814.0  544 1722    620.0   1635.0  656 1612
3   4   714 1626    654.0   1703.0  614 1738    521.0   1814.0  435 ... 440 1900    513.0   1813.0  545 1720    622.0   1634.0  657 1612
4   5   713 1627    653.0   1704.0  613 1739    520.0   1815.0  434 ... 441 1859    514.0   1811.0  546 1719    623.0   1633.0  658 1612

进入这个


0   M01 D01 1   2   M02 D02 3   4   M03 ... 19  20  M11 D11 21  22  M12 D12 23  24
0   1   01  1   713 1623    02  1   658 1659    03  ... 542 1725    11  1   618 1637    12  1   654 1613
1   2   01  2   714 1624    02  2   657 1700    03  ... 543 1724    11  2   619 1636    12  2   655 1613
2   3   01  3   714 1625    02  3   655 1702    03  ... 544 1722    11  3   620 1635    12  3   656 1612
3   4   01  4   714 1626    02  4   654 1703    03  ... 545 1720    11  4   622 1634    12  4   657 1612
4   5   01  5   713 1627    02  5   653 1704    03  ... 546 1719    11  5   623 1633    12  5   658 1612

创建去年数据帧的副本列表。如果您的年份列表是例如['2015', '2016', '2017', '2018'],则生成一个 dfs 作为[df2018, df2018, df2018, df2018]这将导致错误。

这将得到正确的结果:

dfs = [eval('df' + yr) for yr in years]

它形成所需的数据帧名称并对其进行评估,以便获得数据帧列表。

相关内容

最新更新