通过行有效地构建PANDAS DATAFRAME



我最近通过多个文件,行等迭代来构建pandas dataframes。P>

我了解还有其他工具,例如apply()和internows(),可以逐步逐步逐步逐步应用或屏幕数据。那不是这个问题的话题。

new_data_dict = {}
for r in df.index:
    new_data = df.loc[r] **2
    new_data_dict[r] = new_data
new_df = pd.DataFrame.from_dict(new_data_dict, orient = 'index')

这是建造熊猫DF的最有效方法吗?我没有将其与pandas.dataframe.append进行比较。我对附加有两个想法。一方面,创建数据框架或系列(单行)似乎不必要的沉重,只是为了附加。另一方面

通过行构建DataFrame行的'Pandamic'是什么?

,而不是使用for for循环并重复行,可以使用numpy。

import pandas as pd
import numpy as np
df = pd.DataFrame({'Location':['New York','Florida','California', 'Nevada','Georgia'],
                   'Owner':['John','Gary','Mike','Kate','Lucy'],
                   'Score':[50,80,70,90,80]})
print (df)
new_df = pd.DataFrame(np.repeat(df.values,2,axis=0))
print (new_df)

原始数据框:

     Location Owner  Score
0    New York  John     50
1     Florida  Gary     80
2  California  Mike     70
3      Nevada  Kate     90
4     Georgia  Lucy     80

带有重复行的新数据框:

            0     1   2
0    New York  John  50
1    New York  John  50
2     Florida  Gary  80
3     Florida  Gary  80
4  California  Mike  70
5  California  Mike  70
6      Nevada  Kate  90
7      Nevada  Kate  90
8     Georgia  Lucy  80
9     Georgia  Lucy  80

最新更新