Excel使用Python Pandas从2张床单中合并细胞



我有两个excel表, sheet1sheet2。Sheep1具有row idFirst nameLast nameDescription列等。Sheet2还具有存储First nameLast name的列,以及其他两个列,column Dcolumn E,需要在描述列中合并。

First nameLast name的组合仅存在一次。

我如何根据匹配条件的匹配条件和姓氏在第1页中的第1列中的d,e列的内容,从表1和姓氏等同。使用Python Pandas?

表1:

ID | columnB  | column C | Column D 
1  | John     | Hingins  | Somedescription

表2:

ID | column Z | column X | Column Y     | Column W
1  | John     | Hingins  | description2 | Somemoredescription

输出:表1:

ID | columnB  | column C | Column D
1  | John     | Hingins  | description2-separator-Someotherdescription-separator-Somedescription

我认为您应该看这个。但这主要用于上下文。

http://pbpython.com/excel-file-combine.html

我认为您的问题实际上归结为此。

>>> !cat scores3.csv
ID,JanSales,FebSales
1,100,200
2,200,500
3,300,400
>>> !cat scores4.csv
ID,CreditScore,EMMAScore
2,good,Watson
3,okay,Thompson
4,not-so-good,NA
>>> import pandas as pd
>>> s3 = pd.read_csv("scores3.csv")
>>> s4 = pd.read_csv("scores4.csv")
>>> s3
   ID  JanSales  FebSales
0   1       100       200
1   2       200       500
2   3       300       400
>>> s4
   ID  CreditScore EMMAScore
0   2         good    Watson
1   3         okay  Thompson
2   4  not-so-good       NaN

然后我们可以在ID列中合并:

>>> merged = s3.merge(s4, on="ID", how="outer")
>>> merged
   ID  JanSales  FebSales  CreditScore EMMAScore
0   1       100       200          NaN       NaN
1   2       200       500         good    Watson
2   3       300       400         okay  Thompson
3   4       NaN       NaN  not-so-good       NaN

之后,我们可以将其保存到CSV文件或Excel文件:

>>> merged.to_csv("merged.csv")
>>> merged.to_excel("merged.xlsx")

来自...这里...

希望使用python 2.7

将两个通过ID合并到一个Excel文件中

最新更新