我有两个excel表, sheet1
和 sheet2
。Sheep1具有row id
,First name
,Last name
,Description
列等。Sheet2还具有存储First name
,Last name
的列,以及其他两个列,column D
和column E
,需要在描述列中合并。
First name
,Last name
的组合仅存在一次。
我如何根据匹配条件的匹配条件和姓氏在第1页中的第1列中的d,e列的内容,从表1和姓氏等同。使用Python Pandas?
表1:
ID | columnB | column C | Column D
1 | John | Hingins | Somedescription
表2:
ID | column Z | column X | Column Y | Column W
1 | John | Hingins | description2 | Somemoredescription
输出:表1:
ID | columnB | column C | Column D
1 | John | Hingins | description2-separator-Someotherdescription-separator-Somedescription
我认为您应该看这个。但这主要用于上下文。
http://pbpython.com/excel-file-combine.html
我认为您的问题实际上归结为此。
>>> !cat scores3.csv
ID,JanSales,FebSales
1,100,200
2,200,500
3,300,400
>>> !cat scores4.csv
ID,CreditScore,EMMAScore
2,good,Watson
3,okay,Thompson
4,not-so-good,NA
在 >>> import pandas as pd
>>> s3 = pd.read_csv("scores3.csv")
>>> s4 = pd.read_csv("scores4.csv")
>>> s3
ID JanSales FebSales
0 1 100 200
1 2 200 500
2 3 300 400
>>> s4
ID CreditScore EMMAScore
0 2 good Watson
1 3 okay Thompson
2 4 not-so-good NaN
然后我们可以在ID列中合并:
>>> merged = s3.merge(s4, on="ID", how="outer")
>>> merged
ID JanSales FebSales CreditScore EMMAScore
0 1 100 200 NaN NaN
1 2 200 500 good Watson
2 3 300 400 okay Thompson
3 4 NaN NaN not-so-good NaN
之后,我们可以将其保存到CSV文件或Excel文件:
>>> merged.to_csv("merged.csv")
>>> merged.to_excel("merged.xlsx")
来自...这里...
希望使用python 2.7