我在大学读数据科学的第二年,所以我还不太擅长python,我目前在一家IT公司实习,我有两个CSV文件;它们包含相同的人,但列在不同名称的列中。
(Victoria Gonzales在ADA.csv文件中,也在HRS.csv文件中,但这些列的名称不相同,或者名字列前面有不同的东西。例如工资。(
我想合并没有重复的文件,我该怎么做?提前感谢!
可能需要更多信息才能给出最佳答案。你能用你当前的代码和数据帧回复吗。
你试过了吗?
df.drop_duplicates()
你是否试图将所有信息映射到分布在两个文件中的特定人员?