在pandas Python中查找2个数据帧之间的列中的重复项



我该如何编写一个函数来检测熊猫数据帧是否存在重复。因此,如果我比较firstsecond之间的index列,则不存在重复。但如果我比较firstthird之间的index列,则存在1的重复。我想写一个函数,当有重复时返回True的bool,当没有时返回False

import pandas as pd
first = pd.DataFrame({'index': [1,4,5,6],
'vals':[3,4,5,7] })
second = pd.DataFrame({'index': [13,7,8,9],
'vals':[3,2,3,1] })
third = pd.DataFrame({'index': [1,11,2,12],
'vals':[6,7,51,2] })

预期输出:

first and second: False
first and third: True

使用sets谓词:

>>> any(set(first['index']).intersection(second['index']))
False  # because {}
>>> any(set(first['index']).intersection(third['index']))
True  # because {1}

相关内容

  • 没有找到相关文章

最新更新