Pandas数据帧-删除基于列的部分字符串



我想删除基于col_b的col_a中的部分字符串。

例如:

df = pd.DataFrame(np.array([['School 1 25 Queen Street','25 Queen Street'],['99 Main Street High School 2','99 Main Street']]), columns = ['Col a','Col b'])
Col_aCol_b
皇后街25号学校25皇后街
99 Main Street High School 299 Main Street

我们可以在lambda表达式内部放置一个字符串替换,并将其应用于数据帧的每一行。

df['Col a'] = df.apply(lambda x: x['Col a'].replace(x['Col b'], ''), axis = 1)

最新更新