我想删除基于col_b的col_a中的部分字符串。
例如:
df = pd.DataFrame(np.array([['School 1 25 Queen Street','25 Queen Street'],['99 Main Street High School 2','99 Main Street']]), columns = ['Col a','Col b'])
Col_a | Col_b |
---|---|
皇后街25号学校 | 25皇后街 |
99 Main Street High School 2 | 99 Main Street |
我们可以在lambda表达式内部放置一个字符串替换,并将其应用于数据帧的每一行。
df['Col a'] = df.apply(lambda x: x['Col a'].replace(x['Col b'], ''), axis = 1)