在另一列中查找最接近的匹配项



有没有办法找到最接近字符串的匹配项?df有两个独立的列。user_input是一个包含1000个非emptyrows的列。由于只有20个possible_fuits,possible_Fuits有980个空行。

df
user_input    possible_fruits
aapl            apple
applee          pear
aaaple          banana
...

预期输出

user_input  closest_match_in_possible_fruits
aapl            apple      
applee          apple      
aaaple          apple      

尝试使用http://docs.python.org/library/difflib.html#difflib.get_close_matches

difflib.get_close_matches(user_input1, possible_fruits)

对于柱,进行

for i in df:
answer = difflib.get_close_matches(df['user_input'][i], df['possible_fruits'])
print (answer)

编辑:

user_input = df['user_input']
possible_fruits = df['possible_fruits']
for i in user_input:
answer = difflib.get_close_matches(user_input[i], possible_fruits)
print(answer)

最新更新