有没有办法找到最接近字符串的匹配项?df有两个独立的列。user_input是一个包含1000个非emptyrows的列。由于只有20个possible_fuits,possible_Fuits有980个空行。
df
user_input possible_fruits
aapl apple
applee pear
aaaple banana
...
预期输出
user_input closest_match_in_possible_fruits
aapl apple
applee apple
aaaple apple
尝试使用http://docs.python.org/library/difflib.html#difflib.get_close_matches
difflib.get_close_matches(user_input1, possible_fruits)
对于柱,进行
for i in df:
answer = difflib.get_close_matches(df['user_input'][i], df['possible_fruits'])
print (answer)
编辑:
user_input = df['user_input']
possible_fruits = df['possible_fruits']
for i in user_input:
answer = difflib.get_close_matches(user_input[i], possible_fruits)
print(answer)