我想根据一个字符串列的值是否是另一个字符串列中值的子字符串来过滤DataFrame
。
根据这个 2 年前的帖子,这可以使用这样的应用程序来完成:
df = pd.DataFrame({'FNAME': ['Max', 'Tobi'], 'LNAME': ['Foo', 'Tobiwan']})
df.loc[ df.apply(lambda row: row.FNAME in row.LNAME, axis=1) ]
FNAME LNAME
1 Tobi Tobiwan
我想知道是否有一些内置的矢量化方法可以做到这一点?
使用 replace
df[df.LNAME.replace(regex=r'(?i)'+ df.FNAME,value=True)==True]
FNAME LNAME
1 Tobi Tobiwan