如何查看列表 A 的成员是否在列表 B 中,并应用熊猫



我正在尝试查看一个列表 A 的元素是否在另一个列表 B 中以及在哪个索引上。我知道它们不是熊猫结构。但是应该有一种方法可以使用这些列表来获取示例的结果。如果我错了,请纠正我,我对熊猫更陌生。

例如

A = ['hi', 'I', 'Am', 'A', 'Test']
B = ['Sara', 'bla', 'bar', 'I', 'python', 'Test', 'Bye', 'hi']

然后得到一个结果列表 C

C = [0, 0, 0, 1, 0, 1, 0, 1]

其中 1 表示列表 B 中 a 中的元素出现,0 表示没有出现。

顺便说一句,对python来说仍然是新手。我在这里看到了答案,示例,但我不知道如何将其应用于我的情况。它建议熊猫功能适用。

我想探索的选项是您使用名为 apply 的函数的选项。该示例显示它要快得多,并且我使用大数据集。

您可能正在寻找 isin + astype

B.isin(A).astype(int)
0    0
1    0
2    0
3    1
4    0
5    1
6    0
7    1
dtype: int64

其中AB都是系列。

如果要执行子字符串比较,则需要一个略有不同的解决方案,涉及str.findall

B.str.findall('|'.join(A), flags=re.I).str.len().clip(0, 1)
0    1
1    1
2    1
3    1
4    0
5    1
6    0
7    1
dtype: int64

最新更新