拆分时无法识别连字符

我正在使用大约 24k 个文本文件，并在"-"上拆分一些行。它适用于某些文件，但无法拆分其他一些文件。

company_participants是一个包含N >= 1元素的列表，每个元素由一个名称后跟一个连字符("-"(组成，后跟职位。为了获得名称，我使用：

names_participants = [name.split('-')[0].strip() for name in company_participants]

仔细检查，我发现由于某种原因，它无法将"-"识别为"-"。

例如，company_participants中的第一个元素是"罗伯特·伊索姆 - 总统">

调用company_participants[0].split()[2]返回"-"，因为我在空格上拆分了，连字符是第三个元素(索引 2(。

然后，当我运行布尔值以确定这是否等于"-"时，我得到 False。

company_participants[0].split()[2] == "-"  # Item at index 2 is the hyphen
# Output = False

知道这里发生了什么吗？有没有其他看起来像连字符但不是连字符的东西？

非常感谢！

所以我发现这实际上已经在StackOverflow的其他地方得到了回答。

显然我正在处理"破折号"而不是"连字符"; 用肉眼看不出区别，但是当我从这里复制符号时，它识别出它，company_participants[0].split()[2] == "–"返回 True。

#textDataProblems
#didNotSeeThatComing

谢谢堆栈溢出！

相关内容