我有一个文本文件.我想要像这种格式的搜索短语,或者用标点符号或类似的混乱的单词格式.我使用Python 3.x.任何Py



Test1.txt

个人信息和人口统计信息。在服务中,我们可能会要求您向我们提供某些类别的信息,例如:(1(个人简介,这是一种识别您个人身份的信息,如您的名字和姓氏、电子邮件地址、邮寄地址以及包括信用卡号码在内的支付信息(">私人信息"(;和(2(人口统计信息,如您的性别、子女、职业、教育水平以及与您一起工作的年级信息(如果您是一名专业教育工作者,则为">统计信息(。我们可能会通过各种表格和在服务的各个地方收集这些信息,包括账户注册表格、联系我们表格、在订购产品时结账时,或在您与服务互动时。如果我们将非个人可识别的人口统计信息与我们在服务中直接从您那里收集的私人信息个人信息

短语="个人信息和人口统计信息">

信息:-

我想在这个文本文件中搜索上面的短语。在这个文本文件中,这些短语可能是相同的,或者有标点符号,或者在单词之间有小写或大写、标题或空白,或者没有空格或混乱的单词。

要求:-它返回以下短语或这些短语的位置的输出,或返回True或False。

个人信息和人口统计信息,个人人口学信息,个人信息,人口统计信息,人口统计信息,个人可识别的人口统计信息,个人信息,个人信息

您可以使用正则表达式:

with open('file.txt') as f:
text = f.read()
import re
matches = re.findall(r'((?: personal|demographic)[sw]*informationb)', text, flags=re.I)

输出:

['Demographic Information',
' Personal Demographicinformation',
'demographic information',
'Demographic Information',
'Demographic Information with the Personal Information',
' PERSONAL INFORMATION']

相关内容

  • 没有找到相关文章

最新更新