我试图从一个文件中提取所有IP地址,其中IP地址都在随机位置,有时一行上有多个IP。这是一个文本文件,内容如下:
hello9.9.9.9 hdi3ohdoi3hoi3oid2 10.3.2.3 2.3.4.5
ddjeijfdeio
eifhoehjwiehfiowe
uiewhduihewiudhue
8.8.8.8, 20.20.20.20
de2hd9j39ud9829d8 192.168.10.24
我的代码只返回每行的第一个ip地址,
['9.9.9.9', '8.8.8.8', '192.168.10.24']
我的代码如下:
with open('C:/testfile.txt') as fh:
file = fh.readlines()
pattern = re.compile(r'(d{1,3}.d{1,3}.d{1,3}.d{1,3})')
lst = []
for line in file:
match = pattern.search(line)
if match is not None:
lst.append(match[0])
print(lst)
如何列出每条线路的所有IP?(不仅仅是第一个?(
使用pattern.findall()
查找所有发生的事件。否则,它会发现第一次出现。
import re
with open('testfile.txt') as fh:
file = fh.readlines()
pattern = re.compile(r'(d{1,3}.d{1,3}.d{1,3}.d{1,3})')
lst = []
for line in file:
match = pattern.findall(line)
if len(match) != 0:
lst.extend(match)
print(lst)
输出:
['9.9.9.9', '10.3.2.3', '2.3.4.5', '8.8.8.8','20.20.20.20','192.168.10.24']
您可以使用re.findall
:
import re
data = """
hello9.9.9.9 hdi3ohdoi3hoi3oid2 10.3.2.3 2.3.4.5
ddjeijfdeio
eifhoehjwiehfiowe
uiewhduihewiudhue
8.8.8.8, 20.20.20.20
de2hd9j39ud9829d8 192.168.10.24
"""
result = re.findall(r'd{1,3}.d{1,3}.d{1,3}.d{1,3}', data)
print(result)
结果:
['9.9.9.9', '10.3.2.3', '2.3.4.5', '8.8.8.8', '20.20.20.20', '192.168.10.24']
模式。search函数只搜索第一次出现的
所以我建议使用findall方法,而不是搜索方法,这样你的代码就可以看起来像:
with open('C:/testfile.txt') as fh:
file = fh.readlines()
pattern = re.compile(r'(d{1,3}.d{1,3}.d{1,3}.d{1,3})')
lst = []
for line in file:
match = re.findall(pattern,text)
#match = pattern.findall(line)#searching for first one
if match is not None:
for x in match:#iter and add
lst.append(x)
#or
#lst.extend(match)#adds a list to the list
print(lst)