遍历文件中的"lines",其中行分隔符为 NUL



我有一个文件/my/f,我打开为:

with open('/my/f') as data_file:
    for line in data_file:
        print(line)

我不想一次读取整个文件,我希望文件行的隐式迭代器考虑ASCII的NUL (0x00, $''等)作为行分隔符。

在建议的重复中,另一种方法是简单地将File对象的迭代器子类化,而不是迭代NUL。

class NulFile(file):
  buf=''
  bufsize=1024
  def __iter__(self):
    return self
  def next(self):
    while True:
      n = self.buf.find('')
      if n == -1:
        s = self.read(self.bufsize)
        if len(self.buf) == 0 and len(s) == 0:
          raise StopIteration
        elif len(s) == 0:
          break
        self.buf += s
      else:
        res = self.buf[:n]
        self.buf = self.buf[n+1:]
        return res
    res = self.buf
    self.buf = ''
    return res

但是,不是使用open(..)打开文件,而是使用NulFile(..)

最新更新