我正在开发一个程序来解析一个文件(365000行),我在阅读每一行后尝试匹配一些关键字。此计算以及我的QProgressBar
更新是使用 QThread
在另一个线程中进行的。除了性能之外,一切都很好,尤其是当我更新QProgressBar
时。我使用计时器进行解析,结果令人惊叹。当我发出信号以更新QProgressBar
时,程序大约需要 45 秒,但是当我不发出QProgressBar
更新的信号时,程序大约需要 0.40 秒 =/
from PyQt5 import QtCore, QtWidgets, QtGui
import sys
import time
liste = ["failed", "exception"]
class ParseFileAsync(QtCore.QThread):
match = QtCore.pyqtSignal(str)
PBupdate = QtCore.pyqtSignal(int)
PBMax = QtCore.pyqtSignal(int)
def run(self):
cpt = 0
with open("test.txt", "r") as fichier:
fileLines = fichier.readlines()
lineNumber = len(fileLines)
self.PBMax.emit(lineNumber)
t0 = time.time()
for line in fileLines:
cpt+=1
self.PBupdate.emit(cpt)
for element in liste:
if element in line:
self.match.emit(line)
finalTime = time.time() - t0
print("over :", finalTime)
class Ui_MainWindow(QtWidgets.QMainWindow):
def __init__(self):
super().__init__()
self.setupUi(self)
self.thread = ParseFileAsync()
self.thread.match.connect(self.printError)
self.thread.PBupdate.connect(self.updateProgressBar)
self.thread.PBMax.connect(self.setMaximumProgressBar)
self.pushButton_GO.clicked.connect(self.startThread)
def printError(self, line):
self.textEdit.append(line)
def updateProgressBar(self, value):
self.progressBar.setValue(value)
def setMaximumProgressBar(self, value):
self.progressBar.setMaximum(value)
def startThread(self):
self.thread.start()
控制台输出:
over : 44.49321101765038 //QProgressBar updated
over : 0.3695987798147516 //QProgressBar not updated
我错过了什么还是意料之中?
编辑:
我遵循了jpo38和Matteo非常好的建议。我更新QProgressBar的频率较低。进展仍然很顺利,性能非常好(这个实现大约一秒钟)。公安局 :
class ParseFileAsync(QtCore.QThread):
match = QtCore.pyqtSignal(str)
PBupdate = QtCore.pyqtSignal(int)
PBMax = QtCore.pyqtSignal(int)
def run(self):
with open("test_long.log", "r") as fichier:
fileLines = fichier.readlines()
self.lineNumber = len(fileLines)
self.PBMax.emit(self.lineNumber)
if (self.lineNumber < 30):
self.parseFile(fileLines, False)
else:
self.parseFile(fileLines, True)
def parseFile(self, fileLines, isBig):
cpt = 0
if(isBig):
for line in fileLines:
cpt+=1
if(cpt % (int(self.lineNumber/30)) == 0):
self.PBupdate.emit(cpt)
for element in liste:
if element in line:
self.match.emit(line)
self.PBupdate.emit(self.lineNumber) #To avoid QProgressBar stopping at 99%
else:
for line in fileLines:
cpt+=1
self.PBupdate.emit(cpt)
for element in liste:
if element in line:
self.match.emit(line)
过于频繁地更新QProgressBar
肯定会导致性能问题。您应该减少更新进度条的频率。您不希望/不需要每次迭代都这样做......365000次。当您从 365000 中读取一行时,您进步了 0.0002%,无需为此更新 GUI...
向用户显示进度总是有代价的......我们接受这一点,因为用户更喜欢多等一会儿并获得进度信息。 但是,显示进度不得像您经历的那样将处理时间乘以 100。
您可以发出信号以仅在进度发生重大变化时才更新进度条(例如,每次转换为int
的百分比值发生变化时,您可以将进度存储为int
值以检查...或测试是否(line%(fileLines/100)==0)
例如...这将显着降低进度条更新的成本)。
或者,您可以启动一个QTimer
,例如每 100 毫秒更新一次进度条。然后,您不会从for
循环发出任何信号,而只需保存计时器超时时要使用的进度值。
如果文件大小始终为 365000 行,您还可以决定每 1000 行发出一次信号,例如 ( if line%1000==0
)。但是较早的两个解决方案更可取,因为无论文件大小如何,它们都可以解决您的性能问题。
这是一个经典的问题,我认识的每个有经验的开发人员都有一个关于一个据称漫长的过程的故事,其中大部分时间实际上是由进度条更新占用的(这些故事中的大多数最终都完全删除了进度条)。
关键是,很多时候,你处理的"工作单元"(在你的例子中是一行的解析)比进度条更新的成本要小得多 - GUI与用户的反应相比速度很快,但与解析单行相比仍然相当重量级(特别是如果涉及跨线程机制)。
根据我的经验,有三种常见的解决方案:
- 如果你注意到你的进程总体上是"快速"的,你只需放下进度条(或者用那些无用的"前进和后退"进度条替换它,只是为了表明你的程序没有挂起,如果程序有时被输入的文件比平时大得多);
- 你只是更新它的频率较低; 您可以每总进度的 1/100 发出一次信号; 推进仍然很顺利,你应该不会有性能问题(100 次更新不会花费太多时间,尽管我想如果通常需要 0.40 秒,它们仍然会主导您的进程所花费的时间);
- 您可以将进度条更新与实际执行这些操作的代码完全分离。不要发出信号,而是用当前进度更新整数类成员(这应该很便宜);在 GUI 线程中使用计时器根据此成员每 - 比如 - 0.5 秒更新进度条。您甚至可以更聪明,如果该过程在第一个计时器滴答声之前完成,则避免完全显示进度条。