我使用JupyterLab用space预处理了一组更大的文本文档。虽然总体上没有问题,但我注意到,当我使用不同的conda内核/虚拟环境时,速度差异很大。差异约为10倍。
两个环境都安装了相同版本的spaCy和NumPy;也使用相同的Python版本(3.9.15)。
numpy 1.23.4 py39h14f4228_0
spacy 3.3.1 py39h79cecc1_0
所以我不知道速度差异可能来自哪里。也许它来自spaCy需要的另一个包?
我还将笔记本转换为.py脚本并从控制台运行,但结果相同:在一个虚拟环境中,它运行速度大约慢了10倍。
环境缺少cupy
。安装后,spaCy在两个环境中显示相同的性能。