Gensim:正在使用gensim.models.doc2vec的慢速版本



我的设置如下:

蟒蛇版本:3.6.0

数字版本:1.13.0

西皮版本:0.19.0

Gensim版本:2.1.0

GCC 编译器版本:5.3.0

系统: 视窗 7, 64 位

我在上面的设置中收到以下错误

import gensim
>>>Slow version of gensim.models.doc2vec is being used

这使得在 gensim 上训练模型时的运行时间太慢。我觉得我正在使用的软件包版本或安装方式存在一些问题,因为:我不得不使用pip安装 numpy ;我不得不使用conda安装 scipy;我不得不再次使用pip安装 gensim。进行此设置的原因是因为如果我尝试使用pip安装 scipy,则会出现错误

>>>ImportError: DLL load failed: The specified procedure could not be found.

所以我不得不通过conda安装scipy。另外,如果我尝试使用

conda install gensim

conda update gensim

它只安装版本 1 - 我试过conda install -c anaconda gensim=2.1.0但收到错误

PackageNotFoundError: Package missing in current win-64 channels:
- gensim 2.1.0*

当我将它们导入脚本时,Numpy 和 Scipy 可以独立工作 - 也就是说,它们导入正常,我可以使用它们的所有功能。但是,当Gensim使用它们时,显然存在问题,我不知道为什么。

有人能够建议可能的修复方法吗?理想情况下,如果可能的话,我想保留这些软件包的所有最新版本。提前谢谢你

注意:当我安装了 Gensim 版本 1 并且与上述依赖项的相同版本一起使用时,Gensim 在"快速"版本上运行良好!

我也遇到了这个问题(我正在运行 ubuntu)。 我发现如果我直接使用 github 中的版本,问题就解决了。

所以有 2 种解决方案:(首先使用pip uninstall gensim卸载 gensim )

从Gensim
  • 的GitHub页面下载并解压缩Gensim zip文件,然后CD到zip内容的文件夹并运行命令python setup.py install
  • pip install git+https://github.com/RaRe-Technologies/gensim@master#egg=gensim运行此命令

我使用了第二个,现在我没有得到警告

问题与某些底层包不是最新的有关。在这里,我找到了对我有用的答案,简而言之:

卸载Gensim

sudo pip3 uninstall gensim

安装 python3-dev build-essential

sudo apt-get install python3-dev build-essential  

重新安装Gensim

sudo pip3 install --upgrade gensim

笔记:

上面的说明适用于使用 pip 和 apt-get 来管理包
的系统 pip3 是 pip 的 python3 版本

最新更新