NumPy/Scikit在Ubuntu上,更好地从预编译的源代码构建(例如Anaconda)



不同的文档提供了矛盾的信息,无论是使用pip安装NumPy更好(根据我的经验,Ubuntu上的pip install numpy总是从源代码构建NumPy),还是使用编译的发行版,例如Anaconda2

SciPy.org网站-在Linux上从源代码构建声明:

(…)如果您想使用对NumPy和SciPy所做的最后改进在Linux上,您必须从源代码构建它。

而Scikit-learn.org-安装Scikit学习解释:

我们不建议在linux上使用pip安装scipy或numpy,因为这将涉及一个具有许多依赖关系的漫长构建过程。如果不仔细配置,自己构建numpy可能会导致安装速度比应该的慢得多。

Ubuntu 14.04上运行时,哪种方式对处理大数据和进行机器学习的程序的性能更好?

Paper Lund等人的《用小于100的SLOC将Python/NumPy的性能提高一倍》描述了代码和gcc/内核环境的微小变化如何显著提高NumPy性能。因此,我想用以下结论来结束这个问题:

  • 尽可能使用NumPy/Scipy库的编译发行版
  • 如果您没有其他选择,或者您想自定义构建参数,因为您知道自己在做什么,请编译NumPy/Scipy

欢迎讨论这个问题,这样我就可以更改我的答案

最新更新