不同的文档提供了矛盾的信息,无论是使用pip安装NumPy更好(根据我的经验,Ubuntu上的pip install numpy
总是从源代码构建NumPy),还是使用编译的发行版,例如Anaconda2
。
SciPy.org网站-在Linux上从源代码构建声明:
(…)如果您想使用对NumPy和SciPy所做的最后改进在Linux上,您必须从源代码构建它。
而Scikit-learn.org-安装Scikit学习解释:
我们不建议在linux上使用pip安装scipy或numpy,因为这将涉及一个具有许多依赖关系的漫长构建过程。如果不仔细配置,自己构建numpy可能会导致安装速度比应该的慢得多。
在Ubuntu 14.04
上运行时,哪种方式对处理大数据和进行机器学习的程序的性能更好?
Paper Lund等人的《用小于100的SLOC将Python/NumPy的性能提高一倍》描述了代码和gcc/内核环境的微小变化如何显著提高NumPy性能。因此,我想用以下结论来结束这个问题:
- 尽可能使用NumPy/Scipy库的编译发行版
- 如果您没有其他选择,或者您想自定义构建参数,因为您知道自己在做什么,请编译NumPy/Scipy
欢迎讨论这个问题,这样我就可以更改我的答案