为以下生物信息学需求提供最合适的Python开发环境建议



我需要用Python实现一个项目,该项目通过FFT,互相关,3D谐波和SVM(机器学习)工具处理冷冻EM电子密度扫描(MAP格式)中的氨基酸检测。

有几十个可用的 Python 包,我没有找到足够全面的比较表。为了避免尝试现有的每个函数,请告诉我谁曾经应用过这样的函数,让我使用最合适的包来专注于算法问题,而不是重新发明经典函数的轮子。

我将从安装"SciPy Stack"开始,其核心软件包包括(除其他外):

  • NumPy,数值计算的基本软件包。它定义了数值数组和矩阵类型以及对它们的基本操作。
  • SciPy 库是数值算法和特定领域工具箱的集合,包括信号处理(包括 FFT)、优化、统计等等。
  • Matplotlib,一个成熟且流行的绘图包,提供出版质量的 2D 绘图以及基本的 3D 绘图
  • Pandas,提供高性能、易于使用的数据结构。

许多其他软件包都基于这些核心软件包构建:

  • 由于您正在使用生物数据,我还建议您安装BioPython
  • 要使用 SVM 并进行机器学习,请安装 scikit-learn
  • 我从未使用过它,但专门用于处理冷冻电镜电子密度扫描,存在 TEMPy:

一个面向对象的 Python 库,旨在帮助用户 分析大分子组装体的结构,特别是在 3D电子显微镜密度图的背景。

另请参阅此相关问题。