我有一组加速度计数据记录,经过4种不同类型的事件(以及每种事件的多次重复)。每个点(记录)由 3 个向量 (X,Y,Z) 定义,每个向量 150,000 个样本(5 秒,采样率为 30KHz)。总而言之,我有很多 3x150,000 个矩阵。
我想使用 python 对这些点使用分类器或聚类,以查看在不同类型的事件之后加速度计的行为是否存在差异。
- 使用的最佳分类器是什么?
- 我应该如何构建数据?
- 如何绘制此图以可视化我的数据?
非常感谢任何帮助者。
为您提供有关在数据存储方面应该做什么的确切指示。我想你已经想通了?如果不是,这一切都取决于各种参数,例如读/写访问的频率,数据的大小和其他因素,例如您的DAQ系统。就此而言,我认为这已经解决了,并且数据已经以某种方式记录和存储。这可以是csv
文件、数据库或自定义文件格式。只要你能读懂,其实并不重要。
使用熊猫来构建数据。它是numpy
的包装器,被描述为:
对于绘图,pandas 是一个开源的、BSD 许可的库,为 Python 编程语言提供高性能、易于使用的数据结构和数据分析工具。
由于您似乎正在进行统计分析,因此请使用matplotlib进行基本绘图,或使用seaborn进行聚类和统计分析等。来自Seaborn网站:
Seaborn是一个基于matplotlib的Python可视化库。它提供了一个高级界面,用于绘制有吸引力的统计图形。
看看Seaborn画廊,了解可能的情节。它很好地概述了库可能出现的图表以及该绘图所需的源代码。