iPhone GPU上的大型矩阵乘法



我设计了一个用于iPad游戏的学习AI,但它的原型是用matlab编写的。我需要执行几个操作,例如:(大写表示矩阵)

A = B > c;
A = B * C;
A = B' * C;
A = B .* C;
A = B - C;

我的一些矩阵很大(2601x100)。在GPU上运行这些操作可以显著提高此操作的性能。有没有比Accelerate的BLAS更合适的线性代数库?BLAS最多只支持4x4矩阵。

我们在使用(开源)Eigen库的前一个项目中取得了相当好的结果。

  • 这是一个仅包含头文件的C++模板库,但这没有问题,因为您可以用纯C或Objective-C++(.mm)编写接口
  • 其代码针对armv7进行了大量优化
  • LGPL3授权模式应该是在不干扰苹果TOS的情况下在应用商店发布应用程序的一个不错的选择

相关内容

  • 没有找到相关文章

最新更新