我正在尝试在 MATLAB 中创建 sin 和 cos 的快速近似值,这是我程序中当前的瓶颈。有没有比内置例程更快的方法?
瓶颈:在每次迭代中,从复杂的稀疏矩阵 A (50,000 x 50,000( 和 col 向量 b 和 c (50,000 x 1( 获得角度,然后找到
S=[sin(ang(diag(A)+b-c) cos(ang(diag(A)+b-c)];
sin和cos的所有输入都接近+pi/2或-pi/2。
我尝试了一个查找表(如在C++中创建正弦查找表中所建议的(,以及一个简单的泰勒级数,但两者都较慢:
查找表:
appr=[round(1:.001:2,3);sin(1:.001:2);cos(1:.001:2)];
ang=round(angle(diag(A))+b-c);
loc=ang;
for cntr=1:length(ang)
loc(cntr)=find(appr(1,:)==abs(ang(cntr)),1);
end
S=[appr(loc,2).*sign(ang) appr(loc,3)];
泰勒级数(使 ang=pi/2 接近零所需的象限旋转(
ang=angle(diag(A))+b-c;
[ang,ind]=min(abs([ang+pi/2; ang-pi/2])); conv=[1 -1];
S=[(ang-0.1667*ang.^3).*conv(ind)), (1-0.5*ang.^2+0.041666*ang.^4).*conv(ind))];
MATLAB 2016a、Windows 8.1、i7-4500U@1.86GHz 的平均时间:内置正弦/余弦:1.5 秒 |查找表:1.8 秒 |泰勒系列:1.7秒
尝试优化sin((和cos(((已经优化到剑柄(不会给你带来太多好处。无论如何,在您的表达中:
S = [sin(angle(diag(A) + b - c)), cos(angle(diag(A) + b - c))];
其他操作将占用与罪恶和COS相当的时间。是否通过将表达式拆分为其组成部分来运行探查器?这应该让你了解 sin(( 和 cos(( 的相对成本是多少。
例如:
A = pi*rand(10^7,1);
B = pi*rand(10^7,1);
C = A + i*B; % i is sqrt(-1)
tic;
S = sin(A);
toc;
运行时间为 0.129710 秒。
tic;
S = sin(angle(C) + B - C);
toc;
运行时间为 0.757102 秒。
时间实际上由矩阵在内存中移出和移出内存所支配。
根据代码的确切性质,GPU 工具箱可能是一个选项。