我已经有了dct和idct的实现,然而,尽管进行了适当的优化,但随着矩阵大小的增加,它们变得非常缓慢。有人知道两者都有更快的实现吗?或者知道任何一个Java库为二维案例提供更快的实现。感谢
public final double[][] initCoefficients(double[][] c)
{
final int N = c.length;
final double value = 1/Math.sqrt(2.0);
for (int i=1; i<N; i++)
{
for (int j=1; j<N; j++)
{
c[i][j]=1;
}
}
for (int i=0; i<N; i++)
{
c[i][0] = value;
c[0][i] = value;
}
c[0][0] = 0.5;
return c;
}
/* Computes the discrete cosine transform
*/
public final double[][] forwardDCT(double[][] input)
{
final int N = input.length;
final double mathPI = Math.PI;
final int halfN = N/2;
final double doubN = 2.0*N;
double[][] c = new double[N][N];
c = initCoefficients(c);
double[][] output = new double[N][N];
for (int u=0; u<N; u++)
{
double temp_u = u*mathPI;
for (int v=0; v<N; v++)
{
double temp_v = v*mathPI;
double sum = 0.0;
for (int x=0; x<N; x++)
{
int temp_x = 2*x+1;
for (int y=0; y<N; y++)
{
sum += input[x][y] * Math.cos((temp_x/doubN)*temp_u) * Math.cos(((2*y+1)/doubN)*temp_v);
}
}
sum *= c[u][v]/ halfN;
output[u][v] = sum;
}
}
return output;
}
/*
* Computes the inverse discrete cosine transform
*/
public final double[][] inverseDCT(double[][] input)
{
final int N = input.length;
final double mathPI = Math.PI;
final int halfN = N/2;
final double doubN = 2.0*N;
double[][] c = new double[N][N];
c = initCoefficients(c);
double[][] output = new double[N][N];
for (int x=0; x<N; x++)
{
int temp_x = 2*x+1;
for (int y=0; y<N; y++)
{
int temp_y = 2*y+1;
double sum = 0.0;
for (int u=0; u<N; u++)
{
double temp_u = u*mathPI;
for (int v=0; v<N; v++)
{
sum += c[u][v] * input[u][v] * Math.cos((temp_x/doubN)*temp_u) * Math.cos((temp_y/doubN)*v*mathPI);
}
}
sum /= halfN;
output[x][y] = sum;
}
}
return output;
}
现在它是一个O(n4)算法,四个嵌套循环都在进行n
迭代。可分离性将其降为O(n3)(或者如果你有足够的勇气尝试快速余弦变换,则为O(n2logn))。实际上,它甚至比使用2D公式更简单,因为它只是这样:
- 对所有行运行1D DCT
- 对(上一个结果的)所有列运行1D DCT
或者(可选),使两个部分完全相同:
- 对所有行运行1D DCT,保存转置后的结果
- 再做一次
转置意味着它第二次真正执行列,并且在两个转置中相互撤消。
所以,余弦。你注意到
预计算余弦似乎很困难,因为am计算内部(循环)局部变量的余弦
这些余弦实际上只是以公式形式写下的常数,这个数组只依赖于n
。例如,看看FFmpeg是如何在dctref.c 中实现的
您有DCT的最大大小吗?如果使用整数是可以的(图像处理通常是这样),您可以在那里找到一些大小为4、8、16和32的快速实现:https://github.com/flanglet/kanzi/tree/master/java/src/kanzi/transform