我正在尝试使用JCuda中的cuModuleLoad()
从/src/main/resources
加载vectorAdd.ptx
文件。代码如下:
cuModuleLoad(module, getClass.getResource("vectorAdd.ptx").getPath())
但是cuModuleLoad()
没有接收到这个文件。只有当我通过ptx file
的绝对路径时,它才起作用。但我希望ptx file
与编译jar files
一起提供。有什么办法可以做到这一点吗?
JCuda中的cuModuleLoad
函数是CUDA中相应cuModuleLoad
函数的直接映射。它需要一个文件名作为第二个参数。
问题是:cuModuleLoad
无法加载PTX文件,因为CUDA根本不存在PTX文件!PTX文件隐藏在JAR文件中。
当您使用someClass.getResource()
从JAR文件中获取资源时,它将指向JAR文件中的资源。当你做类似的事情时
System.out.println(getClass().getResource("vectorAdd.ptx").getPath());
并运行它(作为JAR文件),然后您将看到这样的输出:
file:/U:/YourWorkspace/YourJarFile.jar!/vectorAdd.ptx
请注意.jar!
部分:此路径不是指向真实文件的路径,而是指向JAR中资源的路径。
为了从JAR加载PTX文件,您必须将JAR中的PTX文件读取到Java端的byte[]
数组中,然后将其传递给JCuda的cuModuleLoadData
函数(对应于CUDA的cuModuleLoadData
函数)。
下面是一个示例,它将JAR文件中的PTX数据加载到字节数组中,表示可以传递给cuModuleLoadData
:的以零结尾的字符串
import static jcuda.driver.JCudaDriver.cuCtxCreate;
import static jcuda.driver.JCudaDriver.cuDeviceGet;
import static jcuda.driver.JCudaDriver.cuInit;
import static jcuda.driver.JCudaDriver.cuModuleGetFunction;
import static jcuda.driver.JCudaDriver.cuModuleLoadData;
import static jcuda.runtime.JCuda.cudaDeviceReset;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import jcuda.driver.CUcontext;
import jcuda.driver.CUdevice;
import jcuda.driver.CUfunction;
import jcuda.driver.CUmodule;
import jcuda.driver.JCudaDriver;
public class JCudaPtxInJar
{
public static void main(String args[]) throws IOException
{
// Initialization
JCudaDriver.setExceptionsEnabled(true);
cuInit(0);
CUdevice device = new CUdevice();
cuDeviceGet(device, 0);
CUcontext context = new CUcontext();
cuCtxCreate(context, 0, device);
// Read the PTX data into a zero-terminated string byte array
byte ptxData[] = toZeroTerminatedStringByteArray(
JCudaPtxInJar.class.getResourceAsStream(
"JCudaVectorAddKernel.ptx"));
// Load the module data
CUmodule module = new CUmodule();
cuModuleLoadData(module, ptxData);
// Obtain a function pointer to the "add" function
// and print a simple test/debug message
CUfunction function = new CUfunction();
cuModuleGetFunction(function, module, "add");
System.out.println("Got function "+function);
cudaDeviceReset();
}
/**
* Read the contents of the given input stream, and return it
* as a byte array containing the ZERO-TERMINATED string data
* from the stream. The caller is responsible for closing the
* given stream.
*
* @param inputStream The input stream
* @return The ZERO-TERMINATED string byte array
* @throws IOException If an IO error occurs
*/
private static byte[] toZeroTerminatedStringByteArray(
InputStream inputStream) throws IOException
{
ByteArrayOutputStream baos = new ByteArrayOutputStream();
byte buffer[] = new byte[8192];
while (true)
{
int read = inputStream.read(buffer);
if (read == -1)
{
break;
}
baos.write(buffer, 0, read);
}
baos.write(0);
return baos.toByteArray();
}
}
编译它并将其打包到JAR中(当然还有/resources/JCudaVectorAddKernel.ptx
PTX文件)将允许您启动程序并从JAR中的PTX获得示例函数。