我已经下载了最新的Nsight Compute分析工具,我想用它来对Tensorflow应用程序进行基准测试。我正在使用的代码在这里。当我执行它时,它运行得很好,当我用nvprof ./mnist.py
对其进行基准测试时,它根本没有问题。但是,当我尝试使用命令sudo ./nv-nsight-cu-cli [path to the file]
运行它时,出现以下错误:
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
我怀疑nv-nsight-cu-cli
不知何故根本没有识别环境变量。周围有什么修复吗?
您需要在两种环境中搜索差异:
- 环境变量
LD_LIBRARY_PATH
/etc/ld.so.conf
/etc/ld.so.conf.d/*
- 立方布拉斯
- 安装是否完成/未损坏?
- 它是否安装在两台计算机上的同一位置?
- 版本
- 。
您可以从两台计算机上的locate libcublas.so
开始,看看是否有区别。或者,您可以strace -f -e open
程序以检查它尝试从何处libcublas.so
。
您的错误(目前(与GPU无关:libcublas.so.9.0
找不到。找到它,找到为什么Tensorflow找不到它,你的问题就会得到解决。
目前该工具似乎不支持GP100。 答案在这里找到:
Nsight Compute 仅支持 Pascal(GP100 除外(和更高版本的 GPU。