nv-nsight-cu-cli 导致 Tensorflow 失败



我已经下载了最新的Nsight Compute分析工具,我想用它来对Tensorflow应用程序进行基准测试。我正在使用的代码在这里。当我执行它时,它运行得很好,当我用nvprof ./mnist.py对其进行基准测试时,它根本没有问题。但是,当我尝试使用命令sudo ./nv-nsight-cu-cli [path to the file]运行它时,出现以下错误:

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

我怀疑nv-nsight-cu-cli不知何故根本没有识别环境变量。周围有什么修复吗?

您需要在两种环境中搜索差异:

  • 环境变量
  • LD_LIBRARY_PATH
  • /etc/ld.so.conf
  • /etc/ld.so.conf.d/*
  • 立方布拉斯
    • 安装是否完成/未损坏?
    • 它是否安装在两台计算机上的同一位置?
    • 版本

您可以从两台计算机上的locate libcublas.so开始,看看是否有区别。或者,您可以strace -f -e open程序以检查它尝试从何处libcublas.so

您的错误(目前(与GPU无关:libcublas.so.9.0找不到。找到它,找到为什么Tensorflow找不到它,你的问题就会得到解决。

目前该工具似乎不支持GP100。 答案在这里找到:

Nsight Compute 仅支持 Pascal(GP100 除外(和更高版本的 GPU。

相关内容

  • 没有找到相关文章

最新更新