在 gcloud ml 引擎上训练张量流时出错



我正在遵循此 ml 引擎指南。我确实设置了我的gcloud并创建了vmtensorflow,我正在使用Anaconda 3来创建我的python环境。我用python=3.6创造了新的环境。但是当我开火时

gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatordataadult.data.csv --eval-files c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatordataadult.test.csv --train-steps 1000 --job-dir c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatoroutput --eval-steps 100

我收到以下错误

Traceback (most recent call last):
File "D:gcsdk174google-cloud-sdkplatformbundledpythonlibrunpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:gcsdk174google-cloud-sdkplatformbundledpythonlibrunpy.py", line 72, in _run_code
exec code in run_globals
File "C:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatortrainertask.py", line 4, in <module>
import model
File "trainermodel.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow

我可以根据指南使用pip install -r ../requirements.txt命令成功安装张量流。

谁能指出,我做错了什么?

更新:此问题现在应该使用最新版本的 gcloud 修复。你能试一试,看看它是否适合你吗?首先要做:
gcloud components update

发生的事情是 gcloud (静默地)需要 py2.7,这导致了您的导入错误。 这是一个我们将很快修复的错误。 (这对于Windows来说尤其成问题,因为TF不支持Windows的2.7安装)。修复后,我们将在此处更新。

与此同时,最好的选择可能是通过直接运行 python 脚本在本地进行测试(除非您尝试在本地测试分布式训练)。

如果你试图在本地测试分布式训练,那么你最好的临时选择可能是使用 Docker 和 TensorFlow docker 容器。

最新更新