我正在遵循此 ml 引擎指南。我确实设置了我的gcloud
并创建了vm
。tensorflow
,我正在使用Anaconda 3来创建我的python环境。我用python=3.6
创造了新的环境。但是当我开火时
gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatordataadult.data.csv --eval-files c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatordataadult.test.csv --train-steps 1000 --job-dir c:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatoroutput --eval-steps 100
我收到以下错误
Traceback (most recent call last):
File "D:gcsdk174google-cloud-sdkplatformbundledpythonlibrunpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:gcsdk174google-cloud-sdkplatformbundledpythonlibrunpy.py", line 72, in _run_code
exec code in run_globals
File "C:Anaconda3mytensorflowcodecloudml-samples-mastercensusestimatortrainertask.py", line 4, in <module>
import model
File "trainermodel.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow
我可以根据指南使用pip install -r ../requirements.txt
命令成功安装张量流。
谁能指出,我做错了什么?
更新:此问题现在应该使用最新版本的 gcloud 修复。你能试一试,看看它是否适合你吗?首先要做:
gcloud components update
发生的事情是 gcloud (静默地)需要 py2.7,这导致了您的导入错误。 这是一个我们将很快修复的错误。 (这对于Windows来说尤其成问题,因为TF不支持Windows的2.7安装)。修复后,我们将在此处更新。
与此同时,最好的选择可能是通过直接运行 python 脚本在本地进行测试(除非您尝试在本地测试分布式训练)。
如果你试图在本地测试分布式训练,那么你最好的临时选择可能是使用 Docker 和 TensorFlow docker 容器。