我是Google Cloud Platform的新手。从数据科学方面来看,我对它的使用是多么不直观感到惊讶。我是一个经验丰富的本地GPU上的Tensorflow用户,但是在GCP上运行模型似乎是一项不可能完成的任务。
当 Tensorflow 模型部署到 GCP 上的生产环境时,代码驻留在哪里,或者模型存储在哪里?
大多数演示只是专注于将第一个结果呈现在屏幕上,而没有真正展示事情是如何工作的。
以下是我在Google的机器学习引擎上运行TensorFlow的过程:
- 将训练数据上传到云存储桶。
- 为 TensorFlow 应用程序创建一个正式的包,包括 setup.py。
- 使用标识本地包、包含训练数据的存储桶以及应保存训练结果的存储桶的标志执行
gcloud ml-engine jobs submit training
。 - 使用标志执行
gcloud ml-engine jobs submit prediction
,这些标志标识包含训练结果的存储桶和应包含预测结果的存储桶。
我更喜欢先在本地执行gcloud ml-engine
命令,以便我可以处理任何错误。我从未将Datalab与ML引擎一起使用过。