在多个数据集上训练Google-Cloud-Automl模型



我想使用多个数据集在gcp的顶点ai上训练一个自动模型。我想保持数据集分开,因为它们来自不同的来源,想要分别训练它们,等等。这可能吗?还是我需要创建一个包含这两个数据集的数据集?看起来我只能在web UI中选择一个数据集。

只要你的源在谷歌云存储中,就可以通过顶点AI API,只需提供JSON或CSV格式的训练数据列表,符合训练数据格式的最佳实践。

参见创建和导入数据集的代码。请参阅文档以获取代码参考和进一步的详细信息。

from typing import List, Union
from google.cloud import aiplatform
def create_and_import_dataset_image_sample(
project: str,
location: str,
display_name: str,
src_uris: Union[str, List[str]], // example: ["gs://bucket/file1.csv", "gs://bucket/file2.csv"]
sync: bool = True,
):
aiplatform.init(project=project, location=location)

ds = aiplatform.ImageDataset.create(
display_name=display_name,
gcs_source=src_uris,
import_schema_uri=aiplatform.schema.dataset.ioformat.image.single_label_classification,
sync=sync,
)

ds.wait()

print(ds.display_name)
print(ds.resource_name)
return ds

注:所提供的链接是为顶点AI自动图像。如果你访问链接,有其他AutoML产品的选项,如文本,表格和视频。

最新更新