我们有一个客户要求使用Watson Visual识别的集合中搜索相似图像。文档提到每个集合可以包含100万张图像。因此,我有以下问题:
a(图像的最大尺寸是多少?
b(每个图像上传最多占1秒,标准计划每天的限制为25000张图像。那么,只能添加25K图像/天吗?
c(客户有大约200万张图像。我们如何更快地上传图像?
d(是否有单独的计划可用于批量卷?
此信息来自以下URL的视觉识别文档:https://www.ibm.com/watson/developercloud/doc/visual-recognition/customizing.html
大小限制
培训电话和数据存在尺寸限制:
- 该服务最多接受10,000张图像或100 MB文件。
- 该服务至少需要10张图像。
- 该服务最多接受每个培训电话256 MB。
- 图像的最低建议尺寸为32x32像素。
良好训练的指南锚链接
API未执行以下准则。但是,当培训数据遵守它们时,该服务往往会表现更好:
- 每个.zip文件中建议至少50张图像,因为少于50张图像可以降低训练有素的分类器的质量。
- 如果培训数据的质量和内容相同,则在更多图像上训练的分类器通常比在较少图像上训练的分类器更准确。培训分类器在更多图像高原上以大约5000张图像进行训练的好处,这可能需要一段时间才能进行处理。您可以在5000多个图像上训练分类器,但可能不会显着提高分类器的准确性。
- 每次上传每次150-200张图像。超过200张图像增加了时间,并且确实提高了准确性,但是随着时间的时间收益降低。
- 在每个示例文件中包括大约相同数量的图像。包括不平等的图像可能会导致训练有素的分类器的质量下降。
- 您的自定义分类器的准确性可能会受到您为训练它提供的图像的类型。提供与您计划分析的图像相似的示例图像。例如,如果您正在培训分类器"老虎",则分类器在手机拍摄的动物园中仅提供老虎的图像来训练分类器,但您想在老虎的图像上测试分类器,则可能不准确。在专业摄影师拍摄的野外。
高音量分类锚链接
的指南如果您想对许多图像进行分类,则一次提交一张图像可能需要很长时间。您可以通过以下方式最大化服务的效率和性能:
- 调整图像的大小不超过宽度或高度的320像素。图像不需要高分辨率。
- 以压缩(.zip(文件的批量提交图像。
- 仅在classifier_ids参数中指定您想要结果的分类器。如果您不指定此参数的值,则该服务将图像对默认分类器进行分类,并且需要更长的时间才能返回响应。
ravi,我看到您也发布了您的问题 - 请在此处查看我的答案:https://develover..ibm.com/answers/questions/questions/379227/similarity-search-api-search-api-Watson-Visual-Regnition/