GCP数据存储与搜索API性能基准



是否有任何关于GCP数据存储查询和搜索查询性能的现有基准测试?

我感兴趣的是性能如何随着数据的增长而变化。例如,如果我们有:

class Project:
members = ndb.StringProperty(repeated=True)

我们在搜索中有文档,如:

SearchDocument([AtomField(name=member, value='value...'), ...])

我想运行一个搜索来获取用户所属的所有项目ID。类似于:

ndb.query(keys_only=True).filter(Project.members == 'This Member')

数据存储中的查询和搜索中的类似查询。

当有10100。。。16*6个对象?

我很感兴趣的是,对于这种简单的查询,我们所期望的延迟是否有一些经验法则。当然,我可以去尝试一下,但如果有人做过类似的基准测试,我想事先对我所期望的性能有一些直观的了解。此外,我希望避免花费美元和时间写/读我以后需要删除的数据,所以如果有人能分享他们的经验,我将不胜感激!

p.s.我使用Python,但假设所有支持GCP的语言的答案都是相同/相似的。

直到现在,Api Search只支持Python 2,不幸的是,这个版本的Python不再支持,所以你应该考虑到你将无法获得对这个服务的支持。

另一方面,看看这个线程中提供的代码,它可以让您了解如何使用python 3对数据存储执行基准测试。

最新更新