我有大约28GB的Data-In,存储在Windows Azure表存储中,超过1350万行。
6列,除1个十进制和1个日期时间外均为整型。分区键长度约为10个字符。
这是为了我的健康检查——这看起来是正确的吗?
我迁移数据的Sql数据库有更多的数据,只有4.9GB。
有没有办法缩小尺寸?我不认为重命名属性会对这个产生很大的影响。
*注意,这只是一个抽样数据,以估计长期成本。
嗯…有些事情似乎不对劲。
- 每个属性都是一个键/值对,所以在计算中包括属性名称。
- 数据本身可能在75-100字节左右,包括属性名,平均每个10个字符。这4个int等于16字节,十进制(double?)等于8字节,时间戳等于8字节。因此,让我们将每个实体四舍五入到100字节。
- 在1400万个实体中,你将有100* 1350万个,或约1.35 GB。
你的数字是大约。大一个数量级(每个实体大约2000字节)。即使考虑到序列化带来的大容量,我也不明白您是如何获得如此大的大小的。只是好奇:您是如何计算当前表大小的?和…您是否进行了多次测试,导致以前运行的数据更多?您是只测量表大小,还是存储帐户中使用的总存储空间?如果是后者,则可能有其他表(如diagnostics)也在消耗空间。
重命名持久化实体中的属性应该会对大小产生一些影响。不幸的是,这只适用于将来保存的数据。现有数据不会因为重命名属性