Hadoop 映射输出类型以提高性能



我有一堆字段要由映射器写出大约 10 个字段。哪种方式会更快1. 按如下方式写出字段

    tradeDate.readFields(in);
    marketMakerId.readFields(in);
    eventTime.readFields(in);
    bidPrice.readFields(in);
    ......................... 

或 2. 将它们转换为单个文本字段(交易日期,市场ID,偶数时间,买入价...),并在化简器上构造回对象。

哪种方式可以提供更好的性能?

像往常一样,基准测试可能会有所帮助。您可以使用卡尺来检查假设。

但一般来说,当涉及文本<>二进制转换时,二进制格式更快。因此,我认为二进制读/写字段将更快地工作。

最新更新