通过迭代优化哈希图



我有一个包含 300K 条记录的ResultSet,我正在执行以下操作来迭代它(以及收集后的其他操作)。此过程大约需要 2 分钟才能完成。有什么方法可以优化它吗?

Map<String,Map<String,String>> internalMap  = new HashMap<String,Map<String,String>>(); 
while (resultSet.next()) {
    final Integer val1 = resultSet.getInt("val1");
    final String val2 = resultSet.getString("val2");
    final String val3 = resultSet.getString("val3");
    final String val4 = resultSet.getString("val4");
    final String type = resultSet.getString("type");
    final String id = resultSet.getString("id");
    addIntern(internalMap,val2,val1,val3,val4,type,id);
}

以及上面提到的addIntern方法

private static void addIntern(Map<String,Map<String,String>> internalMap, String val2, Integer val1,
    String val3,String val4,String type,String id) {
    String key = id+"##"+val4;
    if (internalMap.get(key) == null) {
        internalMap.put(key, new HashMap<String,String>());
    }
    internalMap.get(key).put("val3", val3);
    internalMap.get(key).put("val2", val2);

    if("create".equals(type)){
        internalMap.get(key).put("create", val1.toString());
    }
    if("update".equals(type)){
        internalMap.get(key).put("update", val1.toString());
    }
    if("delete".equals(type)){
        internalMap.get(key).put("delete", val1.toString());
    }
}

调整resultSet的抓取大小;

resultSet.setFetchSize(100);

你当然可以简化你的添加方法(每个get都是一个O(1)调用,但它们加起来),比如

private static void addIntern(Map<String, Map<String, String>> internalMap, String val2, Integer val1, String val3,
        String val4, String type, String id) {
    String key = id + "##" + val4;
    Map<String, String> kMap;
    if (internalMap.containsKey(key)) {
        kMap = internalMap.get(key);
    } else {
        kMap = new HashMap<>();
        internalMap.put(key, kMap);
    }
    kMap.put("val3", val3);
    kMap.put("val2", val2);
    if ("create".equals(type) || "update".equals(type) || "delete".equals(type)) {
        kMap.put(type, val1.toString());
    }
}

由于无法减少迭代次数,因此无法进行太多优化。

但是我可以看到可以完成的一项更改

 if("create".equals(type)){
    internalMap.get(key).put("create", val1.toString());
 }
 if("update".equals(type)){
    internalMap.get(key).put("update", val1.toString());
 }
 if("delete".equals(type)){
    internalMap.get(key).put("delete", val1.toString());
 }

上面也可以写成下面

internalMap.get(key).put(type, val1.toString());

如果检查,这将删除 300k 或更多。

这在type只能包含create/update/delete值的情况下有效。如果它有更多,您可以放置一个if来检查它是否等于 3 中的任何一个。

试试这个。(爪哇 8)

private static void addIntern(Map<String,Map<String,String>> internalMap,
    String val2, Integer val1,
    String val3,String val4,String type,String id) {
    String key = id+"##"+val4;
    Map<String, String> valueMap = internalMap.computeIfAbsent(key, k -> new HashMap<>());
    valueMap.put("val3", val3);
    valueMap.put("val2", val2);
    if("create".equals(type) || "update".equals(type) || "delete".equals(type))
        valueMap.put(type, val1.toString());
}

如果有足够的可用堆空间,则设置映射初始容量可能会有所帮助:

Map<String,Map<String,String>> internalMap  = new HashMap<String,Map<String,String>>(300000*2); 

通过使用默认的初始容量,internalMap 必须多次重新散列,因为您要添加 300000 个项目。

最新更新