为什么 clojure 中的 java 原生 HashMap 运行缓慢



我将一个键关联到哈希映射 10000000 次。下面是 Java 代码和输出:

import java.util.HashMap;
public class TestMap {
    public static void main(String[] args) {
        HashMap<Integer, Integer> mp = new HashMap<Integer, Integer>();
        long  start = System.currentTimeMillis();
        for (int i = 0; i < 10000000; i++) {
            mp.put(1, 1);
        }
        long end = System.currentTimeMillis();
        System.out.println("Elapsed time: " + (end - start) + " msecs");
    }
}

$ javac TestMap.java && java -cp . TestMap
Elapsed time: 38 msecs

然后我在 REPL 中从 clojure 调用 java:

user=> (import java.util.HashMap)
java.util.HashMap
user=> (def mp (HashMap.))
#'user/mp
user=>  (time (dotimes [n 10000000] (.put mp 1 1)))
"Elapsed time: 10024.797 msecs"
nil

两个代码都做同样的事情,但 clojure 版本运行得非常慢!!

怎么了?

添加类型提示更好:

user> (import 'java.util.HashMap)
java.util.HashMap
user> (def mp (HashMap.))
#'user/mp
user> (time (dotimes [n 10000000] (.put mp 1 1)))
"Elapsed time: 13932.248126 msecs"
nil
user> (time (dotimes [n 10000000] (.put ^HashMap mp 1 1)))
"Elapsed time: 117.915992 msecs"
nil

出现此类性能问题的第一步是打开反射警告并删除任何警告。

 (set! *warn-on-reflection* true)

此外,循环和重复的开销最低。

您还可以通过在声明中声明 HashMap 大小来提高 Java 代码速度

HashMap<Integer, Integer> mp = new HashMap<Integer, Integer>(10000000);

我想这也是 REPL 的一种方式(我不知道),是否可以保留内存空间?

最新更新