我正在Yarn上运行一个spark流应用程序,它运行了好几天,之后我遇到了一个问题,来自Yarn列表的错误消息如下:
Application application_1449727361299_0049 failed 2 times due to AM Container for appattempt_1449727361299_0049_000002 exited with exitCode: -104
For more detailed output, check application tracking page:https://sccsparkdev03:26001/cluster/app/application_1449727361299_0049Then, click on links to logs of each attempt.
Diagnostics: Container [pid=25317,containerID=container_1449727361299_0049_02_000001] is running beyond physical memory limits. Current usage: 3.5 GB of 3.5 GB physical memory used; 5.3 GB of 8.8 GB virtual memory used. Killing container.
这是我的内存配置:
spark.driver.memory = 3g
spark.executor.memory = 3g
mapred.child.java.opts -Xms1024M -Xmx3584M
mapreduce.map.java.opts -Xmx2048M
mapreduce.map.memory.mb 4096
mapreduce.reduce.java.opts -Xmx3276M
mapreduce.reduce.memory.mb 4096
这个OOM错误很奇怪,因为它是一个流媒体程序,我没有在内存中维护任何数据,有人遇到过类似的问题吗?或者谁知道是什么原因造成的?
检查运行它的box/vm实例上的mem。我猜主机是红色的。
似乎是由于内存分配过多。
你认为流媒体在哪里执行?不管你是否在那里储存了什么?是的。记忆力也不是猫或跳舞的维京人(加上"e")。
你猜怎么着?您正在分配7 GB的内存,这些内存被严重加权为物理内存而非虚拟内存。
-
检查你的日志记录,因为这会有类似的建立时间。
-
spark.yarn.am.memory的价值是多少?
-
平衡VM和容器内存分配:)
另一个想法是调整内存开销,使其物理&虚拟可以更成比例