我在使用包装dosnow的当前与32个内核一起聚集在EC2上的Rstudio碰撞。问题一直在发生,Rstudio和AWSlogs中的日志显示以下问题:
The previous R session was abnormally terminated due to an unexpected crash. You may have lost workspace data as a result of this crash
我尝试了在Rstudio社区页面上找到的解决方法:
rm -rf ~/.rstudio
我重新启动了它,多次终止了rstudio,但这无济于事。我更改为更大的实例: R4.8xlarge但是也无法进行计算。
Apr 30 14:14:23 ip-172-31-46-102 rsession-rstudio[12984]: ERROR session hadabend; LOGGED FROM: rstudio::core::Error {anonymous}::rInit(const rstudio::r::session::RInitInfo&) /home/ubuntu/rstudio/src/cpp/session/SessionMain.cpp:563
这是rstudio崩溃时的以下代码:
# Clustering using gower distance and hclust()
d <- sapply(1:nrow(data), function(i) gower_dist(data[i,], data))
d <- as.dist(d)
h <- hclust(d) # this causes error
解决了问题 - Hclust并不适合大数据。用flashclust取代它不会再导致rstudio崩溃,并且计算成功了。