关于h2o.glm lambda搜索似乎没有迭代所有lambda,我读到这个问题是抱怨lambda太高;他们尝试设置early_stopping=F
,希望能修复这个"错误"。
原来的行为不是一个特性,而不是一个bug吗?如果这是正确的,那么在使用GLM的交叉验证时,应该始终使用early_stopping=T
,否则交叉验证的误差估计是无用的;你也有过度合身的风险。
(我的主要问题是,我对GLM和CV协同工作方式的理解是否正确;但在一起使用lambda_search和交叉验证时,如果还有其他需要注意的地方,我会感兴趣。(
我认为early_stopping设置为false的行为应该为所有Lambda计算模型,以防用户想要查看它们/进行自定义模型选择。