尝试使用 pmml 包将 R 分类器导出到 PMML 时,我注意到树中节点的类分布未导出。
PMML通过ScoreDistribution元素支持这一点:http://www.dmg.org/v1-1/treemodel.html
无论如何,PMML中是否有此信息?我想使用另一个依赖于此信息的工具读取 PMML。
我正在做这样的事情:
library(randomForest)
library(pmml)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)
你能提供更多信息吗?例如,您尝试使用哪个功能。
例如,如果您使用的是 randomForest 包,我相信它不会提供有关分数分布的信息;因此 PMML 表示也不能。但是,如果使用默认值,则分类参数"nodesize"等于 1,这意味着终端节点将具有 ScoreDistribution,例如:
分数分布值=预测值概率="1.0"/>
ScoreDistribution 值=AnyOtherTargetCategoty 概率="0.0"/>
如果使用 rpart 树模型,则 pmml 函数会输出分数分布信息。也许您可以向我们提供您使用的确切命令?