使用具有高斯族分布的广义线性模型来预测离散量(例如,通过将高斯GLM的输出四舍五入到最接近的整数)可以吗(合法方法)?
你可以这样做,但这可能不是最好的做法。这实际上取决于你试图建模的数据的性质。中毒回归很可能更适合您的需求。
http://en.wikipedia.org/wiki/Poisson_regression
然而,没有什么可以阻止您将线性模型实际拟合为整数值数据,但在使用该模型对数据进行推断时可能会遇到问题。如果你只是想提供一个模型来预测未来的观测结果,即使理论上无效,它也可能很好地工作。
很明显,考虑到模型的性质,你最终可能会预测出非常荒谬的结果——例如,你的响应变量可能只在有限的范围内有意义(比如正整数),但你的模型可能允许预测任意大的值(正和负)。残差检验(正态性和相关性)等模型检验步骤可能不会给出在建模连续正态分布响应时通常会看到的结果类型。
总的来说,我想说的是,根据你的数据,你的方法可能会生成一个有用的预测模型,但总的来说你应该谨慎行事。
阅读这个问题和一些答案——它讨论了类似的主题https://stats.stackexchange.com/questions/3024/why-is-poisson-regression-used-for-count-data
为了接触更多的受众,您可以考虑将此问题发布在http://stats.stackexchange.com