我计算了两个因变量(地块/房屋大小与成本)的相关性,相关性为0.87。我想使用此指数来衡量大小增加或减少时成本的增加或减少。可以使用相关性吗?如何?
相关性仅根据我们拥有的数据告诉我们两个变量线性相关的程度,但它不提供在给定另一个变量值的情况下计算变量值的方法。
如果变量是线性相关的,我们可以使用线性回归来预测变量 Y 在变量 X 具有某个值时将假定的实际值:
这个想法是尝试将数据拟合到线性函数,并使用它来预测值:Y = bX + a
通常,我们首先使用相关系数(例如皮尔逊系数)发现两个变量是否相关,然后我们使用回归方法(例如线性)来预测给定另一个感兴趣变量的值。
这是一个易于遵循的关于 Python 线性回归的教程,其中包含一些理论: https://realpython.com/linear-regression-in-python/#what-is-regression
这里有一个关于房价预测典型问题的教程: https://blog.akquinet.de/2017/09/19/predicting-house-prices-on-kaggle-part-i/