我有一个数据集(租金价格与卧室和邻里的数量)。
我想将租金价格建模为基本价格的乘法,与卧室数量相关的标量和与邻里相关的标量。
例如,对于梅费尔的 2 张床,可能是 R = $100*1.2*1.5
从数学上讲,我想这看起来像:租金价格 = 基数*(a1B1+a2B2+a3B3...)*(k1N1+k2N2+...)
其中 B2 是二进制变量,如果房产有 2 间卧室,则为 1,否则为 0; 在上面的例子中,a2 将是 1.2;N1 是一个二进制变量,如果属性位于"邻域 1"中,则为 1,依此类推。
scikit-learn可以帮助建模这样的事情吗?我可以对变量的线性组合进行建模:
价格 = a1B1 +a2B2 + ... + k1N1 + k2N2
但是我看不到任何方法可以对乘法模型进行建模,也看不到任何将具有分类变量的乘法模型转换为线性模型的方法。
这是一个简单的线性回归问题。房价回归是线性回归最著名的用例。您可以导入它:
from sklearn.linear_model import LinearRegression
linear_model = LinearRegression()
linear_model.fit(X_training, y_training)
# Where X = features that you can provide in a dataframe or numpy matrix
# y = House prices
prices = linear_model.predict(X_test)
# ^Gives the prediction for the prices