这个 Python 的 R 语言中的等效机器学习程序是什么?



作为DSL和代码生成的学校作业的一部分,我必须将以下用Python/Scikit-learn编写的程序翻译成R语言(练习的主题是假设的机器学习DSL(。

import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import cross_validate
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
df = pd.read_csv('boston.csv', sep=',')
df.head()
y = df["medv"]
X = df.drop(columns=["medv"])
clf = DecisionTreeRegressor()
scoring = ['neg_mean_absolute_error','neg_mean_squared_error']
results = cross_validate(clf, X, y, cv=6,scoring=scoring)
print('mean_absolute_errors = '+str(results['test_neg_mean_absolute_error']))
print('mean_squared_errors = '+str(results['test_neg_mean_squared_error']))

因为我是机器学习的完美新手,尤其是在 R 方面,所以我做不到。

有人可以帮助我吗?

抱歉回答晚了,可能你已经完成了学校作业。当然,我们不能只为您做这件事,您可能必须自己解决。而且,我并不完全明白你需要做什么。但一些提示是:

  1. 读取 csv 文件

data <-read.csv(file="name_of_the_file", header=TRUE, sep=","( data <-as.data.frame(data(

header=TRUE 表示文件有一行包含列的名称,sep=',' 与 python 中的相同(文件中的分隔符是 ','( as.data.frame 确保数据以数据帧格式保存。

  1. 添加/删除列

data<- data[,-"name_of_the_column_to_be_deleted"] #delete 列 数据$name_of_column_to_be_added<- C(1:10( #add 列

为了添加列,您需要添加它将包含的元素。此外,# 符号表示注释的开头。

  1. 建模

对于建模部分,我不确定您想要实现什么,但 R 提供了大量的算法可供选择(即,如果您想种植一棵树,请查看使用以下脚本种植树的页面 https://www.statmethods.net/advstats/cart.html

适合<- rpart(脊柱后凸 ~ 年龄 + 数字 + 开始, 方法="类",数据=脊柱后凸((

最新更新