我想知道是否可以有多个CSV文件用于训练,一个文件用于测试。
例如,我得到了四个包含 8 列数据的 CSV 文件和一个用于标签的文件,该文件与我的所有 4 个 CSV 训练文件不同。
有了所有这些数据,我想在一个test.scv文件上进行测试,该文件只包含8列数据,并在同一文件中添加预测标签。(不确定如何(
我设法只为一个用于测试和培训的 CSV 文件执行此操作 下面是代码:
svm_data = pd.read_csv('excel1.csv')
classifcator=svm_data[['alpha','beta','gama','teta','low_alpha','high_alpha','low_beta','high_beta']]
X=np.asarray(classifcator)
y=svm_data['label']
from sklearn.model_selection import train_test_split
# here not sure how to train_test_split with multiple csv files and one for training
X_train, X_test,y_train,y_test=train_test_split(X, y, test_size=0.2)
from sklearn import preprocessing
X_train = preprocessing.scale(X_train)
X_test = preprocessing.scale(X_test)
classifier=SVC(kernel='linear')
classifier.fit(X_train,y_train)
Y_predict = classifier.predict(X_test)
print(classification_report(y_test,Y_predict))
如果可能的话,我只需要一个用于训练的多个 csv 文件的示例。谢谢你的时间。
train_test_split
用于将一组数据拆分为训练/测试数据 - 如果您已经按文件分隔,则只需单独读取每个文件即可创建训练/测试数据集,并且不使用该函数。