我建立了一个ML模型,它运行良好,但现在我正在寻找一种方法,可以知道使用的输入测试数据给了我预测的结果,这样我就可以将其创建为字典。
我尝试这样做是因为在我的模型中,一些输入会被模型跳过,所以排序会混淆。
预期输出低于
在此处输入图像描述
有人能帮我创建这个数据吗
以下是用于训练的输入数据的数据帧构造函数
import pandas as pd
Names = ['Apple','Orange','Apple', 'Orange', 'Orange', 'Car', 'Truck',
'Cycle', 'VolleyBall', 'BasketBall', 'VolleyBall', 'Car', 'Truck','Cycle',
'BasketBall']
Labels = ['Fruit','Fruit', 'Fruit', 'Fruit', 'Fruit', 'Automobile','Automobile', 'Automobile',
'Sports', 'Sport', 'Sports', 'Automobile', 'Automobile','Automobile'
, 'Sports']
df = pd.DataFrame(Labels, Names).reset_index()
df.columns = ['Names', 'Labels']
df
我用于预测的测试数据是["未知"、"橙色"、"汽车"、"篮球"]
现在,我的模型将跳过输入测试数据"未知",只预测剩余三个的值,形式为["水果"、"汽车"、"运动"]
我试图用输入测试数据和预测输出以数据帧的形式实现结果。
我写这篇文章是为了回答问题,因为我没有足够的代表发表评论!
您的模型跳过未知类别的一个可能原因是,在OneHotEncoding您的功能时,您可能没有提到handle_unknown = 'ignore'
。试试看,让我知道它是否能解决你的问题。
至于如何获得预测数据的结果,只需创建一个要进行预测的数据的数据帧,并在该数据帧上使用model.predict
。您将得到一个带有结果的数据帧。