小贝子编程

使用文本数据和其他预测因子构建预测模型

本文关键字：构建预测模型其他文本数据 python scikit-learn nlp prediction
更新时间 : 2023-09-14
英文 : Building a predictive model with text data and other predictors

我正在尝试使用scikit-learn构建一个预测模型(随机森林，sgd等(，似乎每个模型都只允许您拟合文本数据，例如

classifier.fit(X,Y)

。其中Y是目标，X是文本特征向量 (count_vec -> tf_idf(。有没有办法拥有一个除了文本特征矩阵之外还包含几个分类变量的模型？我可以简单地将它们作为新列附加到X的右侧吗？

您需要首先转换分类数据 - 简单地将字符串类别附加到来自特征提取器(如 TfIdfCountVectorizer(的数字值将不起作用。下面是有关将类别转换为数字特征数据的 SO 问题和答案，您可以将其附加到右侧。

最新更新

复制、修改和发送请求POST Fiddler
调用一个获取并返回字符串的用户方法，就像在c#中调用.net中的大多数字符串类方法一样
Configure ForwardHeadersMiddleware from appsettings?
count(1)和postgres中不同的行为
如何为Vue中动态生成的一个元素设置不同的样式
计算SQL Oracle中的百分比
如何打开没有Adobe动画的FLA文件?
一个Android模块如何知道另一个模块，而不声明它作为依赖?
Selenium日志隐藏在python中
实现客户端流到服务器Python代码失败
DllNotFoundException: agoraSdkCWrapper with Agora in Unity o
Rust narray:按列顺序遍历数组
如何加载存储在同一DAT文件中的多个python对象?
代理跨域请求与angular——proxy.config
属性错误："函数"对象没有属性"args"
OpenGL/glm显示黑屏
我收到此警告标志数组索引 4001 已超过数组的末尾(包含 4001 个元素)
Spring Content 1.2.5 JPA(Postgres) .docx文件突变为zip归档
将十进制转换为十六进制，并确保它们是数字
为用户在登录页面后添加路由
动态变量导致错误，因为它没有正确分配
有可能从手机中获得指纹或人脸验证吗?
File IO From a JAR File
如何获得上下文在一个简单的类没有BuildContext在扑动
无法向 Tkinter 窗口添加背景
如何将RGB图像转换为灰度，但保持一种颜色?——Java
我应该在Docker内部还是在虚拟环境中安装气流?
属性错误： 'DataFrame'对象没有属性'assign'
如何在每次在DirectoryInfo.GetFiles()中加载新文件时执行操作?
HTML中的Javascript在Angular中不起作用

使用文本数据和其他预测因子构建预测模型

相关内容

最新更新

热门标签：