小贝子编程

如何将CSV数据集按百分比拆分为训练和测试集，并将拆分后的数据集与Panda一起保存到本地文件夹中

本文关键字：数据集拆分 Panda 一起保存文件夹百分比 CSV 测试 python pandas scikit-learn dataset python-3.8
更新时间 : 2023-09-18
英文 : How to split CSV dataset into training and testing set by percentage and save the splitted dataset into local folder with pandas?

我有一个大尺寸的CSV数据集，需要将训练集和测试集分别拆分77%和33%。最后，我想访问本地机器中的每个文件。

导入所需库

import math

整个数据集

df = pd.read_csv('CTU.csv')
total_size=len(df)
train_size=math.floor(0.77*total_size)

训练数据集和测试数据集

train=df.head(train_size)
test=df.tail(len(df) -train_size)

正在保存文件

train.to_csv('train.csv')
test.to_csv('test.csv')

最新更新

React Typescript：重构代码后无法过滤数组
pyalgotrade退出订单事件(onExitOk)的问题
如何从Lucene文档中打印所有术语?
使用jQuery通过span类获取检查元素
如果数据在列表中，如何过滤请求中的数据?
是否可以使用javascript或python访问whatsapp消息数据库历史记录?
为什么在版本 5 中找不到松树脚本的"ta.sqrt"？
检查String是否包含List中的任何项
Firebase Checkout Timer
Pythonnet中的c#扩展和Linq
你好，这是大学学习编程的第一天
为什么单元测试一个图像字段使用SimpleUploadedFile创建多个图像?
从文件中删除空白而不是从目录中删除空白会抛出错误
如何调用异步函数之前的组件呈现在reactjs?
scikit-learn版本不匹配__version__ '和' pip show scikit-learn '.<
雪花云数据平台哈希MD5或SHA256
Traefik filter portainer 作为 docker 群中的"disabled container"
Pandas数据框架，如何根据其他行的值替换部分行
如何安装Tensorflow和CUDA驱动程序?
如何创建带有域名和可导出过程列表的COBOL模块
Pixi js对一个元素进行两次旋转(如何添加类似包装器的东西)
如何停止旅行计划:在Windows 10的本地计算机上运行
r语言 - 使用for循环和数据框架从vector中提取元素
为什么控制台.log在我单击按钮后再次打印状态，即使状态的值没有更改？
获取文本框中按钮的值
带有垫子形式的 Angular 无法编译：ngcc 无法在 parse5@5.1.1 上运行
Google登录认证按钮不工作，Firebase
在bash中查找右括号
密码加强脚本-如何大写第一个字母，并将整数列表追加到文件中的文本末尾，并重复列出它
我如何使用相同的布局为每个页面，但改变内容组件通过URL路由在Next.js?

如何将CSV数据集按百分比拆分为训练和测试集，并将拆分后的数据集与Panda一起保存到本地文件夹中

导入所需库

整个数据集

训练数据集和测试数据集

正在保存文件

相关内容

最新更新

热门标签：