小贝子编程

如何将大数据的pandas块拆分为机器学习的x_train和y_train数据

本文关键字：train 数据机器学习 pandas 拆分 pandas machine-learning
更新时间 : 2023-09-20
英文 : How to use pandas chunk for large data into split the data for x_train and y_train for machine learning?

df_chunk=pd.read_csv(文件名，chunk=1000(X_train，Y_train，X_test，Y_test=train_test.split(df_chunk(

如何使用df_chunk将其拆分为x和y列车数据

我以前从未遇到过这种情况。也许你可以试试这个。

https://examples.dask.org/machine-learning/incremental.html

或者，这个。

https://zerowithdot.com/splitting-to-batches/

或者，获取原始数据集的一小部分。如果它真的是随机的，那么一个样本应该相当能代表整个数据集。

# Fraction of rows
# here you get .50 % of the rows
df.sample(frac = 0.5)

最新更新

Android Jetpack撰写和导航
payfort "response_message"："带有标记化的无效命令
如何检查我的"npx 安全帽编译"是否正常工作
OSError: -6在Micropython中进行简单的API调用时
带有AND操作符的For循环数组
无法从VPC内访问S3桶上托管的静态网站
使用Numpy Array在每个像素时间序列的特定位置插入值
如何在minikube上部署elasticsearch
如何在点击页面导航链接时停止屏幕滚动，React-Bootstrap和Gatsby
无法在本地种类群集中装载本地主机路径
不能将带有多个对象的文件从React上载到.net Core 5
在Python中找到蛋糕的最大块数
Mongodb:如何将$facet输出2乘以2合并
添加https到数组的缺失字符串?
如何使用bigquery在带有通配符的字符串列表中测试字符串
如何处理Vuex/Pinia商店中的关系并保持同步?
如何制作一定大小的列表(k)
django多对一关系
Powershell调用- webrequest追加到文件而不是写入
R difftime()产生不正确的间隔
SQL查询从两个表中减去值
r语言 - 如何在闪亮应用的downloadHandler中使用callr::r_bg
如何在熊猫数据框行爆炸与逗号分隔的数字，同时留下不变的行与单个数字和没有逗号?
使用' modelsummary::datasummary_balance '在' R '中删除' N '
PHP中使用关联数组的特定任务出现问题
按数据框分组并拆分为列
使用 Flask 时，为什么要使用 url_for() 方法来提供静态文件？为什么不能只使用相对路径？
Highcharts本地CSV问题
在python龟的比较中超过最大递归深度
Ionic 6 cordova/capacitor社交分享不支持ios

如何将大数据的pandas块拆分为机器学习的x_train和y_train数据

相关内容

最新更新

热门标签：