小贝子编程

如何解决读取数据集时出现的内存问题

本文关键字：问题内存数据集读取何解决解决 pandas low-memory
更新时间 : 2023-09-20
英文 : How can I solve the memory problem that appears when you read the dataset?

无论您设置了low_memory、true还是false，我都会得到内存错误。无法为具有形状(4357、415796(和数据类型float64 的数组分配13.5 GiB

low_memory=True只会在解析时帮助减少内存使用，对文件的总大小没有任何帮助。

要处理这么大的文件，需要分块处理。

如果您的某些计算需要同时处理整个文件，则需要查看其他选项，如pyspark或dask。

# IIUC, this should approx. be chunks of ~1.2GB:
with pd.read_csv('file.csv', chunksize=400) as reader:
for chunk in reader:
# Do stuff with each chunk.

最新更新

如何在GitLab CI作业中使用docker构建缓存?
CDK Pipeline - Trigger Step Function
一种在Python中使可执行文件仅在特定时间内工作的方法
如何在启动GCP VM实例时使用自定义python命令调度该实例?
图像消失时，我选择一个文件与Flet Python
是否有一种方法允许CORS处理飞行前响应的自定义标头
OSError: [Errno 57] Socket is not connected (python macos中的S
使用lag()或类似的方法，具有开始值和结束值的帐户滚动
我如何重写子类中重写超类的函数依次(Python)?
无法使用WooCommerce API将产品添加到相应的类别/子类别
用户登录到应用程序注册时Azure AD管理员同意错误
Unity 3d:在不知道我将使用的确切预制的情况下，我如何在运行时启动预制?
c -构建简单shell时文件重定向的问题
AWS Lambda实际上记录到控制台以外的任何本地接收器(因此是CloudWatch)吗?
我如何在Django中为mymyy输入一个自定义用户模型管理器?
discord.js v13交互按钮删除原始消息
在Flutter中默认禁用BlocBuilder中的TextButton
如果数据已经被获取，如何防止Redux工具包中的加载状态
Javascript:在深度嵌套的数组和对象中查找匹配的属性值
将本地时间转换为用户首选时区，将用户首选时区转换为GMT
为什么 AWS Web 应用程序的前端和后端在这些关系图中直接连接？
是否有一个顺序Java正则表达式?
如何向右移动一个字符串n个字符
我应该从存储库返回任务<IEnumerable<T>>还是IAsyncEnumerable<T>？
Python处理程序错误-没有足够的值来解包
使用 javascript 获取最接近和最高的 id
如何利用向量化技术提高MATLAB程序的效率
如何将PostgreSQL查询转换为LINQ或lambda表达式
Python mysql-connector-python:如何使用mysql-connector-python从终端连
新的json数据不显示在android

如何解决读取数据集时出现的内存问题

相关内容

最新更新

热门标签：