小贝子编程

PySpark——将行列表转换为数据帧

本文关键字：数据帧转换 PySpark 列表 python apache-spark pyspark apache-spark-sql
更新时间 : 2023-09-01
英文 : PySpark -- Convert List of Rows to Data Frame

我实际上试图解决的问题是获取PySpark数据帧的前/后N行，并使结果成为数据帧。具体来说，我希望能够做这样的事情：

 my_df.head(20).toPandas()

但是，由于head()返回一个行列表，我得到了以下错误：

AttributeError: 'list' object has no attribute 'toPandas'

因此，我正在寻找将PySpark数据帧的前N行作为数据帧返回的方法，或者将这些行列表转换为数据帧的方法。有什么想法吗？

使用limit:

>>> df = sc.parallelize((("a", 1), ("b", 2))).toDF()
>>> df.limit(1).toPandas()
  _1  _2
0  a   1

带pd.DataFrame:

>>> pd.DataFrame(df.head(1), columns=df.columns)
  _1  _2
0  a   1

最新更新

我在三中看不到物体.js
在函数中使用单词列表
如何将此SQL转换为压缩
backbuttondisplaymode in swiftUI
Django -单元测试对象是否被删除-如何使用assertRaise / DoesNotExist异常
如何以这种格式发送数据我有这个模型，我想要这种格式
<img> 语义 HTML 中是否允许在内部使用<li>标记？
连接Bigquery中的区间聚合数据
pycharm项目丢失了源根，没有显示
按数组字符串过滤对象数组，并与对象的子字符串匹配
有时需要多次刷新才能加载Angular 14构建的网站
为什么console.log显示我在html文档中有0个加载的图像?
没有权限在strapi中查看该字段
PineScript -策略.输入订单金额
如何在所有缩放级别的Azure地图中渲染铁路或火车轨道?
每次我运行npm start，我得到以下错误
用所有数据初始化mat-autocomplete选项
获取或使用函数类中sharedpreferences的值
r语言 - 在自身RStudio上交叉连接
在Nunit中对某些测试进行参数化设置，但对其他测试不进行参数化设置
在模板<类中，It>函数，其中它是一个迭代器，我可以让它：：value_type同时适用于vector：：iterators和array：：iterators吗？
查询现有列时出现SequelizeDatabaseError
如何在React组件中插入使用js创建的iframe
使用 HTML 和 Javascript 检测第二个下拉列表(级联)中的更改
如何配置我的django项目:模板不存在错误?
尝试将JSON解析为字典的问题
合并HTML表中的单元格
c# MVC返回List时如何处理空值
如何从标准输入中读取一行，并将其余部分传递给子进程?
类型错误：只能将 str (不是 "float" ) 连接到 str

PySpark——将行列表转换为数据帧

相关内容

最新更新

热门标签：