我已经阅读了 PythonBooklet.pdf by H2O.ai 和 python API 文档,但仍然找不到一种干净的方法来做到这一点。我知道我可以做以下任一操作:
- 将 H2OFrame 转换为 Spark DataFrame,然后执行
flatMap
+collect
或collect
+ 列表理解。 - 使用 H2O 的
get_frame_data
,它给了我一串用n
分隔的标头和数据;然后将其转换为列表(在我的例子中是数字列表(。
有没有更好的方法可以做到这一点?谢谢。
你可以尝试这样的事情:通过调用.as_data_frame((将H2OFrame作为熊猫数据帧引入python,然后在感兴趣的列上调用.tolist((。
带虹膜的独立示例
import h2o
h2o.init()
df = h2o.import_file("iris_wheader.csv")
pd = df.as_data_frame()
pd['sepal_len'].tolist()
您可以 (1( 将 H2o 帧转换为熊猫数据帧
和 (2( 将熊猫数据帧转换为列表,如下所示:
pd=h2o.as_list(h2oFrame)
l=pd["column"].tolist()