spark连接两个没有公共列的数据框



需要在pyspark中连接两个数据框。一个数据帧df1如下:

city  user_count_city  meeting_session
NYC    100             5
LA     200             10 
....

另一个数据帧df2如下:

total_user_count  total_meeting_sessions
1000               100

需要计算user_percentagemeeting_session_percentage所以我需要一个左连接,比如

df1 left join df2

既然两个数据框架没有公共键,我怎么能连接它们呢?

看看这篇文章的解决方案,连接两个没有公共列的数据框架但这与我的情况不一样。

预期结果

city user_count_city meeting_session total_user_count total_meeting_sessions
NYC    100             5                     1000     100
LA     200             10                    1000     100
....

您正在寻找一个交叉连接:

result = df1.crossJoin(df2)

相关内容

  • 没有找到相关文章

最新更新