需要在pyspark中连接两个数据框。一个数据帧df1
如下:
city user_count_city meeting_session
NYC 100 5
LA 200 10
....
另一个数据帧df2
如下:
total_user_count total_meeting_sessions
1000 100
需要计算user_percentage
和meeting_session_percentage
所以我需要一个左连接,比如
df1 left join df2
既然两个数据框架没有公共键,我怎么能连接它们呢?
看看这篇文章的解决方案,连接两个没有公共列的数据框架但这与我的情况不一样。
预期结果
city user_count_city meeting_session total_user_count total_meeting_sessions
NYC 100 5 1000 100
LA 200 10 1000 100
....
您正在寻找一个交叉连接:
result = df1.crossJoin(df2)