以下是我的蜂巢表的数据片段,
2009-01-01 #aaa 2
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1
该表的说明为
id bigint
hashtag string
dt date
该表基本上包含每天的主题标签计数信息。我想编写一个 hive 查询,它将返回每天最常用的主题标签及其计数。例如
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1
谁能帮我解决这个问题?谢谢。
试试这个。
SELECT a.dt,
a.hashtag,
b.id
FROM mytable a
JOIN
(SELECT dt,
MAX(id) as id
FROM mytable
GROUP BY dt) b ON a.id = b.id
AND a.dt = b.dt
ORDER BY a.hashtag;