查找每天最常用的主题标签



以下是我的蜂巢表的数据片段,

2009-01-01 #aaa 2
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1

该表的说明为

id         bigint
hashtag    string
dt         date

该表基本上包含每天的主题标签计数信息。我想编写一个 hive 查询,它将返回每天最常用的主题标签及其计数。例如

2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1

谁能帮我解决这个问题?谢谢。

试试这个。

SELECT a.dt,
       a.hashtag,
       b.id
FROM mytable a
JOIN
  (SELECT dt,
          MAX(id) as id
   FROM mytable
   GROUP BY dt) b ON a.id = b.id
AND a.dt = b.dt
ORDER BY a.hashtag;

最新更新