我在查询一个包含纽约Citibike系统信息的数据库时遇到了一个问题,我想知道纽约Citibik系统中最常用的十条路线是哪一条,平均行程持续时间和路线(从起点站到终点站(
这就是表格的样子,第1部分
这是的第2部分
最后一部分
因此,我正在进行的查询是:
SELECT
usertype,
CONCAT(start_station_name, ' to ', end_station_name) AS route,
COUNT(*) AS num_trips,
ROUND(AVG(CAST(tripduration as int64)/60),2) AS duration_minutes,
FROM
bigquery-public-data.new_york_citibike.citibike_trips
GROUP BY
start_station_name,
end_station_name,
usertype
ORDER BY
num_trips DESC
LIMIT 10
问题是,它返回了我想要的内容,但也返回了顶部我不需要的行。我是犯了错误,还是仅仅意味着数据集中有空白信息?
我只是显示了前4行,但在证书中向我解释这一点的视频中,它没有显示黑色(第一行(。。。
这就是视频中的样子:
你能帮帮我吗?
(我是犯了错误,还是只是数据集中有空白信息?(
作为一个正在学习数据/sql的人,请务必始终调查您的数据!
以下查询显示,对于空白usertype
,电台名称为空。
select distinct start_station_name, end_station_name
from bigquery-public-data.new_york_citibike.citibike_trips
where usertype = ''
如果要抑制这些记录,则可能需要在查询中添加where usertype <> ''
筛选器。