通过R中的邮政编码制表区下载天气数据



我正在想办法通过邮政编码制表区(ZCTA)下载天气(温度、辐射等)。尽管人口普查数据包含ZCTA的人口普查信息,但天气数据并非如此。

我尝试从中查找信息http://cdo.ncdc.noaa.gov/qclcd/QCLCD?prior=N但我想不通。

你们中有人下载过ZCTA的天气数据吗?如果没有,有没有人有将气象观测站信息转换为ZCTA的经验?

国家气象局提供了两个基于web的API,用于从国家数字预报数据库(NDFD)、SOAP接口和REST接口中提取天气预报信息。两者都以数字天气标记语言(DWML)返回数据,DWML是一种XML方言。此处列出了可以返回的数据元素。

到目前为止,REST接口更易于使用。下面是一个例子,我们提取了邮政编码10001(曼哈顿下城)未来5天的预测温度、相对湿度和风速,增量为3小时。

# NOAA NWS REST API Example
# 3-hourly forecast for Lower Mannhattan (Zip Code: 10001)
library(httr)
library(XML)
url <- "http://graphical.weather.gov/xml/sample_products/browser_interface/ndfdXMLclient.php"
response <- GET(url,query=list(zipCodeList="10001",
                               product="time-series",
                               begin=format(Sys.Date(),"%Y-%m-%d"),
                               Unit="e",
                               temp="temp",rh="rh",wspd="wspd"))
doc   <- content(response,type="text/xml")   # XML document with the data
# extract the date-times
dates <- doc["//time-layout/start-valid-time"]
dates <- as.POSIXct(xmlSApply(dates,xmlValue),format="%Y-%m-%dT%H:%M:%S")
# extract the actual data
data   <- doc["//parameters/*"]
data   <- sapply(data,function(d)removeChildren(d,kids=list("name")))
result <- do.call(data.frame,lapply(data,function(d)xmlSApply(d,xmlValue)))
colnames(result) <- sapply(data,xmlName)
# combine into a data frame
result <- data.frame(dates,result)
head(result)
#                 dates temperature wind.speed humidity
# 1 2014-11-06 19:00:00          52          8       96
# 2 2014-11-06 22:00:00          50          7       86
# 3 2014-11-07 01:00:00          50          7       83
# 4 2014-11-07 04:00:00          47         11       83
# 5 2014-11-07 07:00:00          45         14       83
# 6 2014-11-07 10:00:00          50         16       61

可以在一个请求中查询多个邮政编码,但这会使解析返回的XML变得复杂。

要将NOAA QCLCD数据转换为邮政编码,您需要使用station.txt文件中的纬度/经度值,并将其与人口普查数据进行比较。这只能通过与GIS相关的工具来完成。我的解决方案是使用启用PostGIS的数据库,这样您就可以使用ST_MakePoint函数:

ST_MakePoint(longitude, latitude)

然后,您还需要将人口普查局的ZCTA加载到数据库中,以确定哪些邮政编码包含哪些车站。ST_Contains函数将对此有所帮助。

ST_Contains(zip_way, ST_MakePoint(longitude, latitude))

完整的查询可能看起来像这样:

SELECT s.wban, z.zip5, s.state, s.location
   FROM public.station s
   INNER JOIN public.zip z 
       ON ST_Contains(z.way, ST_MakePoint(s.longitude, s.latitude)

我显然是在对列名做假设,但以上应该是一个很好的起点。

使用QGIS(免费)或ArcGIS(昂贵)也应该能够完成相同的任务。这消除了安装支持PostGIS的数据库的开销,但我不太熟悉这些软件包中所需的步骤。

天气数据仅适用于气象站,每个ZCTA没有一个气象站(ZCTA比气象站覆盖的区域小得多)。

我在noaa网站上看到了一些选项,你可以在那里输入纬度和经度,它会从合适的气象站找到天气。因此,如果你能将你感兴趣的ZCTA转换为lat/lon对(中心、随机角等),你可以将其提交到网站。但请注意,如果你对大量紧密相连的ZCTA这样做,你将下载冗余信息。最好将ZCTA与气象站进行一次匹配,然后只从每个气象站下载一次天气信息,然后与ZCTA数据合并。

最新更新