使用 googleway 在 R 中进行地理编码



我读过使用 googleway R 进行批量地理编码

我正在尝试使用谷歌方式对一些地址进行地理编码。 我希望返回地理编码、地址和县。

使用上面链接的答案,我创建了以下函数。

geocodes<-lapply(seq_along(res),function(x) {
coordinates<-res[[x]]$results$geometry$location
df<-as.data.frame(unlist(res[[x]]$results$address_components))
address<-paste(df[1,],df[2,],sep = " ")
city<-paste0(df[3,])
county<-paste0(df[4,])
state<-paste0(df[5,])
zip<-paste0(df[7,])
coordinates<-cbind(coordinates,address,city,county,state,zip)
coordinates<-as.data.frame(coordinates)
})

然后像这样把它放回原处...

library(data.table)

done<-rbindlist(geocodes))

问题是将地址和县从"res"列表中移回。 上面链接的答案从发送到谷歌的数据帧中提取地址,并假设列表顺序正确,并且没有从谷歌返回的多个匹配结果(在我的列表中似乎有几个)。 关键是,从一个文件中获取地址,从另一个文件中获取坐标似乎相当鲁莽,并且由于无论如何我都需要县,因此我需要一种方法将其从保存在"res"中的Google结果列表中拉出。

问题是某些地址比其他地址具有更多的"类型",这意味着像我上面所做的那样按行引用是行的

。我还尝试在函数中包含 rbindlist 以将子列表转换为数据表,然后拉出字段,但无法完全使其工作。 这种方法的问题在于实际地址在向量中,但我用于过滤或选择的"类型"字段在子列表中。

我能描述的最好方式是这样的—— 列表 <- c(长地址),c(短地址),类型(列表(街道号码,路线,县等))

显然,我是这方面的初学者。 我知道有一种更简单的方法,但我只是在列表上苦苦挣扎,R 似乎广泛使用它们。

编辑: 我绝对认识到我不能绑定整个列表。 我需要提取特定元素并绑定这些元素。 在我看来,问题的很大一部分是我对索引和操作列表没有很好的处理能力。

这里有一些地址可以尝试 - "301 Adams St, Friendship, WI 53934, USA"有一个 7X3 的"地址组件"和相应的 7 个"类型"列表。 将其与"222 S Walnut St, Appleton, WI 45911, USA"进行比较,后者的地址组件为 9X3,"类型"列表为 9。 类型列表需要连接回地址组件矩阵,因为类型列表标识地址组件矩阵的每一行包含的内容。

然后是不完美的匹配会带来更多的复杂性。 尝试"211 Grand Avenue, Rothschild, WI, 54474",你会得到2个列表,一个是East Grand Ave,一个是West Grand Ave。 谷歌似乎更喜欢东方,因为这就是"格式化地址"中的内容。 我真的不在乎使用哪个,因为县对两者都是一样的。 有趣的是,"位置"包含 2 组地理编码,据推测,它们指的是两个匹配项。 我认为这种复杂性可以忽略不计,因为由两个坐标组成的位置仍然存储为"双精度"(而不是列表!),因此它应该与其他地址的坐标堆叠。

编辑:这应该真的有效,但我在函数的 do.call(rbind,types) 行中出现错误。

geocodes<-lapply(seq_along(res),function(x) {
coordinates<-res[[x]]$results$geometry$location
types<-res[[x]]$results$address_components[[1]]$types
types<-do.call(rbind,types)
types<-types[,1]
address<-as.data.frame(res[[x]]$results$address_components[[1]]$long_name,strings.As.Factors=FALSE)
names(address)[1]<-"V2"
address<-cbind(address,types)
address<-tidyr::spread(address,types,V2)
address<-cbind(address,coordinates)
})

R 表示"类型"对象不是一个列表,因此它无法重新绑定它。 我尝试将其强制到列表中,但仍然收到错误。 我使用以下配对的向下函数进行了检查,发现#294 为空。 这将停止该功能。 我收到"超过查询限制"作为错误,但我没有超过查询限制。

geocodes<-lapply(seq_along(res),function(x) {
types<-res[[x]]$results$address_components[[1]]$types
print(typeof(types))
})

这是我使用tidyverse函数的解决方案。 这将获取地理编码以及格式化的地址,以防您需要它(也可以返回结果的其他组件,它们只需要添加到返回的地图函数最后一行的表中。

suppressPackageStartupMessages(require(tidyverse))
suppressPackageStartupMessages(require(googleway))
set_key("your key here")
df <- tibble(full_address = c("2379 ADDISON BLVD HIGH POINT 27262", 
"1751 W LEXINGTON AVE HIGH POINT 27262", "dljknbkjs"))
df %>% 
mutate(geocode_result = map(full_address, function(full_address) {
res <- google_geocode(full_address) 
if(res$status == "OK") {
geo <- geocode_coordinates(res) %>% as_tibble()
formatted_address <- geocode_address(res)
geocode <- bind_cols(geo, formatted_address = formatted_address)
}
else geocode <- tibble(lat = NA, lng = NA, formatted_address = NA)
return(geocode)
})) %>%
unnest()
#> # A tibble: 3 x 4
#>   full_address                  lat   lng formatted_address                
#>   <chr>                       <dbl> <dbl> <chr>                            
#> 1 2379 ADDISON BLVD HIGH POI…  36.0 -80.0 2379 Addison Blvd, High Point, N…
#> 2 1751 W LEXINGTON AVE HIGH …  36.0 -80.1 1751 W Lexington Ave, High Point…
#> 3 dljknbkjs                    NA    NA   <NA>

创建于 2019-04-14 由 reprex 软件包 (v0.2.1)

好的,我会自己回答。

从地址的数据帧开始。 我称我的为"地址",数据帧中的单数列也称为"地址"(请注意,我将其大写)。

使用googleway获取地理编码数据。 我使用应用来遍历地址数据帧中的行来执行此操作

library(googleway)
res<-apply(addresses,1,function (x){
google_geocode(address=x[['Address']], key='insert your google api key here - its free to get')  
})

这是我编写的函数,用于将嵌套列表放入数据帧中。

geocodes<-lapply(seq_along(res),function(x) {
coordinates<-res[[x]]$results$geometry$location
types<-res[[x]]$results$address_components[[1]]$types
types<-do.call(rbind,types)
types<-types[,1]
address<-as.data.frame(res[[x]]$results$address_components[[1]]$long_name,strings.As.Factors=FALSE)
names(address)[1]<-"V2"
address<-cbind(address,types)
address<-tidyr::spread(address,types,V2)
address<-cbind(address,coordinates)
})
library(data.table)
geocodes<-rbindlist(geocodes,fill=TRUE)

lapply沿着列表中的项目循环,在函数中,我创建了一个坐标数据框并将地理编码放在那里。 我还想要其他地址组件,特别是县,因此我还创建了"类型"数据帧,用于标识地址中的项目是什么。 我将地址项与类型绑定,然后使用 tidyr 包中的展开将数据帧重塑为宽格式,使其只有 1 行宽。 然后,我从坐标数据框中绑定纬度和纬度。

rbindlist 将它们全部堆叠在一起。 你可以使用do.call(rbind, geocodes)但rbindlist更快。

相关内容

  • 没有找到相关文章

最新更新