我想从数据库下载一个表,该表包含一组表格式的信息
The website https://membranome.org/species/1
我尝试了Rcurl、rlist、rvest和jsonlite,但我无法使其成为例如jsonlite代码
a <- fromJSON("https://membranome.org/species/1")
Error: lexical error: invalid char in json text.
<!DOCTYPE html> <html> <head>
(right here) ------^
我想要网站上的内容表,以数据帧格式进行数据分析,我可以进一步写入并保存为csv文件格式
例如,我的预期输出
Family protein Name Protein ID Localization Topology TM etc
aaaa bbbb 123 2 152 58 ....
cccc dddd 234 3 158 60 ....
提前感谢
rvest
可能不适用于您的案例,因为表不在页面源上。另一种方法可能是使用XMLHttpRequests(XHR(来提取json数据。然后使用类似jsonlite
的json解析器包将该json解析为R对象(数据帧或列表(。
按照此问答开始。