比如这里的这个api:http://www.omdbapi.com/
他们只是解析整个网站的HTML并将字段保存在自己的数据库中吗?
在编程方面,什么是好的设计?
我简单的java开发人员心态是这样说的:
1-使用jsoup(或任何其他html解析库)并经常保存数据。
2-创建返回json的restful服务,如"searchByMovieName()"、"searchByActor"
3-将服务公开
就这么简单吗?
它可以是,是的。
您还可以实时获取页面和抓取数据(人们称之为API)。它会慢一点,但对您来说开销较小,而且您不需要担心过时的数据。
IMDB还提供可以直接使用的文件:替代接口