人们如何为IMDb等大型网站创建非官方API(提供json信息)?



比如这里的这个api:http://www.omdbapi.com/

他们只是解析整个网站的HTML并将字段保存在自己的数据库中吗?

在编程方面,什么是好的设计?

我简单的java开发人员心态是这样说的:

1-使用jsoup(或任何其他html解析库)并经常保存数据。

2-创建返回json的restful服务,如"searchByMovieName()"、"searchByActor"

3-将服务公开

就这么简单吗?

它可以是,是的。

您还可以实时获取页面和抓取数据(人们称之为API)。它会慢一点,但对您来说开销较小,而且您不需要担心过时的数据。

IMDB还提供可以直接使用的文件:替代接口

最新更新