我使用nokogiri作为我网站的html解析器。当我试图把这个网站放在共享主机服务上时,我发现我不能安装nokogiri,因为他们不允许访问gcc,所以nokogiri不能构建本地扩展。是否有一个nokogiri的二进制分布,我可以复制到我的主机帐户?如果没有,我可以在一台机器上手动安装nokogiri然后复制它吗?
如果所有这些都不是一个选项是否有一个html解析gem不需要本地扩展?
谢谢
据我所知,Ruby只能通过REXML本地解析XML,并且无法通过简单地移动几个文件来"复制"安装。解析HTML比解析XML更高级,因为它在处理不良标记时必须灵活得多。
一种选择是使用TidyHTML"整理"HTML,然后使用REXML解析它。我自己还没有尝试过,但它似乎对大多数人都有效。