我想知道是否有人知道任何好的代码/应用程序/宝石可以从任何网站获取元数据(标题和描述)?
我有一个食谱网站,用户可以添加他们从哪里获得食谱的URL,我想从这个提交的URL自动生成网站的标题和描述。
有什么想法/谢谢你的帮助!
Nokogiri是一个简单的html解析器,因为您只需要足够简单的元标记信息。
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.example.com'))
doc.xpath('//meta').each do |meta|
puts meta.name
puts meta.content
end