如何查找嵌入的"a"标记



我无法在p.user_info中获得a标签:

<p class="user_info"> 
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
        <img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
    </a>
</p>

用:

p_user_info = page.css("p.user_info")
puts p_user_info.css("a") # => []
puts p_user_info.css("a")[0] # => null
puts p_user_info.css("a").text # => ""

是否可以使用 Nokogiri 获得login_iduser_name a标签?


我发现了一个更重要的问题:

url = "http://clien.net/cs2/bbs/board.php?bo_table=park&wr_id=23895599"
html = open(url).read
puts html
# => ...
<p class="user_info"> <img src='/cs2/data/member/at/atlantis33.gif?dt=20130506110916' align='absmiddle' border='0'>님 </p>
...

我不知道为什么我无法获得a标签。

尝试以下操作:

require 'nokogiri'
html = <<eoh
<p class="user_info"> 
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
        <img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
    </a>
</p>
eoh
page = Nokogiri::HTML(html)
a = page.at_css("p.user_info a")
p a[:onclick].split(',')[1,2]
# => [" 'login_id'", " 'user_name'"]
p a[:onclick].split(',')[1,2].map { |x| x.gsub(/^[' ]+|[' ]+$/, '') }
# => ["login_id", "user_name"]

回答我自己。 a标签只有在登录后才能看到。 需要mechanize库。

require 'nokogiri'                                                              
a =%{<p class="user_info">                                                      
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
<img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
</a>                                                            
</p>"}                                                          
html = Nokogiri::HTML(a)                                                        
link = html.at_css "a"                                                          
puts link.values[1].split[1]                                                    
puts link.values[1].split[2]

相关内容

  • 没有找到相关文章

最新更新