HPPLE 解析器获取所有带有标签的内容

  • 本文关键字:标签 获取 HPPLE hpple
  • 更新时间 :
  • 英文 :


我有一大块 HTML,我尝试在其中获取div 中的所有内容,但我无法使用 [元素内容] 或 [元素文本] 检索它。

<div class="text_comment" id="xxx">
                    <blockquote><i><i><a>some text</a><br></i></i>
<blockquote>lorem ipsum ...</blockquote>
</blockquote>
<p>some text</p>
<p>lorem ipsum...</p>
<blockquote>another text</blockquote>
</blockquote>
<p>another text</p>             
</div>

我尝试使用标签检索div中的所有内容,如下所示

   <blockquote><i><i><a>some text</a><br></i></i>
    <blockquote>lorem ipsum ...</blockquote>
    </blockquote>
    <p>some text</p>
    <p>lorem ipsum...</p>
    <blockquote>another text</blockquote>
    </blockquote>
    <p>another text</p>

谁能帮我。

解决了,如果有人需要这个,只需做这些小更改:

TFHppleElement.h

@property (nonatomic, copy, readonly) NSString *raw;

TFHppleElement.m

- (NSString *)raw
{
    return [node objectForKey:@"raw"];
}

XPathQuery.m

NSDictionary *DictionaryForNode(xmlNodePtr currentNode, NSMutableDictionary *parentResult,BOOL parentContent)
{
    ...
    xmlBufferPtr buffer = xmlBufferCreate();
    xmlNodeDump(buffer, currentNode->doc, currentNode, 0, 0);
    NSString *rawContent = [NSString stringWithCString:(const char *)buffer->content encoding:NSUTF8StringEncoding];
    [resultForNode setObject:rawContent forKey:@"raw"];
    xmlBufferFree(buffer);
  return resultForNode;
}

最新更新