如何获取网站的HTML并使用NSXMLParser进行解析



我正在尝试从网站解析XML(例如"http://www.kick-girl.com/?cat=3")

我可以使用轻松获取XML

 NSURL *url = [NSURL URLWithString:@"http://www.kick-girl.com/?cat=3"];
 NSLog(@"%@", [NSString stringWithContentsOfURL:url encoding:NSUTF8StringEncoding error:nil]);

然而,当我尝试使用NSXMLParser时,它根本不起作用。我已经尝试将字符串转换为数据

NSString *s = [NSString stringWithContentsOfURL:url encoding:NSUTF8StringEncoding error:nil];
NSData *d = [s dataUsingEncoding:NSUTF8Encoding];
NSXMLParser *xmlparser = [NSXMLParser alloc] initWithData:d];
xmlparser.delegate = self;
[xmlparser parse];

但它仍然不起作用。NSXMLParserDelegate方法不会被调用。例如

- (void)parser:didStartElement:namespaceURI:qualifiedName:attributes:

我也尝试过使用AFnetworking,看看这是否有助于

NSURLRequest *request = [NSURLRequest requestWithURL:url];
AFHTTPRequestOperation *requestOp = [[AFHTTPRequestOperation alloc] initWithRequest:request];
requestOp.responseSerializer = [AFXMLParserResponseSerializer serializer];
[requestOp.responseSerializer setAcceptableContentTypes:[NSSet setWithObjects:@"application/xml", @"text/xml", @"text/html", nil]];
[requestOp setCompletionBlockWithSuccess:^(AFHTTPRequestOperation *operation, id responseObject) {
    NSXMLParser *xmlparser = responseObject;
    xmlparser.delegate = self; 
    [xmlparser parse]; //Delegate methods are not called for some reason...
} failure:^(AFHTTPRequestOperation *operation, NSError *error) {
    NSLog(@"OOPS: %@", error);
}];
[requestOp start];

我不明白问题出在哪里。

我从-parser:parserErrorOccured:得到一个解析错误

Error Domain=NSXMLParserErrorDomain Code=65 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 65.)" UserInfo=0x8da6ce0 {NSXMLParserErrorLineNumber=2, NSXMLParserErrorColumn=17, NSXMLParserErrorMessage=attributes construct error

}

我该如何解决这个问题?

显然,我从网页上得到的XML并不完美,而且其中有一些奇怪的东西。尽管web浏览器在读取XML时非常宽容,但nsxml解析器非常严格。

为了防止这些奇怪的东西出现,我只需要取一个我想要的部分的子字符串,然后删除空白,比如换行符、回车符和制表符。并进行了一些字符串操作,以确保标签实际上是平衡的。

最新更新