我正在尝试在Android应用程序中解析xml文件。当我尝试处理它时,除了START之后的START_DOCUMENT和END_DOCUMENT之外,我不会收到eventType。看起来我会送一个空文件什么的。奇怪的是,我在5个不同的xml文件上尝试了这段代码,对于损坏的文件(缺少一些结束标记(,它起了作用(起了作用,我的意思是我得到的事件类型与START和END不同(。我在想,也许我创建了错误的xml文件,但我甚至下载了一些示例xml文件,它也不起作用。
某些代码:
public static void parseXML(Activity activity) throws XmlPullParserException, IOException {
XmlPullParserFactory parserFactory;
parserFactory = XmlPullParserFactory.newInstance();
parserFactory.setNamespaceAware(true);
XmlPullParser parser = parserFactory.newPullParser();
InputStream inputStream = activity.getAssets().open("XML_RENAME.xml");
InputStreamReader isReader = new InputStreamReader(inputStream);
BufferedReader reader = new BufferedReader(isReader);
parser.setInput(reader);
processParces(parser);
}
private static void processParces(XmlPullParser parser) throws XmlPullParserException, IOException {
int eventType = parser.getEventType();
String tagname = "";
String text = "";
while(eventType != XmlPullParser.END_DOCUMENT)
{
tagname = parser.getName();
switch(eventType)
{
case XmlPullParser.START_TAG:
if (tagname.equalsIgnoreCase(KEY_REGION)) {
}
break;
case XmlPullParser.TEXT:
//grab the current text so we can use it in END_TAG event
text = parser.getText();
Log.e("Text: ", text);
break;
case XmlPullParser.END_TAG:
if (tagname.equalsIgnoreCase(KEY_SECTOR)) {
Log.e("XML ",KEY_SECTOR);
} else if (tagname.equalsIgnoreCase(KEY_DIRECTIONS)) {
Log.e("XML ",KEY_DIRECTIONS );
} else if (tagname.equalsIgnoreCase(KEY_CONDITIONS)) {
Log.e("XML ",KEY_CONDITIONS );
} else if (tagname.equalsIgnoreCase(KEY_NEIGHBORS)) {
Log.e("XML ",KEY_NEIGHBORS );
} else if (tagname.equalsIgnoreCase(KEY_CONTINUATIONS)) {
Log.e("XML ",KEY_CONTINUATIONS );
} else if (tagname.equalsIgnoreCase(KEY_BLOCKS)) {
Log.e("XML ",KEY_BLOCKS );
}
break;
default:
break;
}
eventType = parser.next();
}
}
我发现了一个问题。一些xml文件在开头包含一些额外的字节,具体来说就是"EF BB BF"。它被称为BOM(Byte-Order-Mark
(。当xml包含这些额外的字节时,我们的XmlPullParser
无法正常工作,表现得像没有START_TAG事件一样,并转到END_DOCUMENT。