我想在Java中读取二进制文件。我知道该文件包含一系列的数据结构:ANSI ASCII字节串,Integer, ANSI ASCII字节串。我如何读取和获取文件的数据,即使我们假设数据结构的数量已经已知(N)?我看到接口DataInput有一个读取String的方法readUTF(),但是它使用UTF-8格式。我们如何处理ASCII码的大小写?
我认为最灵活(和有效)的方法是:
- 打开
FileInputStream
. - 使用流的
getChannel()
方法获取FileChannel
- 使用通道的
map()
方法将通道映射到MappedByteBuffer
。 - 通过缓冲区的各种
get*
方法访问数据。
try
public static void main(String[] args) throws Exception {
int n = 10;
InputStream is = new FileInputStream("bin");
for (int i = 0; i < n; i++) {
String s1 = readAscii(is);
int i1 = readInt(is);
String s2 = readAscii(is);
}
}
static String readAscii(InputStream is) throws IOException, EOFException,
UnsupportedEncodingException {
ByteArrayOutputStream out = new ByteArrayOutputStream();
for (int b; (b = is.read()) != 0;) {
if (b == -1) {
throw new EOFException();
}
out.write(b);
}
return new String(out.toByteArray(), "ASCII");
}
static int readInt(InputStream is) throws IOException {
byte[] buf = new byte[4];
int n = is.read(buf);
if (n < 4) {
throw new EOFException();
}
ByteBuffer bbf = ByteBuffer.wrap(buf);
bbf.order(ByteOrder.LITTLE_ENDIAN);
return bbf.getInt();
}
我们如何处理ASCII的情况?
你可以用readFully()来处理它。
NB readUTF()用于由DataOutput.writeUTF()创建的特定格式,据我所知没有其他格式。