从实现Read的类型中读取任意数量的字节



我有一些东西是Read;目前是File。我想从它读取一些只在运行时已知的字节(二进制数据结构中的长度前缀)。

所以我试了这个:

let mut vec = Vec::with_capacity(length);
let count = file.read(vec.as_mut_slice()).unwrap();

但是count是零,因为vec.as_mut_slice().len()也是零。

[0u8;length]当然不行,因为必须在编译时知道它的大小。

我想做

let mut vec = Vec::with_capacity(length);
let count = file.take(length).read_to_end(vec).unwrap();

但是take的接收器参数是T,我只有&mut T(我不确定为什么需要它)。

我想我可以用BufReader代替File,用fill_bufconsume跳舞,这听起来很复杂,但我仍然想知道:我忽视了什么吗?

与Iterator适配器一样,IO适配器按值取self以尽可能高效。和Iterator适配器一样,对Read的可变引用也是Read

要解决您的问题,您只需输入Read::by_ref:

use std::io::Read;
use std::fs::File;
fn main() {
    let mut file = File::open("/etc/hosts").unwrap();
    let length = 5;
    let mut vec = Vec::with_capacity(length);
    file.by_ref().take(length as u64).read_to_end(&mut vec).unwrap();
    let mut the_rest = Vec::new();
    file.read_to_end(&mut the_rest).unwrap();
}

Fill-this-vector版本

你的第一个解决方案是接近工作。您发现了问题,但没有尝试解决它!问题是,无论vector的容量是多少,它仍然是空的(vec.len() == 0)。相反,您可以用空元素填充它,例如:

let mut vec = vec![0u8; length];

完整代码如下:

#![feature(convert)] // needed for `as_mut_slice()` as of 2015-07-19
use std::fs::File;
use std::io::Read;
fn main() {
    let mut file = File::open("/usr/share/dict/words").unwrap();
    let length: usize = 100;
    let mut vec = vec![0u8; length];
    let count = file.read(vec.as_mut_slice()).unwrap();
    println!("read {} bytes.", count);
    println!("vec = {:?}", vec);
}

当然,您仍然需要检查是否count == length,如果不是,则读入更多的数据到缓冲区。


2。迭代器版本

第二个解决方案更好,因为您不必检查已读取了多少字节,并且您不必在count != length的情况下重新读取。您需要在Read特性上使用bytes()函数(由File实现)。这将文件转换成一个流(即迭代器)。因为仍然可能发生错误,所以您得到的不是Iterator<Item=u8>,而是Iterator<Item=Result<u8, R::Err>>。因此,您需要在迭代器中显式地处理失败。为了简单起见,我们将使用unwrap():

use std::fs::File;
use std::io::Read;
fn main() {
    let file = File::open("/usr/share/dict/words").unwrap();
    let length: usize = 100;
    let vec: Vec<u8> = file
        .bytes()
        .take(length)
        .map(|r: Result<u8, _>| r.unwrap()) // or deal explicitly with failure!
        .collect();
    println!("vec = {:?}", vec);
}

您总是可以使用一点unsafe来创建未初始化内存的向量。使用基本类型是完全安全的:

let mut v: Vec<u8> = Vec::with_capacity(length);
unsafe { v.set_len(length); }
let count = file.read(vec.as_mut_slice()).unwrap();

这样,vec.len()将被设置为它的容量,并且其中的所有字节将被未初始化(可能是零,但可能是一些垃圾)。这样就可以避免内存归零,这对于基本类型来说是相当安全的。

注意,Read上的read()方法不能保证填充整个切片。它有可能返回的字节数小于切片长度。有几个rfc关于添加方法来填补这个空白,例如,这个。

最新更新