istream_iterator,用于遍历二进制文件中的字节



给定一个包含以下十六进制代码的文件:0B 00 00 00 00 20 41

我正在尝试填充std::vector<;std::uint8_t>,然后手动检查每个字节。

以下是我使用迭代器构造函数从两个std::istream_iterator创建向量的代码

using Bytes   = std::vector<std::uint8_t>;
using ByteItr = std::istream_iterator<std::uint8_t>;
Bytes getBytes()
{
    std::ifstream in;
    in.open("filepath");
    in.seekg(0, std::ios::beg);
    Bytes bytes;
    ByteItr start(in);
    ByteItr end;
    return Bytes(start, end);
}

这是我试图通过的单元测试:

auto bytes = getBytes();
REQUIRE( bytes.size() == 8 );
CHECK( bytes[0] == 0x0B );
CHECK( bytes[1] == 0x00 );
CHECK( bytes[2] == 0x00 );
CHECK( bytes[3] == 0x00 );
CHECK( bytes[4] == 0x00 );
CHECK( bytes[5] == 0x00 );
CHECK( bytes[6] == 0x20 );
CHECK( bytes[7] == 0x41 );

为什么在这种情况下,它跳过两个元素,并隐式地将我的std::uint8_t向量转换为无符号字符?

istream_iterator不应用于读取二进制文件。它使用operator>>,它也不适合读取二进制文件(除非这些文件的格式非常特殊,而大多数二进制文件都不适合)。您可以改用istreambuf_iterator。您还需要确保以二进制模式打开文件。

in.open("filepath", std::ios::in | std::ios::binary);

不要使用用于文本格式输入的std::istream_iterator<T>。例如,它很可能会跳过空格(您可以使用std::noskipws禁用跳过空格,但这仍然是错误的做法-使用std::istreambuf_iterator<char>;类型char是流的字符类型)。

此外,在处理二进制数据时,请确保以二进制模式打开流,以避免行端转换(如果您在进行行端转换的平台上尝试这样做)。也就是说,您可以将std::ios_base::binary添加到打开模式。

最新更新