为什么当 TStringStream 加载二进制非文本文件时,使用 TStringStream.DataString 失


  1. 正如专家们善意建议的那样,TStringStream.DataString不能用于检索TStringStream.LoadFromFile加载non-text数据,因为TStringStream.GetDataString会调用TEncoding的编码方法,以TMBCSEncoding为例,这些编码方法将调用TMBCSEncoding.GetChars,而又调用TMBCSEncoding.UnicodeFromLocaleChars,最后调用WindowsMultiByteToWideChar

  2. 建议将字节
  3. 用作数据缓冲区/二进制存储。(为此,建议使用 TBytes 而不是 AnsiString。

  4. 可以从TStringStream.ReadBuffer方法或TStringStream.Bytes属性中检索bytes。无论哪种方式,都应该考虑TStream.Size

====

======================================================

我正在尝试将TStringStream及其DataString用于base64编码/解码目的。正如Nils Haeck在这里或这里得到的答复所表明的那样,这似乎是可能的。

  1. TMainForm.QuestionOfString_StringStream中使用TStringStream.DataString(第 2 号到第 7 号)失败,因为信息已损坏(即,与原始信息不同)。但是,ss_loaded_2.SaveToFile(No.1)保存了原始信息,表明TStringStream内部正确保存了解码的非文本数据?您能帮忙评论一下数据字符串损坏的可能原因吗?

  2. Rob Kennedy的善意回答中,他提到在存储base64解码的非文本数据时应该避免stringansistring,这很有意义。但是,如TMainForm.QuestionOfString_NativeXML所示,AnsiString类型的DecString包含解码的字节,因此可以正确地编码回数据。这是否意味着AnsiString可以完整地保存解码的非文本数据?

  3. David HeffernanRob Kennedy对字节/字节发表了友好的评论。但是,bytesTMainForm.QuestionOfString_NativeXML_Bytes_1中提取的,与TStringStreamTMainForm.QuestionOfString_NativeXML_Bytes_2中提取的Bytes不同。(从 Base64 编码/解码结果来看,TStringStream.Bytes是错误的。这令人困惑,因为基于上述段落,TStringStream内部应该包含完整的字节?你能帮忙评论一下可能的原因吗?

非常感谢您的帮助!

PS:示例文件可以从SkyDrive下载:REF_EncodedSample和REF_DecodedSample。(Zlib压缩的图像文件。

PS:Delphi XE,Windows 7。(似乎 Delphi 7 中的 TStringStream 没有 LoadFromFile 或 SaveToFile。

示例代码

unit uMainForm;
interface
uses
  CodeSiteLogging,
  NativeXml, // v3.10
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs;
type
  TMainForm = class(TForm)
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
    procedure QuestionOfString_StringStream;
    procedure QuestionOfString_NativeXML;
    procedure QuestionOfString_NativeXML_Bytes_1;
    procedure QuestionOfString_NativeXML_Bytes_2;
  public
    { Public declarations }
  end;
var
  MainForm: TMainForm;
implementation
{$R *.dfm}    
// http://stackoverflow.com/questions/773297/how-can-i-convert-tbytes-to-rawbytestring
function Convert(const Bytes: TBytes): RawByteString;
begin
  SetLength(Result, Length(Bytes));
  if Length(Bytes) > 0 then
  begin
    Move(Bytes[0], Result[1], Length(Bytes));
    // SetCodePage(Result, CP_ACP, False);
  end;
end;
procedure TMainForm.FormCreate(Sender: TObject);
begin
  QuestionOfString_StringStream;
  QuestionOfString_NativeXML;
  QuestionOfString_NativeXML_Bytes_1;
  QuestionOfString_NativeXML_Bytes_2;
end;
// http://www.delphigroups.info/2/3/321962.html
// http://borland.newsgroups.archived.at/public.delphi.graphics/200712/0712125679.html
procedure TMainForm.QuestionOfString_StringStream;
var
  ss_loaded_2, ss_loaded_3: TStringStream;
  dataStr: AnsiString;
  hexOfDataStr: AnsiString;
begin
  ss_loaded_2 := TStringStream.Create();
  // load the file containing Base64-decoded sample data
  ss_loaded_2.LoadFromFile('REF_DecodedSample');
  // 1  
  ss_loaded_2.SaveToFile('REF_DecodedSample_1_SavedByStringStream');
  // 2 
  ss_loaded_3 := TStringStream.Create(ss_loaded_2.DataString);
  ss_loaded_3.SaveToFile('REF_DecodedSample_2_SavedByStringStream');
  // 3     
  ss_loaded_3.Free;
  ss_loaded_3 := TStringStream.Create(ss_loaded_2.DataString, TEncoding.ASCII);
  ss_loaded_3.SaveToFile('REF_DecodedSample_3_SavedByStringStream');
  // 4     
  ss_loaded_3.Free;
  ss_loaded_3 := TStringStream.Create(ss_loaded_2.DataString, TEncoding.UTF8);
  ss_loaded_3.SaveToFile('REF_DecodedSample_4_SavedByStringStream');
  // 5     
  ss_loaded_3.Free;
  ss_loaded_3 := TStringStream.Create(AnsiString(ss_loaded_2.DataString));
  ss_loaded_3.SaveToFile('REF_DecodedSample_5_SavedByStringStream');
  // 6     
  ss_loaded_3.Free;
  ss_loaded_3 := TStringStream.Create(UTF8String(ss_loaded_2.DataString));
  ss_loaded_3.SaveToFile('REF_DecodedSample_6_SavedByStringStream');
  // 7 
  dataStr := ss_loaded_2.DataString;
  SetLength(hexOfDataStr, 2 * Length(dataStr));
  BinToHex(@dataStr[1], PAnsiChar(@hexOfDataStr[1]), Length(dataStr));
  CodeSite.Send(hexOfDataStr);
  ss_loaded_2.Free;
  ss_loaded_3.Free;
end;
// http://www.simdesign.nl/forum/viewtopic.php?f=2&t=1311
procedure TMainForm.QuestionOfString_NativeXML;
var
  LEnc, LDec: integer;
  EncStream: TMemoryStream;
  DecStream: TMemoryStream;
  EncString: AnsiString;
  DecString: AnsiString;
begin
  // encode and decode streams
  EncStream := TMemoryStream.Create;
  DecStream := TMemoryStream.Create;
  try
    // load BASE64-encoded data
    EncStream.LoadFromFile('REF_EncodedSample');
    LEnc := EncStream.Size;
    SetLength(EncString, LEnc);
    EncStream.Read(EncString[1], LEnc);
    // decode BASE64-encoded data, after removing control chars
    DecString := DecodeBase64(sdRemoveControlChars(EncString));
    LDec := length(DecString);
    DecStream.Write(DecString[1], LDec);
    // save the decoded data
    DecStream.SaveToFile('REF_DecodedSample_7_SavedByNativeXml');
    // EncString := sdAddControlChars(EncodeBase64(DecString), #$0D#$0A);
    EncString := EncodeBase64(DecString);
    // clear and resave encode stream as a copy
    EncStream.Clear;
    EncStream.Write(EncString[1], Length(EncString));
    EncStream.SaveToFile('REF_EncodedSampleCopy');
  finally
    EncStream.Free;
    DecStream.Free;
  end;
end;
procedure TMainForm.QuestionOfString_NativeXML_Bytes_1;
var
  LEnc, LDec: integer;
  EncStream: TMemoryStream;
  DecStream: TMemoryStream;
  EncString: AnsiString;
  DecString: AnsiString;
  DecBytes: TBytes;
begin
  // encode and decode streams
  EncStream := TMemoryStream.Create;
  DecStream := TMemoryStream.Create;
  try
    // load BASE64-decoded data
    DecStream.LoadFromFile('REF_DecodedSample');
    LDec := DecStream.Size;
    SetLength(DecBytes, LDec);
    DecStream.Read(DecBytes[0], LDec);
    EncString := EncodeBase64(Convert(DecBytes));
    // clear and resave encode stream as a copy
    EncStream.Write(EncString[1], Length(EncString));
    EncStream.SaveToFile('REF_EncodedSampleCopy_Bytes_1');
  finally
    EncStream.Free;
    DecStream.Free;
  end;
end;
procedure TMainForm.QuestionOfString_NativeXML_Bytes_2;
var
  LEnc, LDec: integer;
  EncStream: TMemoryStream;
  DecStream: TStringStream;
  EncString: AnsiString;
  DecString: AnsiString;
  DecBytes: TBytes;
begin
  // encode and decode streams
  EncStream := TMemoryStream.Create;
  DecStream := TStringStream.Create;
  try
    // load BASE64-decoded data
    DecStream.LoadFromFile('REF_DecodedSample');
    DecBytes := DecStream.Bytes;
    EncString := EncodeBase64(Convert(DecBytes));
    // clear and resave encode stream as a copy
    EncStream.Write(EncString[1], Length(EncString));
    EncStream.SaveToFile('REF_EncodedSampleCopy_Bytes_2');
  finally
    EncStream.Free;
    DecStream.Free;
  end;
end;
end.

示例 3 到 7 失败也就不足为奇了。您的文件不是文本数据,因此将其存储在文本数据结构中必然会出现问题。这些测试中的每一个都涉及将数据从一种编码转换为另一种编码。由于您的数据一开始就未编码为 UTF-16 文本,因此任何期望数据具有该编码的转换都将失败。

示例 2 可能会失败,因为您有一个奇数字节数,并且您将其存储在一个字符串中,根据定义,该字符串包含偶数个字节。在某处,将引入或删除一个字节,从而导致存储不同的数据。

除非您正在处理文本,否则不要使用 TStringStreamstringAnsiString 。请尝试TBytesStreamTMemoryStream

随意将 Base64 编码的数据存储在字符串中。Base64 是一种文本格式。但是一旦你解码它,它又是二进制的,并且不再在文本数据结构中。

你现在看到的结果与Nils Haeck建议的不同原因是,Haeck是在2007年编写的,在Delphi字符串成为Unicode之前,RTL进行了任何自动代码页转换。您正在使用德尔福XE,其中string UnicodeString

您没有考虑到TStringStream派生自 D2009+ 中的 TMemoryStreamTByteStream,而是直接派生自早期版本中的TStreamTMemoryStream分配内存的方式与代码预期的不同,TByteStream.Bytes 属性表示TMemoryStream分配的整个内存块,但这并不意味着该内存的全部内容都用实际数据填充。 涉及一些额外的填充,您的代码需要忽略。

请参阅我对你另一个问题的回答,以更详细地解释你的代码失败的原因。

最新更新