关于如何解码数据包的线索和建议



去年我收到了一份礼物,那是一台支持wifi的索尼CMT700Ni音频站。它还能够播放类似的功能,称为"PartyStreaming"。我目前正在深入挖掘,探索它,这样也许我就可以拥有自己的"PartyStreaming"功能设备,并免费拥有类似AirPlay的功能(挑战也很有趣)

PartyStreaming是一种基于SOAP的服务,非常容易理解。有4个主要功能,分为2组:服务器端和客户端。每组中的2个函数表示启动与另一侧的连接或结束连接(服务器启动/停止,客户端加入/离开)

事实上,我已经走得很远了,因为我现在能够访问服务器——音频站——正在网络上传播的音频数据。看起来,在使用soap方法加入服务器之后,客户端必须在端口3975上向服务器发送UDP数据包。收到后,服务器通过向同一端口上的客户端发送数据包进行30秒的回复。

在看了大约一百个之后,我发现一个典型的数据包是1024字节长,其中有一个64字节的报头,一个64个字节的0填充,然后是896个字节的声音数据。

我现在有了数据,但它看起来像是一堆随机写入的字节。没有编解码器信息,没有结构,没有"chunck格式"(就像在波形文件中一样)。我找不到任何关于该协议的好文档或任何与"PartyStreaming"相关的技术资料。

我的问题是:"嘿,StackOverflow,有什么建议吗?有什么线索吗?我应该放弃吗?或者你有我可以测试的想法吗?">


可以使用的东西:

  • 主题说明:http://pastebin.com/pp8aRQrR

  • 不带标头的数据包转储:http://cl.ly/430H2i001K3R

  • 转储具有标头和某些格式的数据包以读取它们:http://cl.ly/2i2F2c3E3W3C


我现在要测试的东西:

  • 将UDP数据包捕获为客户端,然后启动服务器并将数据发送到我的音频站,看看它是否可以读取数据;也许有一个服务器端加密,如果是的话,我被卡住了

  • 构建一个1kHz的文件,并在音频站上播放;捕获数据包并观察其字节,也许可以与用许多编解码器编码的同一文件进行比较,以找到模式。。。

由于您的比特率很高,数据可能会被解压缩。如果是这种情况,那么您的数据字节并不是真正随机的——至少它们不是均匀分布的。

尝试以不同的分辨率重建样本(即读取带符号的int)(8位、16位,可能介于两者之间)。对许多数据包执行此操作,计算并显示直方图(对于8位:计算有多少-128,有多少-126…有多少127)。

您应该为每个可能的值收集至少100个样本(比如8位:12800个样本),以获得良好的统计数据。然后看看你的直方图。如果它是平坦的,并且所有值的出现次数大致相同,那么它将被压缩/加密,或者您在每个样本中选择了错误的位。如果某些值的出现次数明显多于或少于其他值:宾果,那就是未压缩的声音样本!

如果你得到每个样本所有比特的平面直方图,它会变得更难。您可以尝试将100kb的数据转储到一个文件中,并通过linux/unixfile命令运行它,看看它是否标识了格式。它可能识别压缩。然后,您必须解压缩并使用未压缩的流重复整个过程:分析直方图并运行file

还可以尝试通过vlc、mplayer、ffplay运行它,这些程序可以利用丰富的库(如ffmpeg),并可能识别流或在调试输出中为您提供有用的消息。

不管怎样,如果它是加密的,你就完蛋了。。。或者至少我怀疑这种努力是否值得;)

您可能需要猜测一种格式。首先,看看比特率。你每秒得到多少字节?这将帮助您计算它可能是PCM,还是压缩格式。

您应该能够很容易地排除PCM。将一堆音频数据包放入一个具有不同标题的WAV文件中(例如44.1kHz/32kHz、16kHz、16bit/8bit、单声道/立体声),看看你们是否听到了与音乐极为相似的声音。

如果这不起作用,您将需要猜测压缩格式。MP3可能值得一试(你可以通过查看每个数据包中的前四个字节是否是帧头来识别它)。

你可能会发现它支持多种格式,因为文档似乎建议你可以从Windows Media player播放它。因此,您可以查看64字节的标头,并查看当您向其发送以不同格式编码的文件时会发生什么变化

最新更新