我希望能够读取未知文件类型的前几kb,看看它是否匹配任何已知的文件类型(即mp3文件,jpeg等…)。我想尝试从诸如PIL, sndhdr, py264等库的文件中加载元数据……看看他们是否拾取了任何有效的格式,但我想这一定是以前有人解决过的问题。
是否有一个库或要点显示了多个库的使用情况?
使用python-magic
进行指纹识别。
库只能从字节数据确定文件类型:
import magic
magic.from_buffer(start_data_from_something)
该库提供对libmagic
文件类型识别库的访问,该库还驱动UNIX file
命令。