Python:从PNG提取元数据



我能够使用R提取必要的信息,但是为了在整个项目中的一致性,我希望能够与Python(最好是Python3(一起进行。我需要一个名为"设置"的单个标签的内容。此标签包含XML,然后需要解析。

在r中获取元数据非常容易:

library(exifr)
library(XML)
path = file.path('path', 'to', 'file')
x = read_exif(file.path(path,'image.png'))
x$Settings

看起来Python可以做到这一点,这让我感到困惑。或这样做需要我对Python和PNG的了解要比目前要多得多。如何使用Python提取PNG元数据?


这是我尝试过的事情的列表:

pypng PYPNG似乎很有希望。检查每个块的长度,似乎"设置"标签可能存在于ZTXT块中。

import png
filename = "C:\path\to\image.png"
im = png.Reader(filename)
for c in im.chunks():
    print(c[0], len(c[1]))
>>>
IHDR 13
tIME 7
pHYs 9
IDAT 47775
zTXt 714
IEND 0

上面取自该职位。但是,目前尚不清楚如何提取ZTXT数据。

hachoir3

使用hachoir3软件包,我尝试了以下内容:

from hachoir.parser import createParser
from hachoir.metadata import extractMetadata
filename = "C:\path\to\file\image.png"
parser = createParser(filename)
metadata = extractMetadata(parser)
for line in metadata.exportPlaintext():
    print(line)

这给了我以下内容:

Metadata:
- Image width: 1024 pixels
- Image height: 46 pixels
- Bits/pixel: 16
- Pixel format: RGB
- Compression rate: 2.0x
- Image DPI width: 1 DPI
- Image DPI height: 1 DPI
- Creation date: 2016-07-13 19:09:28
- Compression: deflate
- MIME type: image/png
- Endianness: Big endian

我似乎无法进入所需的字段,即R代码中引用的"设置"。我对其他方法(例如metadata.get(没有运气。据我所知,这些似乎是解析PNG元数据的两个选择。文档阅读,

一些好(但不是完美的;-)(解析器:

Matroska视频Microsoft Riff(AVI视频,Wav Audio,CDA文件(PNG 图片焦油和拉链存档

也许它没有我需要的功能?

枕头

遵循本文中给出的建议:

from PIL import Image
filename = "C:\path\to\file\image.png"
im = Image.open(filename)

这在图像中读取,但是im.info仅返回{'aspect': (1, 1)}。仔细阅读文档,看来没有任何方法在元数据上获得。我阅读了帖子中提供的PNG描述。老实说,我不知道如何利用它的信息,也不知道枕头如何促进我。

有些帖子暗示我需要做的事情,但它们不起作用。例如,这篇文章建议使用exiftags库:

from PIL import Image, ExifTags
filename = "C:\path\to\file\image.png"
im = Image.open(filename)
exif = { ExifTags.TAGS[k]: v for k, v in im._getexif().items() if k in ExifTags.TAGS}

问题是AttributeError: 'PngImageFile' object has no attribute '_getexif'。根据文档,._getexif功能是实验性的,仅适用于JPG。

阅读整个枕头文档,实际上只谈论了JPG和TIFF。处理PNG文件似乎根本不是该软件包的一部分。因此,像hachoir一样,也许无法完成?

pil

显然还有另一个包裹的枕头被分叉。看起来它在2009年被废弃。

您可以通过访问已加载的图像的 info dist来获得带有枕头的exif元数据。

从枕头6.0开始,可以从PNG图像读取EXIF数据。但是,与其他图像格式不同,在调用load()之前,不能保证EXIF数据在信息中存在。https://pillow.readthedocs.io/en/stable/handbook/image-file-formats.html#png

from PIL import Image
filename = 'path/to/img'
im = Image.open(filename)
im.load()  # Needed only for .png EXIF data (see citation above)
print(im.info['meta_to_read'])

我正在使用python 3.7和枕头7.1.2来自conda repo。

这是一个不贵和笨拙但有效的解决方案。

从这里改编:https://motherboard.vice.com/en_us/article/aekn58/hack-this-extra-image-metadata-using-python

您可以从python内调用命令行Exiftools应用程序,然后解析结果。

以下是Ubuntu下的Python 3.6.3的代码:

import subprocess
result = subprocess.run(['exiftool', '-h', '/home/jason/Pictures/kitty_mask.png'], stdout=subprocess.PIPE)
print (type(result))
print ("nn",result.stdout)
normal_string = result.stdout.decode("utf-8")
print("nn", normal_string)

它为我的测试图像产生以下结果:

> <class 'subprocess.CompletedProcess'>
> 
> 
>  b'<!-- /home/jason/Pictures/kitty_mask.png
> -->n<table>n<tr><td>ExifTool Version Number</td><td>10.80</td></tr>n<tr><td>File
> Name</td><td>kitty_mask.png</td></tr>n<tr><td>Directory</td><td>/home/jason/Pictures</td></tr>n<tr><td>File
> Size</td><td>25 kB</td></tr>n<tr><td>File Modification
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr>n<tr><td>File
> Access Date/Time</td><td>2018:07:09
> 16:23:24+01:00</td></tr>n<tr><td>File Inode Change
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr>n<tr><td>File
> Permissions</td><td>rw-r--r--</td></tr>n<tr><td>File
> Type</td><td>PNG</td></tr>n<tr><td>File Type
> Extension</td><td>png</td></tr>n<tr><td>MIME
> Type</td><td>image/png</td></tr>n<tr><td>Image
> Width</td><td>2448</td></tr>n<tr><td>Image
> Height</td><td>3264</td></tr>n<tr><td>Bit
> Depth</td><td>8</td></tr>n<tr><td>Color
> Type</td><td>RGB</td></tr>n<tr><td>Compression</td><td>Deflate/Inflate</td></tr>n<tr><td>Filter</td><td>Adaptive</td></tr>n<tr><td>Interlace</td><td>Noninterlaced</td></tr>n<tr><td>Image
> Size</td><td>2448x3264</td></tr>n<tr><td>Megapixels</td><td>8.0</td></tr>n</table>n'
> 
> 
>  <!-- /home/jason/Pictures/kitty_mask.png --> <table> <tr><td>ExifTool
> Version Number</td><td>10.80</td></tr> <tr><td>File
> Name</td><td>kitty_mask.png</td></tr>
> <tr><td>Directory</td><td>/home/jason/Pictures</td></tr> <tr><td>File
> Size</td><td>25 kB</td></tr> <tr><td>File Modification
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr> <tr><td>File
> Access Date/Time</td><td>2018:07:09 16:23:24+01:00</td></tr>
> <tr><td>File Inode Change Date/Time</td><td>2018:07:02
> 09:35:00+01:00</td></tr> <tr><td>File
> Permissions</td><td>rw-r--r--</td></tr> <tr><td>File
> Type</td><td>PNG</td></tr> <tr><td>File Type
> Extension</td><td>png</td></tr> <tr><td>MIME
> Type</td><td>image/png</td></tr> <tr><td>Image
> Width</td><td>2448</td></tr> <tr><td>Image
> Height</td><td>3264</td></tr> <tr><td>Bit Depth</td><td>8</td></tr>
> <tr><td>Color Type</td><td>RGB</td></tr>
> <tr><td>Compression</td><td>Deflate/Inflate</td></tr>
> <tr><td>Filter</td><td>Adaptive</td></tr>
> <tr><td>Interlace</td><td>Noninterlaced</td></tr> <tr><td>Image
> Size</td><td>2448x3264</td></tr>
> <tr><td>Megapixels</td><td>8.0</td></tr> </table>

最新更新