我正在开发一组用于处理Microsoft Office Open XML文档的库。在Word和PowerPoint文档中嵌入图片的过程中,我需要确定图像的MIME类型和一些标题细节,如像素尺寸、dpi也很好。
目前我正在使用Pillow来做这件事,但就依赖性而言,这并不理想。我只对库使用了几条语句,但依赖性要求人们安装C编译器和像libjpeg这样的图像库。这使得在Windows上的安装特别具有挑战性,尽管即使在OS X上,它也比我想要的更复杂。
有没有一种方法可以让我使用纯Python映像库获得基本知识,或者只是将一个相当简单的模块与我的发行版合并?
首先,使用Pillow可能是最好的解决方案,尤其是因为您可以从pypi下载windows二进制文件。
快速的谷歌搜索产生了这个纯python函数,可以获得GIF、PNG和JPEG图像的大小:
import struct
from cStringIO import StringIO
def get_image_info(data):
"""
Return (content_type, width, height) for a given img file content
no requirements
"""
data = str(data)
size = len(data)
height = -1
width = -1
content_type = ''
# handle GIFs
if (size >= 10) and data[:6] in ('GIF87a', 'GIF89a'):
# Check to see if content_type is correct
content_type = 'image/gif'
w, h = struct.unpack("<HH", data[6:10])
width = int(w)
height = int(h)
# See PNG 2. Edition spec (http://www.w3.org/TR/PNG/)
# Bytes 0-7 are below, 4-byte chunk length, then 'IHDR'
# and finally the 4-byte width, height
elif ((size >= 24) and data.startswith('211PNGrn 32n')
and (data[12:16] == 'IHDR')):
content_type = 'image/png'
w, h = struct.unpack(">LL", data[16:24])
width = int(w)
height = int(h)
# Maybe this is for an older PNG version.
elif (size >= 16) and data.startswith('211PNGrn 32n'):
# Check to see if we have the right content type
content_type = 'image/png'
w, h = struct.unpack(">LL", data[8:16])
width = int(w)
height = int(h)
# handle JPEGs
elif (size >= 2) and data.startswith('377330'):
content_type = 'image/jpeg'
jpeg = StringIO(data)
jpeg.read(2)
b = jpeg.read(1)
try:
while (b and ord(b) != 0xDA):
while (ord(b) != 0xFF): b = jpeg.read
while (ord(b) == 0xFF): b = jpeg.read(1)
if (ord(b) >= 0xC0 and ord(b) <= 0xC3):
jpeg.read(3)
h, w = struct.unpack(">HH", jpeg.read(4))
break
else:
jpeg.read(int(struct.unpack(">H", jpeg.read(2))[0])-2)
b = jpeg.read(1)
width = int(w)
height = int(h)
except struct.error:
pass
except ValueError:
pass
return content_type, width, height
请注意,该博客上的代码是由Emmanuel VAÍSSE编写的。他的博客上没有指定许可证,所以根据你想在哪里包含代码,你可能会想要重新实现该功能或要求他在安全的网站上。