如何确定Python中常见图像类型的类型和大小



我正在开发一组用于处理Microsoft Office Open XML文档的库。在Word和PowerPoint文档中嵌入图片的过程中,我需要确定图像的MIME类型和一些标题细节,如像素尺寸、dpi也很好。

目前我正在使用Pillow来做这件事,但就依赖性而言,这并不理想。我只对库使用了几条语句,但依赖性要求人们安装C编译器和像libjpeg这样的图像库。这使得在Windows上的安装特别具有挑战性,尽管即使在OS X上,它也比我想要的更复杂。

有没有一种方法可以让我使用纯Python映像库获得基本知识,或者只是将一个相当简单的模块与我的发行版合并?

首先,使用Pillow可能是最好的解决方案,尤其是因为您可以从pypi下载windows二进制文件。

快速的谷歌搜索产生了这个纯python函数,可以获得GIF、PNG和JPEG图像的大小:

import struct
from cStringIO import StringIO

def get_image_info(data):
    """
    Return (content_type, width, height) for a given img file content
    no requirements
    """
    data = str(data)
    size = len(data)
    height = -1
    width = -1
    content_type = ''
    # handle GIFs
    if (size >= 10) and data[:6] in ('GIF87a', 'GIF89a'):
        # Check to see if content_type is correct
        content_type = 'image/gif'
        w, h = struct.unpack("<HH", data[6:10])
        width = int(w)
        height = int(h)
    # See PNG 2. Edition spec (http://www.w3.org/TR/PNG/)
    # Bytes 0-7 are below, 4-byte chunk length, then 'IHDR'
    # and finally the 4-byte width, height
    elif ((size >= 24) and data.startswith('211PNGrn32n')
          and (data[12:16] == 'IHDR')):
        content_type = 'image/png'
        w, h = struct.unpack(">LL", data[16:24])
        width = int(w)
        height = int(h)
    # Maybe this is for an older PNG version.
    elif (size >= 16) and data.startswith('211PNGrn32n'):
        # Check to see if we have the right content type
        content_type = 'image/png'
        w, h = struct.unpack(">LL", data[8:16])
        width = int(w)
        height = int(h)
    # handle JPEGs
    elif (size >= 2) and data.startswith('377330'):
        content_type = 'image/jpeg'
        jpeg = StringIO(data)
        jpeg.read(2)
        b = jpeg.read(1)
        try:
            while (b and ord(b) != 0xDA):
                while (ord(b) != 0xFF): b = jpeg.read
                while (ord(b) == 0xFF): b = jpeg.read(1)
                if (ord(b) >= 0xC0 and ord(b) <= 0xC3):
                    jpeg.read(3)
                    h, w = struct.unpack(">HH", jpeg.read(4))
                    break
                else:
                    jpeg.read(int(struct.unpack(">H", jpeg.read(2))[0])-2)
                b = jpeg.read(1)
            width = int(w)
            height = int(h)
        except struct.error:
            pass
        except ValueError:
            pass
    return content_type, width, height

请注意,该博客上的代码是由Emmanuel VAÍSSE编写的。他的博客上没有指定许可证,所以根据你想在哪里包含代码,你可能会想要重新实现该功能或要求他在安全的网站上。

相关内容

  • 没有找到相关文章

最新更新