Python,忽略没有Exif数据的文件



我正在尝试对GPS exif数据进行大规模提取,我的代码如下:

from PIL import Image 
from PIL.ExifTags import TAGS, GPSTAGS
def get_exif_data(image):
exif_data = {}
info = image._getexif()
if info:
for tag, value in info.items():
decoded = TAGS.get(tag, tag)
if decoded == "GPSInfo":
gps_data = {}
for t in value:
sub_decoded = GPSTAGS.get(t, t)
gps_data[sub_decoded] = value[t]
exif_data[decoded] = gps_data
else:
exif_data[decoded] = value
return exif_data 
def _get_if_exist(data, key):
if key in data:
return data[key]
else: 
pass
def get_lat_lon(exif_data):
gps_info = exif_data["GPSInfo"]
lat = None
lon = None
if "GPSInfo" in exif_data:
gps_info = exif_data["GPSInfo"]
gps_latitude = _get_if_exist(gps_info, "GPSLatitude")
gps_latitude_ref = _get_if_exist(gps_info, "GPSLatitudeRef")
gps_longitude = _get_if_exist(gps_info, "GPSLongitude")
gps_longitude_ref = _get_if_exist(gps_info, "GPSLongitudeRef")
if gps_latitude and gps_latitude_ref and gps_longitude and gps_longitude_ref:
lat = _convert_to_degrees(gps_latitude)
if gps_latitude_ref != "N":
lat = 0 - lat
lon = _convert_to_degrees(gps_longitude)
if gps_longitude_ref != "E":
lon = 0 - lon
return lat, lon

代码源

运行方式如下:

if __name__ == "__main__":
image = Image.open("photo directory")
exif_data = get_exif_data(image)
print(get_lat_lon(exif_data)

这适用于一张照片,所以我使用 glob 遍历文件中的所有照片:

import glob
file_names = []
for name in glob.glob(photo directory):
file_names.append(name)
for item in file_names: 
if __name__ == "__main__":
image = Image.open(item)
exif_data = get_exif_data(image)
print(get_lat_lon(exif_data))
else:
pass 

只要文件中的每张照片都是a(图像和b(具有GPS数据,就可以正常工作。我尝试在_get_if_exist函数以及我的文件迭代中添加传递,但是,两者都没有任何影响,我仍然收到KeyError: 'GPSInfo'

关于如何忽略没有数据或不同文件类型的照片的任何想法?

一种可能的方法是编写一个小的帮助程序函数,该函数首先检查文件是否实际上是图像文件,第二步检查图像是否包含EXIF数据。

def is_metadata_image(filename):
try:
image = Image.open(filename)
return 'exif' in image.info
except OSError:
return False

我发现 PIL 在使用_getexif()时每次都不适用于包含 EXIF 信息.png文件。因此,我改为检查图像info字典中的键exif

我已经尝试过这个源代码。 只需删除

gps_info = exif_data["GPSInfo"]

get_lat_lon(exif_data)功能的第一行开始,它对我来说效果很好。

最新更新