我正在使用元数据提取器来编写一个Java应用程序,用于组织图像并查找重复项。API 很棒,但有些事情我无法弄清楚。
假设我有两个JPG图像。这些图像在视觉上是完全相同的(即相同的像素)。但是,文件中封装的元数据中的某些内容可能有所不同。
如果我计算每个完整文件的 MD5 哈希,我将得到两个不同的哈希。但是,我想计算仅图像/像素数据的哈希值,这将为两个文件产生相同的哈希值。
那么 - 有没有办法使用元数据提取器从 JPG 中提取原始图像/像素数据,以便我可以计算我的哈希值?
另外,Javadoc 是否可用于此 API?我似乎找不到它。
库的JpegSegmentReader
类来实现此目的。它将允许您提取包含图像数据的 JPEG 片段并忽略元数据片段。
我在另一个答案中讨论了这种技术,提问者表示他们在这种方法上取得了成功。
这实际上将为库提供一个很好的示例应用程序。如果你想出一些东西并想分享,请去做。