比较相对不同的图片(网站)之间的相似性



我希望计算网站的两个截图之间的某种'%相似度'。我特别想计算一个特定的网站如何随着时间的推移而变化(即确定哪些网站倾向于保持一致的外观),并将一个网站的外观与一堆类似类别的其他网站(例如所有新闻网站)进行比较,以了解它与其他网站的区别。[我想到的一个应用是分析"新闻"网站的演变——许多博客看起来都很相似,而一些新闻网站却很有特色,并且随着时间的推移发生了很大的变化]

有相当多的其他堆栈溢出比较图像的相似性-然而,他们往往集中在检测相同/非常相似的图像(例如图像比较-快速算法或图像相似性比较)。相比之下,我希望在差异很大的图像之间确定某种分数。因此,一些方法,如散列/关键点匹配可能被排除在外(即,因为两个图像可能不完全共享任何关键点,但仍然可能看起来非常相似,至少在眼睛上)

注:我目前的头脑风暴是使用颜色直方图方法,可能使用相对粗糙的颜色桶,因为许多颜色相对难以区分(例如将网站转换为256色)。也可能比较一个网站是倾向于只由一种颜色主导,还是有各种各样的颜色。

我可能会使用页面顶部的HOG(高斯直方图)(固定大小)。这将成为该网站的一大"特色"。然后可以计算不同样本之间的HOG置信度。

最新更新