google搜图功能(2021年Google图片搜索的原理)
-
技术知识
- 2024-04-16 05:57:19
- 3
摘要:
google搜图功能(2021年Google图片搜索的原理)2021年的Google Photo搜索原则为了回答这个问题,我询问...
google搜图功能(2021年Google图片搜索的原理)
2021年的Google Photo搜索原则
为了回答这个问题,我询问了算法小组中的同事,他分享了基本思想:
对于此图像搜索算法,通常是三个步骤:
1.提取目标图像特征。有许多描述图像的算法。越多的用途是:SIFT描述符,指纹算法函数,BundlingFeatures算法,HashFunction等。您还可以根据不同的图像设计不同的算法,例如使用局部N式扭矩的方法来提取图像特征。
2.编码图像特征信息并将大量图像编码作为搜索表。对于目标图像,可以减少大量分辨率图像,并且在减少计算量后可以减少图像特征提取和编码处理。
3.相似性匹配计算:使用目标图像的编码值,图像搜索引擎中的图像数据库进行全局或局部相似性计算;根据所需的鲁棒性,设置阈值,然后相似性将很高。最后,应该有一个步骤来筛选最佳匹配图片。这仍然应用于功能测试算法。
每个步骤中都有许多算法研究,重点是数学,统计,图像编码,信号处理和其他理论等理论。
以下是Huazi Google优化的最简单实现:
如果您输入Google图片的URL或直接上传图片,则Google会找到类似的图片。下面的图片是美国女演员Alysonhannigan。
Google照片搜索的原理和优化技能
上传后,Google返回以下结果:
Google照片搜索的原理和优化技能
该技术的原理是什么?计算机如何知道两张图片相似?
根据Nealkrawetz博士的说法,该原理非常简单易懂。我们可以使用快速算法来获得基本结果。
这里的关键技术称为“ ConceptualHalgorithm”。它的作用是为每张图片生成一个“指纹”字符串,然后比较不同图片的指纹。结果越接近,图片就越相似。
以下是最简单的实现:
第一步是减小尺寸。
将图片的大小减少到8x8,总共有64个像素。此步骤的作用是删除图片的详细信息。只有基本信息,例如结构,光和黑暗等,放弃了不同大小和比例带来的图片之间的差异。
Google照片搜索的原理和优化技能
第二步是简化颜色。
将简化的图片转换为64个灰色。换句话说,所有像素总共只有64种颜色。
第三步是计算平均值。
计算所有64个像素的灰分平均值。
第四步是更加灰色。
比较每个像素的灰度与平均值。格里特大于或等于平均值,记录为1;小于平均值,记录为0。
步骤5,计算哈希值。
上一步的比较结果构成了一个64位整数,这是此图片的指纹。组合的顺序并不重要,只要所有图片保证都采用相同的顺序即可。
Google照片搜索的原理和优化技能
获得指纹后,您可以比较不同的图片以查看64位不同的图片。理论上,这等同于计算“ HammingDistance”。如果不同的数据位不超过5个,则意味着这两个图片非常非常相似的;如果大于10,则意味着这是两个不同的图片。
对于特定的代码实现,请参阅以python语言编写的imghash.py。代码很短,只有53行。使用时,第一个参数是基准图片,第二个参数是用于比较的其他图片的目录。返回结果是两个图片(Hanying距离)之间的数据位数。
该算法的优点简单快捷,不受图片大小的影响。缺点是无法更改图片的内容。如果您在图片中添加一些文本,它将无法识别它。因此,它的最佳用途是根据缩略图找到原始图片。
在实际应用中,经常使用更强大的PHASH算法和SIFT算法,可以识别图片的变形。只要变形程度不超过25%,它们就可以匹配原始图片。尽管这些算法更为复杂,该原理与上述简单算法相同。首先将图片转换为哈希字符串,然后将其比较。
Google正式发布的图片搜索优化技能
为了优化图片,Google做得很好。最近,Google在官方博客(1000wordsaboutimages)文章中发表了图片优化技巧。
Google索引图片主要使用图片周围网页上的文本内容。此外,请参阅网页的标题及其主要内容;它可能还可能在其“替代文本”中了解更多信息。此外,Google将通过Exif,XMP等计算机图像信息进行索引。
为了确保图片确实可以由Google进行,请确保图片使用BMP,GIF,JPEG,PNG,WebP或SVG等格式,并且可以捕获此网页。
最后,Google建议:
•图片的文件名与图片的内容最相关;
•图片的Alt属性应在文本中描述,以方便记忆和识别;
•最后,如果HTML页面上的文本内容和图片附近的文本与图片有关,则还将帮助Google索引图片。
发表评论