视觉搜索是美国微软公司旗下必应(Bing)搜索引擎于2009年推出的交互式功能,最初基于Silverlight技术,通过分类图片库呈现结构化搜索结果。用户无需输入关键词,可直接浏览娱乐、购物等5大类及近40个子类图片库,点击图标后动态展示数码产品、运动员等内容的缩略图,支持拖拽、悬停查看信息及按尺寸、热度排序 [1] [4]。
该功能在2010年扩展至电影、汽车等100多个领域,并引入分类过滤机制 [1]。2023年微软测试整合图像识别技术的聊天视觉搜索功能 [2],并推出支持图像深度分析的视觉搜索API,可识别实体边界、生成标签及返回相似图像、购物链接等信息 [5-6]。此外,必应视觉搜索还集成至Edge浏览器、Windows照片等微软生态产品,支持通过上传、拍摄或粘贴图片链接搜索相似内容、商品及地标 [3]。谷歌、百度等搜索引擎也相继推出类似服务,推动该技术成为搜索领域的重要分支。
- 中文名
- 视觉搜索
- 类 型
- 操作方式
- 出 自
- “必应”搜索引擎
- 功 能
- 通过图片帮助用户更方便地完成特定搜索任务
视觉搜索-演示
播报编辑
微软公司高级副总裁迈赫迪2009年9月14日在旧金山举行的一个科技会议上演示了“视觉搜索”的操作方式。用户在使用时不必直接输入关键词,就可通过分门别类的图片库进行搜索。 仍处于测试阶段的“视觉搜索”页面有娱乐、名人、参考信息、购物和体育等5大类图片库,它们下面又细分为近40个图片子库,如购物类别下就利用图标方式分出手机、数码相机、高清电视机和新车等。 [1]
搜索引擎技术
播报编辑
新功能仅针对50种特定搜索结果(未来将陆续增加),如数码相机、新车、大联盟球员,和排行歌曲等,提供漂亮的Silverlight驱动fly-in缩图影像。若你重新定义你的搜索要求,不符合新定义的缩图便会飞出屏幕,其他的则会重新排列填补空出的位置。搜索结果还能连向其他bing搜索结果页和小程序,如购物网页和运动员的成绩统计表。
举例来说,如果用户输入关键词,则必应将以网格图片的方式来组织搜索结果,用户可拖动右方的滑动条来滚动浏览;当用户将鼠标停留在某张图片上时,相应的名称将在搜索框中显示。此外,用户还可按图片大小、人气度等方式重新排序。
必应拥有100多种视觉图库,涵盖从电影、书籍、汽车到产品、动物和体育团队等许多范围,分类的类别每次都会发生变化。以电影为例,用户可按发布日期、题目或评分等条件进行过滤;汽车则可通过厂家、价格或里程分类。当用户进行再分类时,图片会在屏幕上飞舞并找到新的位置。
Visual Search功能显示出搜索引擎将结构性资料融入其搜索结果的真正价值。
微软高级副总裁约瑟夫·迈赫迪(Yusuf Mehdi)称:“这项功能的整体概念是搜索世界将发生改变,人们将以更加图像化的方式进行搜索”。
视觉搜索的发展
播报编辑
2023年6月,微软广告和网络服务首席执行官米哈伊尔・帕拉欣(Mikhail Parakhin)和网友互动中,表示正为必应聊天(Bing Chat)测试图像识别和视觉搜索功能。 [2]
心理学上
播报编辑
Task 1:在下面的图片中找出形状像“Q”的符号
我们能够更快速的从一堆”O”里面找到”Q”,
比在一堆”Q”里面找”O”快.
结论:我们对特征的表征注意比对特征缺失的注
意要更有效(容易看到有的,不容易注意到无的).
