如果把Google搜索比作一个小婴儿的话,那么,RankBrain赋予了他思考与学习的能力,之后推出的图片搜索、语音搜索、视频搜索则是赋予了他看、听、说的综合表达能力。
○基于图片识别技术,Google推出了视觉搜索引擎Google Lens;
○基于语音识别技术,Google上线了Google now;
○而基于视频识别技术,Google推出了前瞻性的“视频智能API”。
图片搜索、语音搜索、视频搜索,三位一体拓展Google搜索形式,为用户带来了更好的搜索体验。
Google早在2012年就开始布局语音搜索,并推出了Google now语音搜索应用。Google Now通过记录下用户的搜索关键词,分析用户过往的搜索习惯,来预测用户所可能需要的信息,从而提供智能化的服务。虽然整个提供搜索服务的过程Google Now都是以自然语言的方式来进行,但它并不具备与用户聊天的交互式能力。
(Google Now)
2017年的Google推出视觉搜索引擎Google Lens,进一步拓展了Google的图片搜索能力。Google Lens能够通过图像算法实现即时查看和搜索的功能,并将有效信息整合到手机里呈现给用户。当用户出行时,可以通过Google Lens拍照获取周边的餐厅信息,到用户进入餐厅吃饭时,可以直接用Google Lens扫路由器上的用户名或条形码连接wifi,甚至当用户看见餐桌上一朵不知名的花,都可以通过Google Lens拍照获取花朵信息。
(若拍摄路边的餐馆,Google Lens会自动调出该餐厅与地图信息)
(若拍摄音乐会海报,Google Lens会建议购买门票,并调用购买门票的APP)
虽然Google的视频识别技术在应用程度上没有图片识别与语音识别高,但Google仍然是视频识别技术领域的佼佼者。2017年,Google推出了视频智能API视频(Video Intelligence API)。通过这项技术,Google可以自动识别视频中的物体,让视频实现可搜索。举个例子,当视频中出现棒球、狗这样的实体时,Google搜索能够标出其在视频中出现的位置,从而得到物体在视频中出现的频率。