一文看尽Google I/O大会:史上最快手机全语音操控,不开口也能打电话,安卓Q登场

  • 时间:
  • 浏览:1
  • 来源:极速5分11选5下注平台_极速5分11选5注册平台_极速5分11选5官网平台

图片来源图虫:已授站长之家使用

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:边策 乾明 李根,授权站长之家转载发布。

不忘初心,AI前行。技术愈精,情怀越高。

从前 ,Google I/O2019 大会开幕。

2 小时主题演讲,全球AI第一大厂秀出最新黑科技进展,但会 情怀依然满分,Google用行动诠释科技向善。

今年大会演讲主题:Keep making magic.

究竟Google的最新黑科技魔法有哪几个?量子位带你一文打尽。

开场:不忘初心

大会结速,Google CEO桑达·皮猜在一片欢呼中微笑登场。

劈柴哥说今年Google I/O,视觉能力与众不同,比如观看法律法律依据加入了AR体验,通过手机,利用另两个 App就能身临其境、解答一切。

但会 别看事情小,肩头驱动是Google的初心和使命:整合全球信息,使人人都能访问并从中受益。

Our mission is to organize the world’s information and make it universally accessible and useful.

劈柴哥强调,正是从前 的使命,让代代Google人推出更好的产品,帮用户更高效,让用户放慢乐,要做更有用的Google.

一切自然离不开AI。

AI视觉成新入口

Google CEO先从去年推出的谷歌信息流说起,其实这还遭到李彦宏感慨——谷歌学师百度,但劈柴哥解释,希望能在准确搜索从前 ,进一步让用户更完整版了解世界。

肩头否有 机器学习、AR和AI等前沿黑科技。

比如你Google一下搜索黑洞,Google AI就能让我推荐相关新闻,包括给出根小绳子 完整版的信息流时间线,展示黑洞是如何被发现的。

这其中,Google还解锁了很多视觉能力,让用户我应该 的信息更直观准确呈现。

比如利用AR视觉能力,搜索不仅准确提供结果,还能31000°全面了解。

你想买一双鞋:

肯能小我门都 想了解大白鲨:

那有这麼肯能是想看 一张图片,也想知道更多相关信息?

谷歌说Google Lens——智能拍照\图搜应用,为此而生。但会 否有 拍照识别这麼简单。

现在Google Lens还能做更多。

拍菜单,自动显示大众点评高赞菜,拍小票,自动计算金额和小费。

Google Lens但会 入口,还结合了诸多但会 Google App的能力。

比如地图、翻译、大众点评……另两个 入口肩头,集齐谷歌全家桶能力。

那肯能大字不识另两个 ,还上能享受到AI福祉?

Google搞懂第另两个 情怀大满足案例。

Google Go就还上能了。

现场举例,在印度,文盲大姐姐通过Google Go,即便大字不识另两个 ,还这麼说印地语,还上能手机拍照,但会 让手机自动朗读出来,用智能手机了解我应该 了解的一切——无论线上还是线下。

目前,Google Go肯能涵盖印地语、中文在内的 10 多种语言。

谷歌团队将Google Go整个大小控制在1000kb以下, 35 美元价位( 1000 元)的手机,有摄像头就能使用。

真正做到用得起、用得好,一款Google Go在手,世界说走就走。

毫无现象,现场掌声和欢呼声一片。

AI语音助手更全能

视觉之外,但会 AI在语音语言方面的能力。

劈柴哥先从Duplex说起。

去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美 40 多个州商用。

今年Google会把这项功能扩展到网络上,叫做Duplex on the web,帮你租车、预订电影票和餐厅座位。

比如你想租车,用Duplex打开租车公司的网站,你这种 AI就能代替你填写所有必要信息。在提交订单从前 ,人类只前要核对一下信息点击即可。

Duplex还还上能理解日历行程信息、Gmail邮件内容,自动在填写订单时补全信息。

为什说呢,虽已过当红阶段,但Duplex变得更强更务实。

而Duplex之源——Google AI助理Google Assistant否有 大进展。

Google表态升级AI语音助手,并把语音交互能力完整版放在手机。

优秀到哪几个程度?

整个过程完整版不想上手,但会 前要反复用唤醒词,语音交互就能实现对手机的全过程操控。

更厉害的是语音识别效率保持在 1 秒以内,比用手放慢。

现场小姐姐的演示,搞得人心激动。

Google解释,之但会 这麼流畅,是肯能我门都 谷歌数据中心的语音识别模型“放进了口袋”,从前 1000GB模型被压缩到0.5GB,使得集成到手机中成为肯能。

但会 ,更小的模型还降低了网络延迟,交互效率提升 10 倍。

值得一提的是,Google的语音助手,还能跨App操作、完成任务,比Siri不知高到哪去了。

现场举例,肯能你正在和我门都 聊天,经常想发送一张过去旅游的照片,你只前要告诉它你照片是在哪拍的、底下有哪几个内容,AI助手就能把照片直接发送过去。

只可惜,Google的AI语音助手,Google的你这种 福音技术,这麼在Google“亲儿子”——Pixel手机上使用。

当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。

Google AI还上能给任何视频加字幕

从前 ,YouTube视频即使上传者这麼给字幕,还上能通过自动识别加上实时字幕。

现在Google把你这种 能力带到了任何视频中——前要强调的是手机终端,没联网也OK.

无论是相册中我个人拍的视频、网页中的视频、聊天视频,但会 能加上字幕,从前 再但会 怕地铁上看剧听不清对话了。

但肯能只把技术用到你这种 步,Google就不想是那我个人类希望了。

Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。

比如打进来的声音,转化成文字,但会 让聋哑人还上能像回复短信一样接电话,输入的文字会实时转写、自动变成语音发出去。

更贴心的是,Live Relay还利用了Google智能预测和回复功能。对打字内容做出预测。

无须担心打字效率跟不上语音,一切实时甚至“提前”进行,转写质量也很高,打字效率能跟上语音通话的效率。

现场都被Google的情怀填满了。

这项技术也被叫作:不开口就能打电话。

聋哑人群体能更好享受智能手机和AI的便利了。