人工智能大家都在争

2018-05-09 21:36:41 7 Views

摘要：相比去年重点强调人工智能是谷歌最高战略，2018年Google I/O开发者大会上，谷歌展示的是人工智能的全面升级——越来越“像人”，越来越能够代替人。

相比去年重点强调人工智能是谷歌最高战略，2018年Google I/O开发者大会上，谷歌展示的是人工智能的全面升级——越来越“像人”，越来越能够代替人。

5月8日早上，在谷歌园区的圆顶露天剧场里，谷歌CEO桑达尔.皮查伊（Sundar Pichai）以及各个产品线负责人相继登场，轮番介绍AI在产品里的应用进展。但最让人感到惊讶的，是皮查伊展示的谷歌助手（Google Assistant）打电话的两个使用场景。

1. 给你打电话的是人还是机器？

“我这里有个女顾客要剪头发，我打电话来预定一下”，谷歌助手在电话里对理发店服务员说，“我想看看5月3日是不是有空档”。

皮查伊说，这是谷歌助手打电话给一个理发店的真实场景。不仅仅发音非常自然，而不是以往的机器发音，反应也非常接近人类，在理发店服务员说，让“它”稍后时，谷歌助手甚至给出“嗯哼”的口语回应。

更让人惊讶的是，对于一些复杂的对话，它应对自如，理发店问它希望在几点到店，它说需要12点附近，理发店回应说，最近的时间只有1:15PM的，它又询问，是否有早上10点到12点的。

在这些复杂的对话中，它表现出对于口语化对话的很好的理解，以及对语意的理解，甚至还能够理解和表达自己所服务用户的偏好——“早上10点到12点之间”。

如果说这个使用场景让许多人感到惊喜的话，皮查伊展示的下一个场景则让人觉得惊悚了——你也许会无法辨别和你对话的是真实的人类还是机器。

这是一个电话订餐的场景，从英文口音来听，像是亚洲餐馆。在美国的生活中，中餐馆等亚洲餐厅接线员英语并不是很好，对话会较为困难，谷歌展示的使用案例还原了生活中的场景，“这个电话对话可能要比预期难一点，你们听听”，皮查伊说。

“我想定一个位置，在下周三，是7号”，谷歌助手在电话里说。

“7个人吗”？餐厅的接线员问。

在电话一开始，接线员就显示出英文理解能力的不足——仅仅抓住了7这个数字，问对方是不是要定个7个人的桌子，谷歌回答说，“是4个人的”。

接线员又问，“4个人的话，哪一天，今晚还是明晚”——接线员忘了一秒钟之前的对话，谷歌再次答复她，是“下周三”。

在这场场景中，接线员表现出对于对话的混乱地理解，但谷歌一直表现优秀——能够理解无序的话对，“不被带偏”，记住并完成自己的核心任务。

“让人惊讶的是，助手能够理解对话里的细微末节”，皮查伊说，“我们在这个技术上研发了很多年，叫Google Duplex”。

皮查伊表示，公司多年来在自然语言理解，深度学习和语言转文字上投入巨大，而 Duplex 对这三大技术融会贯通。“Duplex 还有很长的路要走，不是所有的电话都完美结束，但这项技术已经能够理解对话的上下文，每句话所表达的细微的意义差别。” 皮查伊强调说，Google Duplex还在研发中，他们计划今年夏天把这个技术置入谷歌助手测试，到时候，用户就可以像Demo展示的那样，让谷歌助手去定个理发师剪或者是给餐厅打个电话。

2. AI和道德

作为本次大会的主讲人，皮查伊表示，今年有7000人来到现场，见证AI正在带来的巨大变革和机遇。Facebook事件当前，皮查伊也谈到了AI和社会责任的关系，他认为技术更核心的是正能量，但在隐私和道德等层面，也需要谨慎前行，而Google对此深怀责任感。

将AI投入到医疗领域，在谷歌看来是一种承担社会责任的表现。

皮查伊说，两年前，Google 开发了一套神经网络，它能通过眼部医学造影来探测糖尿病视网膜病变。如今，谷歌的深度学习模型已经能够利用同样的造影图片，高度精确的预测一位病人未来心脏病和脑淤血的发病风险。

帮助残障人士，也是谷歌将AI投入使用的领域之一。

谷歌在大屏幕上展示了一个短片，从小失语的Finlayson一直以来都很难跟人交流，她的丈夫专门基于莫斯密码为她开发了一套交流系统——左右两个按钮能够向系统发出长和短的信号，而系统能够把这些信号翻译成语音，帮助她与外界交流。

谷歌的G-Board吸收这个点子，把摩丝密码融合到键盘中去，让残障人士和机器之间交流更为简单。

也就是说，相比语音输入、文字输入、摩斯密码成为了任何机器之间一种新的交流方式。

在大会上，Finlayson一家也来到了现场，就如她在短片中说的，因为这套系统，她能够表达自己，并且获得爱情和家庭。

3. 尽可能地取代人的工作

在去年大会上，皮查伊强调，谷歌的策略正在从“移动为首位”变成“AI高于一切”，到了今年，AI真正成为了谷歌各项产品中“水电煤”基础设施，布局到Gmail邮箱、照片应用还有谷歌助手中去。

AI变成基础设施，意味着我们在使用一些应用功能时，意识不到这可能是AI在起作用，也意识不到是人工智能的算法有了进展；而这一切最终都指向一个目的——尽可能地取代人的劳动。

把AI使用在邮件写作中，能够实时向用户推荐“你可能会用到的短语”。比如根据邮件地址，能够在邮件正文自动为用户生成收件人称呼，而根据邮件名称，《今天吃墨西哥卷》，能够在正文书写疑问句“要不要一起”，自动为用户生成“吃墨西哥卷”。

用户要做的就是，一直敲空格键确认就可以了，这项名为“智能写作”的功能预计在5月底向全体用户上线。

而谷歌照片应用Photos，可以帮用户归类照片，这实际上是AI长期在攻克的一个技术方向——识别图片内容，这种应用越来越好用，实际上是算法进一步提升。

谷歌还在大会上推出了“Smart Actions”功能，比如平时许多人对着文件拍一张照片，为的是把纸质文档存储下来，而现在通过这个功能，能够直接变成PDF扫描文件，让用户更方便阅读。

比如希望把一张黑白照片变成彩色，则需要机器能够精准地识别出图片中不同的图像，并给他们上合适的颜色。

这一切都是源于算法的进步。

4. AI介入新闻

当今日头条这样的信息流产品大行其道时，谷歌这样的美国互联网巨头也不愿意错过这一机会。

皮查伊表示，未来3年内将投资3亿美元与新闻媒体合作，致力于严肃新闻，以提高新闻质量。

在大会上，谷歌更新了他们的“Google News”——用AI介入了人们阅读新闻方式。

如果用户读了一条朝鲜韩国领导人见面新闻，它会关联推送其他相关新闻，谷歌把这个关联阅读当作Google News一个重要的特征。当然，这并不新奇，今日头条等应用上早已有了这样的功能。

Google News的第二个特征是“360度报道”，让用户了解整个新闻的来龙去脉。比如某地停电，在新闻前后有这件事本身、人们需要做什么，以前以后相关的相关事件。他们想让用户知道一件事，并在后台绘制出一张脉络图，让用户完整理解这件事——这基本等于机器自己搭建了一个专题。

第三个特征，是让用户订阅自己需要的媒体，目前Google News已经进入127个国家和地区，在Android和iOS上都能找到。

不过，从广告收入的角度来考虑，这个产品的商业前景让人怀疑。以在商业领域取得巨大成功的今日头条为例，单个信息（即一个视频、一条新闻或者一个帖子）消费时长都较短，比如视频控制在15秒内，文字信息也保持在较短范围内。单条信息消费时间较短，便能够夹带更多的信息流广告，广告库存高，这也是今日头条今年广告收入预计500亿人民币的底气。但从谷歌来看，致力于严肃新闻和长篇报道，则不符合这一广告收入逻辑。

与此同时，Google News是一个推送新闻产品，但谷歌在同一类产品中又推出了订阅功能。目前美国几大互联网公司中，苹果依靠手机产品推销自己的推送类新闻产品，，脸书也在2017年推出了自己的订阅新闻产品；而谷歌今天发布的产品则横跨了订阅和推送两种模式，即便加上AI助力，商业化的未来可能还需要时间来验证。

博域科技订阅号

博域科技服务号

上一篇：云计算与AI霸占微软Build开发者大会

下一篇：国家将制定区块链技术标准