如何评价扎克伯格自己写的 Jarvis AI?

知乎首答~~~

恰好赶上这个很有意思的话题,试着写一下——

从一些媒体、社交平台的反映来看,大部分人对于这个「真实版」《贾维斯(Jarvis)》的表现还是有那么一些出乎意料。但从部分工程师圈子的讨论和某些智能家居从业者的评论来看,似乎扎克伯格(Zuckerberg)开发的贾维斯还没有达到「有技术突破」的地步。

所以某种程度上,这有点像前段时间老罗演示的语音识别输入法,业界清楚明了的状态,却让大众惊呼,「技术竟然已经发展到这个水平了?」

所以这个由扎克伯格个人、用业余时间、花了100-150小时左右的时间完成的作品(这几个定位很重要,说明这个「作品」的意义跟其他成熟公司开发的成熟产品自然不一样,这也是讨论这个作品的前提),到底是什么样?

根据扎克伯格公布的视频和他的描述,我们大概来总结一下「贾维斯」这个人工智能助理目前所能做的一些事情:

早上醒来说一声「Good Morning, Jarvis」,贾维斯就会回应,然后把窗帘打开,并且告知今天的日期、室内的温度,以及今天的安排等;

起身下床,收到贾维斯的通知,说 Max(扎克伯格的女儿)已经睡醒了,贾维斯正在教她练习中文(语音的形式);

走到衣柜前,说一声「给我来件新 T恤」,贾维斯就会通过专门设计的一套装置「发射」一件 T恤出来;

贾维斯会知道几点开始烤面包,并且会在准备好的时候告诉扎克伯格来吃早餐;

可以帮忙接通视频会议,并在开始前提醒会议的内容;

能识别出门外来的是父母,然后自动把门打开,并发送通知给扎克伯格;

可以直接跟贾维斯说想要听什么歌曲,包括具体的歌曲名字、歌手、风格等;

看电视的时候自动把灯关掉,也可以调节室内的温度、歌曲的音量大小等语音控制部分;

睡前只要说一声「Good Night」,就可以把灯光和其他的一些电器都关掉,并且确保门窗都锁好。

……

了解过智能家居的朋友可能在看到一些场景的时候觉得很熟悉,用一些智能插座、传感器、网关、或者其他的一些控制中枢,也能实现部分情景。但能够通过一个系统将其组合起来,而且这个系统可以做随时随地响应,就像一个很有头脑的贴身管家(我需要的时候他就在身边,在处理事情的时候会做一些判断,并不是机械地执行指令,并且会慢慢了解我的喜好和习惯),这就很有些区别了。

当然,扎克伯格的贾维斯还没有很完善,但已经有了 AI 的模样。

所以「贾维斯」是什么,怎么用? 贾维斯是一个人工智能助理,它的实体或者说交互界面,主要是在手机和电脑上。从公布的视频画面来看,实际中最常用的还是手机端的两个 app,一个是单独开发的语音识别 app,可以实时和贾维斯进行语音对话;另一个则是短消息 app,可以发送文字指令,类似聊天机器人。

为了实现在家里随时随地都能和贾维斯对话,扎克伯格不得不在很多个屋子里放置了安装有语音识别 app 的手机。这样其实并不是很好的解决办法,而且他发现,有的时候不在家,偶尔也会有想找贾维斯的想法。所以他认为,贾维斯最终不应该只是一个家庭设备,最好是可随意带到任何地方(这说的不就是可穿戴设备嘛…)。

除了语音交互以外,人脸和图像识别也是被用到的主要技术,比如放置在门口和她女儿 Max 房间的摄像头。为了更准确地识别门外来访的人,扎克伯格在门口各个角度都安装了摄像头,这样可以保证让贾维斯看到人的正脸。

所以,识别来访人员并自动开门的过程是这样的:通过一个服务器来持续监测摄像头的画面,如果检测到有人脸就启动人脸识别系统,然后判断是谁,确定人物之后,比如是今天约好来访或者亲戚朋友,就会自动开门让对方进来,并发一个通知;

安装在 Max 房间里的摄像头,则会识别 Max 的状态,比如她是在睡觉还是在屋里走动,如果早上识别到她醒来,就自动播放一些音乐或汉语课程。要是发现她走出房间,还会发送提醒。

另外一个主要的应用场景是让贾维斯播放音乐,通常是用语音交互的形式来完成,可以直接说歌曲的名字,可以说歌手的名字,也可以是某个特定风格的歌曲,这些功能现在有很多产品都在做,但要真正做得比较精准得需要足够多的数据和长时间的训练。

贾维斯还能记住不同人的音乐喜好,可以通过声音识别出来是谁的指令,然后决定播放哪一类歌曲;能够进行自我学习也是很重要的特性,通过给它一些反馈,比如「这不是轻音乐」、「我不喜欢这种」,可以帮助贾维斯提供更准确的数据。

开发贾维斯的感受和体会,同样有意义的分享

相比这套系统给人带来的启发,扎克伯格也分享了一些开发过程中的感受和体会,也是很有价值的思考:

首先他面临的第一个挑战是,把家里足够多的设备连接起来,因为目前各种设备之间都有着不同的接口协议,或者根本还不具备联网能力。这是业界共同面临的问题,但要想真正有所改变或许只能等到行业发展到一定程度;对于无法联网的设备,扎克伯格通过将其连接智能插座的方式来控制开和关。

对于语音交互这种形式,他的看法是,语音交互肯定会在未来扮演一个非常重要的角色 ,而且会是通过一个可随身带到任意地方的载体。因为这种方式足够便捷,不用拿起手机、打开 app,然后输入文字。

但同时他也认为,语音交互并不适用于所有的场景 。比如,当有人来访时,告诉贾维斯让对方进来,这就不适合用语音,因为这跟其他人没有关系,等于是一种打扰。所以,我们还应该保留有一个更加私密的交互方式,比如文字对话界面。实际上他发现,自己更多情况下还是选择用文字对话,并且,也会希望贾维斯能够输出文字、图形等其他形式来给出响应结果。

和文字对话相比起来,语音对话的这种方式会让人更容易有感情的投入,更让人有交流的意愿,扎克伯格表示,在设计 AI 的语音交互时,会非常想给他增加一些幽默感或者好玩的特性。视频中也能看到贾维斯这个成员的加入,确实给家庭中增添了一些欢乐的氛围。

要做到足够「智能」,人工智能助理还需要融合更多的参考信息 ,比如在发出语音指令时,它应该还要具体地了解周围的环境和其他背景信息。比如,当「我」说把灯光调暗的时候,贾维斯应该知道「我」在哪个屋子,然后把当前屋子的灯调暗,这是比较智能的做法,而不是给每个屋子命名;以及,当「我」说播放音乐的时候,不应该因为上次是在那个屋子播放的音乐所以这次也是那个屋子。

除了一些需要具体对接的服务之外(比如比尔 盖茨问贾维斯能不能订汉堡……),扎克伯格开发的贾维斯可以说是足够实用的人工智能助理了,但还并不适合推广。人工智能技术应用到更多用户家里可能是一个缓慢的过程,就像扎克伯格所说的,除了 AI 技术的发展之外,还需要「智能」设备足够普及、且它们之间能够互相通信,才有可能构成一个真正实用的 AI 系统。

总之,这样一个由个人用100多个小时开发的作品,它的意义和其他公司开发的成熟产品当然不一样。 在接受 fastcompany 采访的时候,扎克伯格说

It’s not a production system that’s ready to go to other people

But if I couldn’t build a system that can at least do what [Echo and Home can], I probably would have been pretty disappointed in myself.

「贾维斯不是一个成熟的可以推广的产品,但如果我自己不能做出像 Amazon Echo 和 Google Home 这样的系统,我会对自己感到很失望。」

真是一个有趣好玩的技术大神~

来源:知乎 http://www.zhihu.com

作者:出门问问

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。

点击下载

此问题还有 33 个回答,查看全部。

延伸阅读:

电影《社交网络》给你最深的感受是什么?

如果你是扎克伯格,你会担心 Google+ 吗?

Advertisements

Tags: