今年科技圈最热的词是什么?人工智能(AI)!什么是人工智能?管他的,反正把我家的产品先包装出AI功能再说。今年很多硬件产品的产品经理可能就是这么想的,所以我们看到了许多所谓的智能硬件的新品突然有了人工智能技术加持。
人工智能从后台走向前台,走向风口,是一次利大于弊的转变。更多的人才,更多的企业,更多的资金被投入到这个领域,让许多行业的工作方式开始发生变化。不光计算机互联网领域,人工智能技术的发展对整个社会的推进作用都是明显的,国务院甚至专门针对人工智能印发了发展规划。作为中国互联网的三极,BAT自然不会放过这个风口。阿里和腾讯在激烈争夺人工智能上游云计算市场,百度则高调宣布将转型为人工智能公司,似乎一夜之间“互联网+”都变成了“人工智能+”。
然而在这种大环境下,真正主打人工智能的消费级硬件产品却不多见。而每当我们说起AI硬件,Amazon Echo所代表的人工智能语音硬件产品总是第一个被人们所提起。或许这是现阶段最容易实现或符合客观用户需求的人工智能硬件吧,毕竟无人驾驶什么的,一般人还无法轻易接触到。最近什么值得买3C家电编辑部迎来了阿里巴巴人工智能实验室推出的硬件产品——天猫精灵X1智能音箱(产品链接,8月8日开售,499元),下面我们以《到站秀》的形式与大家分享一下初步的上手体验。
注意:针对下文中这台工程版机器遇到的问题,阿里巴巴工程师表示新版固件已经大部分解决,手里有天猫精灵的值友可以更新到7月31日晚推送的新固件体验。本文基于工程版硬件和初版固件测试,不代表面向消费者的天猫精灵X1正式版的真实体验。
硬件部分
迷你精致的小东西,音质对得起售价。
▼ 我们拿到手的这台天猫精灵X1为黑色版,相比白色版没那么引人注意,放在我们办公区的一角,安静时大家几乎感受不到它的存在。
▼ 包装盒上除了天猫精灵字样,还有天猫LOGO的元素。
▼ 底部是“天猫精灵”App的二维码,扫描按照页面引导操作即可下载。
▼ 两段式设计的外观,底部为扬声器单元,有海绵包裹。上半部分则是类肤质设计,比较容易沾染油渍汗渍,如果你想保证它的干净,建议不要让家里来访的朋友们频频把玩它
▼ 顶部有三个按键,静音键与音量加/减键。不过音量键只有触发亮灯时才可见,触摸式操作,也可以通过语音来调节音量,这点我们之后再提。
▼ 下面这组图能够比较好地体现天猫精灵X1的大小,这是与iPhone 6s Plus的对比,可以看出天猫精灵X1的身材十分迷你,放在电视柜、茶几乃至书架上都不是问题。
▼ 类肤质材质对于灰尘污渍的吸引力真是max,如果购入这款产品,建议放在一个不容易积灰的地方,或勤加打理。又或者,你也可以选择放在一个视觉盲区里,比如较高处,眼不见为净嘛~
▼ 天猫精灵X1不具备移动使用的功能,需要持续供电,供电口位于底部,隐蔽性不错。
▼ 未联网状态的天猫精灵X1触发时会亮橙色灯光,配网过程中则是闪起白色灯光。
▼ 配网进行中,可能是工程版的问题,我们收到的这台天猫精灵触发配网模式是长按静音键+音量减,与App上的指示略有不同(长按静音键)。
对于一个智能音箱,外观硬件设计只是其表,更重要的当然是里子。作为阿里巴巴“人机交流系统”AliGenie的首个消费级硬件载体,天猫精灵X1倾注了阿里巴巴人工智能实验室的技术与努力,同时也被寄予厚望。但一个普通消费者所关注的并不会是这些,所以我们在智能之外,特意将它作为蓝牙音箱使用了一小会。
如果仅仅讨论中频效果,天猫精灵X1可以说对得起499元的售价,高频则中规中矩,不过低频略为不足。而低频量恰恰是一般使用者最容易听出的效果,因此其实阿里的团队在低频上多做一些功夫的话,天猫精灵X1的开卖后应该会有非常不错的评价。当然,这个价位上,对其音质提出太高的要求也许有些过分。简单的说,天猫精灵X1以这样的外观设计和音质,定价499元,是比较有诚意的。
软件部分
AliGenie还需要进化。
了解人工智能概念的读者应该知道,人工智能技术,拼的不仅是研发能力和算法,对于AI这种本身就具备学习能力和进化能力的产品,数据更加重要。亚马逊Alexa有先发优势,通过低价销售Echo,拥有最多用户,这些用户每天的使用,都在帮助Alexa进化;Google有搜索有输入法,能为自家的AI提供海量的数据样本,国内的百度、搜狗同理。但阿里巴巴有什么现有的技术积累可以实现自然语义处理的高成功率?
怀着这种疑问,笔者开始进行天猫精灵X1软件部分的使用。
特别声明:以下所有体验与截图,均为7月31日新固件推送之前的初版固件,不能代表7月31日版新固件的使用体验。
▼ 在发布会上,配网(连接Wi-Fi网络)就是天猫精灵X1宣传的亮点之一,号称10秒快速配网。但由于我们拿到的是早期工程版本,一度卡在这一步,十分尴尬;不得已求助阿里巴巴的工程师,才知道我这个版本第一次配网不是长按静音键,而是长按静音+音量减组合键
▼ 10秒配网确实不是虚传,按照操作,用iOS或者Android进行配网,均在读秒间就完成了。应该是使用了天猫精灵独有的声纹技术,这也是天猫精灵X1目前区别于其他智能音箱产品的一大特点。
从天猫精灵App底栏可以看到,有天猫精灵、技能、娱乐、我的四栏。其中天猫精灵为呈现用户与天猫精灵对话记录所涉及,可以看到你的语音指令被识别为什么,以及天猫精灵的回答。技能则是一个教程区,教你使用天猫精灵X1的技巧。在现阶段人工智能语音产品还无法理解所有自然语句的意思,因此使用时还是需要一定的提问技巧。笔者另有一台亚马逊的Echo Dot,同样有一个这样的Skills展示区。
▼ 声纹可以说是天猫精灵X1最大的特色,因为这项技术,安全性和便利性都提升了一个等级。通俗的说 ,声纹类似于指纹,每个人的声纹都有独特性。因此和指纹一样,可以用作一项加密验证工具。天猫精灵上,声纹技术应用在了配网、多用户区分和支付验证等场景。在多用户这一项上,它支持最多6位用户。
另外,天猫精灵X1允许用户通过语音来控制家中的智能家居产品,但仅限于阿里智能阵营的产品,需要搭配阿里智能App使用。鉴于笔者没有此类产品,无法演示这个环节。
▼ 一个主打语音功能的智能音箱最重要的是什么?笔者觉得是拾音的可靠度与语音识别的成功率。那么天猫精灵X1这方面表现如何呢?就我们手中的这台工程版而言,暂时还不及格。希望面向消费者的正式版在固件上已经修复拾音灵敏度的问题。
发布会上,阿里巴巴人工智能实验室负责人浅雪提到天猫精灵X1研发过程中的一个难点:如何在音质与唤醒灵敏度之间做到平衡。最终阿里通过气密性设计保证了发声单元与阵列式麦克风之间的隔离,以避免前者干扰后者。实际体验中,这一点得到了体现,在不同大小的音量下播放音乐,用相近的说话音量来唤醒天猫精灵,基本都能成功,可见干扰被降到了比较低的水平。与之相比,笔者的Echo Dot两种情况下唤醒成功率差得非常大:安静时日常交谈音量即可唤醒,播放音乐时,则多次大声尝试才能唤醒Alexa。
但是,就我们收到的这台天猫精灵X1而言,有两个基本的功能未优化到位:拾音灵敏度、语音识别成功率。
首先,天猫精灵的拾音灵敏度偏低。经过多人多次测试,我们发现在2米左右距离上,以普通音量与普通语速的“天猫精灵”指令很难唤醒它。使用者需要使用比日常交谈更大声、语速更慢、字正腔圆的语句,才能成功唤醒。办公室的多名编辑轮番上阵,成功唤醒率不到50%,极大的影响了使用体验。
▼ 其次,语音识别的成功率与自然语义处理能力都有待提高。经过多天使用发现,天猫精灵X1对于快语速人群不够友好,如以下图片,语句应为“给我播放一首李宗盛的歌。
▼ 来自播音系毕业的选手的语音指令,原语句为“广东人吃不吃福建人。
▼ 笔者带点塑料味的普通话,识别出来是这样的;
▼ 下图,笔者也分辨不出原语句到底是什么了。
▼ 同无法分辨原语句,从这串混乱的语句跳到谭咏麟的歌曲,关联逻辑有些简单粗暴了,天猫精灵内的AliGenie还是要学习一个啊。
▼ 原语句下单,识别为下班。
▼ 原语句应为天猫精灵,明天7点叫我起床,可能是语速过快、连读的原因,识别出了郭敬明
结语:从上面这几张截图可以看出来,天猫精灵离一个好用的语音智能音箱,AliGenie离一个聪明的人工智能语音助手都还有很长的路要走。什么值得买此次发现的拾音灵敏度问题,应该通过固件升级就能很快解决(7月31日晚本文最后校正时,App提示已有新更新。但语音识别成功率,以及自然语义处理的准确率,都不是一朝一夕能够达到100分水平的。
阿里巴巴选择自己做语音方案、自己做AliGenie、自己做AI硬件,说明了阿里对AI的重视,以及打造生态圈的野心。只有AliGenie的智商快速提升,阿里巴巴才能在人工智能语音方面跟上竞争对手们的节奏。或许除了硬件之外,阿里应该学习对手们,基于阿里生态圈庞大的用户,在既有的手机App上做一些文章,降低消费者接触AI产品门槛的同时,也利用海量的语音样本来训练AliGenie。
想了解更多相关内容,点击下方“了解更多”,你会收获更多相关优质内容
- 上一篇:再迎性能之巅 创作者利器 ThinkPad X1隐士评测-x1评测
- 下一篇:没有了