在读小学的时候,老师会经常让我们写「想象作文」,那个时候我写的最多的题材就是 机器人 。
各种各样的机器人,比如我是个山西人,小时候几乎顿顿都吃面,面不像米,每次都得现场和面,非常耗时间,我就幻想着有一个机器人可以帮忙和面;后面长大了点,我就会被派去扫地,这个时候我就又幻想着有一个机器人帮忙扫地拖地。
没想到过了10几年过去了,具有这些功能的机器人不仅仅被发明了出来,并且一个个的都进入了寻常百姓家,甚至功能比我想象的还要齐全。
除了这些,小时候的我特别喜欢看各种机甲变身的动画片,但是那个时候没有手机,没有电脑,也没有点播功能,如果想要看动画片就必须蹲在老式电视机前面等着,过了这个村就没这个店了。
但老式电视机大家也知道,很难去挪动,不仅仅是笨重,还因为闭路线路的距离限制。
但最近我发现了一个让我眼前一亮的家庭机器人,也就是美的的家庭服务机器人,它不仅具备了智能语音机器人功能,更是一个移动的视频投影仪,简直就是一个随叫随到的移动电视!
对了,它的名字叫「小惟」。
我心目中的家庭机器人
我对家庭用机器人分成三种:
1 清洁机器人,扫地机器人就是一个典型的代表。
2 语音机器人,苹果的siri归于这一类,要么有个拟人的设备,或者压根就是个普通的移动设备。
3 家庭管家式机器人,这个市面上我见的不多,可以移动的更是少之又少,美的机器人我觉得可以划到这一类。
并且从外观来说,我心目中的机器人是那种简单图形组合成的 「可爱生物」,市面上的机器人,要么是一个会移动的圆饼状,要么就是摆件式的语音机器人,实在是跟我心目中的机器人形象大相径庭。
美的机器人的造型是真的戳中了我这理科直男的童心,对于我来说,机器人的外观要么极致拟人,要么就最简单的几何图形拼接,既然暂时做不到前者,那么这种简单的几何组合体更让我感觉到真正的温度。
从官方的介绍中得知, 「方、圆、三角形和谐组合」 的美学构造,还获得 2022年德国红点产品奖和智能产品奖的权威认可 。
当然了,作为机器人,最本质的还要看它的「服务」做的好不好,对于家庭服务机器人,再加上人工智能从业者的背景,我最关心的就是它是不是足够的「智能」。
智能在机器人身上,我觉得从一个点就可以看出来了,那就是:
交互的智能度
首先交互,不仅仅是 人机交互 ,也包括了 机机交互 ,以及 机器人与环境 的交互。
人机交互最简单就是 语音交互 ,语音交互涉及到输入-理解-输出三个环节,这三个环节不仅缺一不可,更是要求每个环节都达到相当程度的高度。
其实「 智能感 」的要求是很高的,智能感的背后是人工智能算法+计算能力+数据三者的有机结合,缺了任何一块都不能实现智能。
对于家庭机器人来说,能听懂说话这一点并不难,美的自研的 AI中台 就有专门处理语音的模块,它可以进行语音识别,整合数据,提升云识别效率,其背后是前端自然语言理解相关算法、语音模组。但是如何做是需要大量的数据作为支撑的,那么数据从哪里来呢?
智能感的数据支撑-3D语义地图
这里不得不提到一个东西,那就是语义地图 semantic map ,这个跟普通的地图有什么区别呢?
我们来做一个比较,这是我附近的一块区域,这是一个非常常见的2维地图。
但其实谷歌地图还可以显示三维地图,如图下所示。
3维相比于2维最明显的就是多了一个维度,也就是高度,可别小看了这个维度,如果是飞行器需要规划航行路径的话,那高度就变的非常重要了。
换到家庭机器人的场景室内也是一样的道理,高精度的3D室内地图对于机器人来说是必不可少的,除了精度要高,「 语义 」更是极其重要的信息。
什么是 语义 呢,简单来说,如果没有语义,那么沙发、床和桌子本质上没有区别,都是长方体而已,那么如果我们想要让机器人走到电视机旁,那么它就做不到,因为它的「脑子「里,也就是数据库中没有电视机这么一个概念。
而语义的效果就在这里,它可以将 高精度 的室内地图标注上更具有 实际意义 的语义信息,那么之前让它到电视机前的操作就不再是不可能事件了。
有着语义地图的加持,美的机器人就可以做到很拟人的操作。具体怎么操作呢,比如说你想给你女朋友一个惊喜,那你就可以把一束花或者一本书放在小惟的背包里,通过语音控制它送出去,很意外很惊喜对不对!
其实上述的这些都可以包含在机器人与环境的交互维度中,而美的小惟机器人的「 语义地图 」是切实的填补了这个空白,让交互变成的更顺畅,也更智能。
温暖的学习型管家
你可能会忘了喝水、忘了开窗、忘了吃药对不对,但是小惟是绝对不可能将这些事忘记的。
它作为一个家庭型机器人,同时也是一个 中控式 的机器人,只要具有 远程控制 功能的智能家电,理论上小惟都可以替你操控。
作为一个智能机器人,那么学习能力肯定是不可或缺的,这里就要说到「 人工智能 」的学习能力了,跟人类一样,小惟也会通过不断的「 自适应 」学习,根据你的使用习惯和时间来调整自己。
在经过一段时间磨合后,你会发现机器人甚至比你熟悉你的各种习惯,甚至先你一步,像早晨日出后控制窗帘拉开这种基本操作就更不在话下了。
上述其实的操作只是针对于机器人的同类,而机器人与人的交互则更考验智能度。
一个家里只有一个小惟,但它的主人可能有很多个,那么在一个很多人的家里面,小惟同学可以认出来谁是谁吗?
答案是可以的,这得益于现在先进的「 计算机视觉 」技术,这跟人类的视觉原理是一样的。想象下这个场景:你在家里喊了一嗓子:「小惟,过来!「,然后小惟的声音处理模块就会从嘈杂的环境中识别出这个指令,并且根据声音大致判断你的位置。然后会走到你的身边,通过 ReID 技术大概确认你的身份,这个技术叫行人重识别(Person re-identification),本质上就是在一系列的视频信息中确定一个人的身份,以为对于机器人来说,它的眼睛就是一个具有「 深度学习 」功能的相机,而ReID技术和深度学习相结合,就可以很准确的锁定你和你的位置。
那么在确认你身份的时候,又一项技术会被用到,就是 FaceID ,相信这个大家都用过,在各种刷脸支付、刷脸验证的时候用到的技术就是这个。
至此,ReID+FaceID,一动一静,两个技术就可以牢牢的锁定主人。
当然了这些都得益于强大的硬件支撑,语音+激光雷达+深度相机+灵活的移动装置缺一不可。
随叫随到的一个陪伴者,无疑是家庭的一个好帮手。
锦上添花的娱乐功能
小惟的方脑壳并不单纯就是一个「Ipad」,其实它的脑袋里装载了一个 镶入式 的投影仪,再结合上它的移动能力。
这不就是个妥妥的移动投影仪嘛。
这个真的是满足了我小时候的想象,随时随时我身边都有一个电视机,我可以躺着看lol比赛,站着看lol比赛,各种角度都可以看lol比赛。
在小惟的介绍里看到,它的 投影效果 非常不错,具有很高的 清晰度 。除此之外,它里面还有很多的 互动游戏 ,水果忍者估计都玩过,那么在墙上玩水果忍者可能并没有很多人体验过。
这个功能对于 家庭教育 的想象空间很大,可以将很多寓教于乐的方式嵌入其中,比如很多的趣味家庭游戏,123木头人等。
总结:
最近我学到了一个新词, RaaS ,Robot as a Service,它是在美的举办的「数字美的2025发布会」,这个词对我来说既新鲜又不新鲜,因为这个词在云计算中很常见。
云计算的很多功能在互联网中起到的是基石的作用,燃料的作用。那么我觉得对于未来的人类社会,机器人也会起到基石的作用。从传统家电的机器人化,到细分领域的导购、清洁、服务、烹饪机器人等多个领域。数字美的2025提到,通过快速数字化、机器人化服务为人类创造美好的生活,我相信在AI的不断落地,这是极有可能实现的未来场景。