在讀小學的時候,老師會經常讓我們寫「想象作文」,那個時候我寫的最多的題材就是 機器人 。
各種各樣的機器人,比如我是個山西人,小時候幾乎頓頓都吃面,面不像米,每次都得現場和面,非常耗時間,我就幻想著有一個機器人可以幫忙和面;後面長大了點,我就會被派去掃地,這個時候我就又幻想著有一個機器人幫忙掃地拖地。
沒想到過了10幾年過去了,具有這些功能的機器人不僅僅被發明了出來,並且一個個的都進入了尋常百姓家,甚至功能比我想象的還要齊全。
除了這些,小時候的我特別喜歡看各種機甲變身的動畫片,但是那個時候沒有手機,沒有電腦,也沒有點播功能,如果想要看動畫片就必須蹲在老式電視機前面等著,過了這個村就沒這個店了。
但老式電視機大家也知道,很難去挪動,不僅僅是笨重,還因為閉路路線的距離限制。
但最近我發現了一個讓我眼前一亮的家庭機器人,也就是美的的家庭服務機器人,它不僅具備了智慧語音機器人功能,更是一個移動的視訊投影機,簡直就是一個隨叫隨到的行動電視!
對了,它的名字叫「小惟」。
我心目中的家庭機器人
我對家庭用機器人分成三種:
1 清潔機器人,掃地機器人就是一個典型的代表。
2 語音機器人,蘋果的siri歸於這一類,要麽有個擬人的裝置,或者壓根就是個普通的行動裝置。
3 家庭管家式機器人,這個市面上我見的不多,可以移動的更是少之又少,美的機器人我覺得可以劃到這一類。
並且從外觀來說,我心目中的機器人是那種簡單圖形組合成的 「可愛生物」,市面上的機器人,要麽是一個會移動的圓餅狀,要麽就是擺件式的語音機器人,實在是跟我心目中的機器人形象大相徑庭。
美的機器人的造型是真的戳中了我這理科直男的童心,對於我來說,機器人的外觀要麽極致擬人,要麽就最簡單的幾何圖形拼接,既然暫時做不到前者,那麽這種簡單的幾何組合體更讓我感覺到真正的溫度。
從官方的介紹中得知, 「方、圓、三角形和諧組合」 的美學構造,還獲得 2022年德國紅點產品獎和智慧產品獎的權威認可 。
當然了,作為機器人,最本質的還要看它的「服務」做的好不好,對於家庭服務機器人,再加上人工智慧從業者的背景,我最關心的就是它是不是足夠的「智慧」。
智慧在機器人身上,我覺得從一個點就可以看出來了,那就是:
互動的智慧度
首先互動,不僅僅是 人機互動 ,也包括了 機機互動 ,以及 機器人與環境 的互動。
人機互動最簡單就是 語音互動 ,語音互動涉及到輸入-理解-輸出三個環節,這三個環節不僅缺一不可,更是要求每個環節都達到相當程度的高度。
其實「 智慧感 」的要求是很高的,智慧感的背後是人工智慧演算法+計算能力+數據三者的有機結合,缺了任何一塊都不能實作智慧。
對於家庭機器人來說,能聽懂說話這一點並不難,美的自研的 AI中台 就有專門處理語音的模組,它可以進行語音辨識,整合數據,提升雲辨識效率,其背後是前端自然語言理解相關演算法、語音模組。但是如何做是需要大量的數據作為支撐的,那麽數據從哪裏來呢?
智慧感的數據支撐-3D語意地圖
這裏不得不提到一個東西,那就是語意地圖 semantic map ,這個跟普通的地圖有什麽區別呢?
我們來做一個比較,這是我附近的一塊區域,這是一個非常常見的2維地圖。
但其實谷歌地圖還可以顯示三維地圖,如圖下所示。
3維相比於2維最明顯的就是多了一個維度,也就是高度,可別小看了這個維度,如果是飛行器需要規劃航行路徑的話,那高度就變的非常重要了。
換到家庭機器人的場景室內也是一樣的道理,高精度的3D室內地圖對於機器人來說是必不可少的,除了精度要高,「 語意 」更是極其重要的資訊。
什麽是 語意 呢,簡單來說,如果沒有語意,那麽沙發、床和桌子本質上沒有區別,都是長方體而已,那麽如果我們想要讓機器人走到電視機旁,那麽它就做不到,因為它的「腦子「裏,也就是資料庫中沒有電視機這麽一個概念。
而語意的效果就在這裏,它可以將 高精度 的室內地圖示註上更具有 實際意義 的語意資訊,那麽之前讓它到電視機前的操作就不再是不可能事件了。
有著語意地圖的加持,美的機器人就可以做到很擬人的操作。具體怎麽操作呢,比如說你想給你女朋友一個驚喜,那你就可以把一束花或者一本書放在小惟的背包裏,透過語音控制它送出去,很意外很驚喜對不對!
其實上述的這些都可以包含在機器人與環境的互動維度中,而美的小惟機器人的「 語意地圖 」是切實的填補了這個空白,讓互動變成的更順暢,也更智慧。
溫暖的學習型管家
你可能會忘了喝水、忘了開窗、忘了吃藥對不對,但是小惟是絕對不可能將這些事忘記的。
它作為一個家庭型機器人,同時也是一個 中控式 的機器人,只要具有 遠端控制 功能的智慧家電,理論上小惟都可以替你操控。
作為一個智慧機器人,那麽學習能力肯定是不可或缺的,這裏就要說到「 人工智慧 」的學習能力了,跟人類一樣,小惟也會透過不斷的「 自適應 」學習,根據你的使用習慣和時間來調整自己。
在經過一段時間磨合後,你會發現機器人甚至比你熟悉你的各種習慣,甚至先你一步,像早晨日出後控制窗簾拉開這種基本操作就更不在話下了。
上述其實的操作只是針對於機器人的同類,而機器人與人的互動則更考驗智慧度。
一個家裏只有一個小惟,但它的主人可能有很多個,那麽在一個很多人的家裏面,小惟同學可以認出來誰是誰嗎?
答案是可以的,這得益於現在先進的「 電腦視覺 」技術,這跟人類的視覺原理是一樣的。想象下這個場景:你在家裏喊了一嗓子:「小惟,過來!「,然後小惟的聲音處理模組就會從嘈雜的環境中辨識出這個指令,並且根據聲音大致判斷你的位置。然後會走到你的身邊,透過 ReID 技術大概確認你的身份,這個技術叫行人重辨識(Person re-identification),本質上就是在一系列的視訊資訊中確定一個人的身份,以為對於機器人來說,它的眼睛就是一個具有「 深度學習 」功能的相機,而ReID技術和深度學習相結合,就可以很準確的釘選你和你的位置。
那麽在確認你身份的時候,又一項技術會被用到,就是 FaceID ,相信這個大家都用過,在各種刷臉支付、刷臉驗證的時候用到的技術就是這個。
至此,ReID+FaceID,一動一靜,兩個技術就可以牢牢的釘選主人。
當然了這些都得益於強大的硬體支撐,語音+雷射雷達+深度相機+靈活的移動裝置缺一不可。
隨叫隨到的一個陪伴者,無疑是家庭的一個好幫手。
錦上添花的娛樂功能
小惟的方腦殼並不單純就是一個「Ipad」,其實它的腦袋裏裝載了一個 鑲入式 的投影機,再結合上它的移動能力。
這不就是個妥妥的移動投影機嘛。
這個真的是滿足了我小時候的想象,隨時隨時我身邊都有一個電視機,我可以躺著看lol比賽,站著看lol比賽,各種角度都可以看lol比賽。
在小惟的介紹裏看到,它的 投影效果 非常不錯,具有很高的 解析度 。除此之外,它裏面還有很多的 互動遊戲 ,水果忍者估計都玩過,那麽在墻上玩水果忍者可能並沒有很多人體驗過。
這個功能對於 家庭教育 的想象空間很大,可以將很多寓教於樂的方式嵌入其中,比如很多的趣味家庭遊戲,123木頭人等。
總結:
最近我學到了一個新詞, RaaS ,Robot as a Service,它是在美的舉辦的「數位美的2025釋出會」,這個詞對我來說既新鮮又不新鮮,因為這個詞在雲端運算中很常見。
雲端運算的很多功能在互聯網中起到的是基石的作用,燃料的作用。那麽我覺得對於未來的人類社會,機器人也會起到基石的作用。從傳統家電的機器人化,到細分領域的導購、清潔、服務、烹飪機器人等多個領域。數位美的2025提到,透過快速數位化、機器人化服務為人類創造美好的生活,我相信在AI的不斷落地,這是極有可能實作的未來場景。