從技術路線上看,目前基于大模型的“大腦”技術路線正處在并行探索階段,并逐漸向端到端的大模型演進。
現階段主要是 4 條技術路線:
一、 LLM(大語言模型)+VFM(視覺基礎模型)
實現人機語言交互、任務理解、推理和規劃,目前最為成熟。主要代表是谷歌的
SayCan 模型,通過預訓練技能的價值函數對齊(Grounds)大語言模
型或者通過價值函數的訓練使大語言模型對用戶指令進行推理分解
獲得任務步驟。
二、 VLM(視覺-語言模型)
彌合語言與視覺理解間的差距,讓機器人實現更準確的任務規劃和決策。主要代表是清華大學的 CoPa
模型,利用嵌入在基礎模型(比如視覺語言模型的代表 GPT-4V)中
的常識知識為開放世界機器人操控生成一系列的自由度末端執行器
姿勢,生成的操控任務分為任務導向抓取和感知運動規劃。
三、 VLA
(視覺-語言-動作模型)
在 VLM 基礎上增加運動控制,解決機器人運動軌跡決策問題。主要代表是谷歌的 RT-H 模型,學習語言和運動,
并使用視覺上下文,通過利用語言-視覺-動作結合的多任務數據集學
習更強大和靈活的動作策略。
四、多模態大模型
實現對物理世界環
境的全面感知,是未來的主要研究方向。主要代表是麻省理工、IBM
等共同研究的 MultiPLY 模型,將視覺、觸覺、語音等 3D 環境的各類
特征作為輸入,以形成場景外觀的初步印象,并通過多視圖關聯將印
象中的輸出融合到 3D,最終得到以對象為中心的場景特征。
此外,類腦智能和腦機接口等創新技術也為人形機器人“大腦”的
解決方案帶來無限可能。類腦智能是人工智能技術的進一步延伸,是
通過對人腦生物結構和思維方式進行直接模擬,使智能體能夠像人腦
一樣精確高效處理多場景下的復雜任務,是未來有望代替大模型的新
技術路線。腦機接口是在人腦與外部設備間建立連接通路的技術,實
現人腦與外界設備的信息交換。未來有望基于腦機接口實現“大腦”的
“人+機”混合智能。
迎賓服務機器人需要整合視覺,聽覺,觸覺等多種感知模態,使機器人在復雜場景中做出更準確的決策;結合聽覺和觸覺信息,機器人可以更好地理解人類的指令和情感狀態
基于模型的小腦技術路線控制方法有ZMP判據及預觀控制,混雜零動態規劃方法,虛擬模型解耦控制;基于學習的小腦技術路線控制方法有強化學習和模仿學習
展廳迎賓機器人的“小腦”核心技術正在從基于模型的控制方法向基于學習的控制方法演進,視覺-語言模型為機器人學習復雜技能提供了新的范式,有很強的泛化能力,能夠根據不同的指令組合技能
機器人機械手有多個關節和多個自由度,具有很高的靈活性;配置了必要的傳感器,可以精確控制機械手的操作;微小的外形尺寸使得機械手具有很高的操作精度
AI陪伴機器人在外觀設計具備人類相似特征;在行為模式上模仿人類的行為,具備手眼協調,動態足控制能力;在各個領域的實際應用和用途,協助人類完成各種復雜任務
多模態感知技術讓機器人具備類似人類五感的多模態智能感知能力;通過表情識別、語音情感分析等技術,讓機器人感知人 類情緒并做出相應情感回應,增加親和力和互動性
迎賓機器人需要具備與人類實時的任務級交互能力,快速理解人類通過語言,手勢等方式給出的指令,有效執行;迎賓機器人需要能夠通過視覺、聽覺、觸覺等多種感官獲取信息
LDS SLAM 與 VSLAM 各有優劣,二者相容或成為行業主流發展方向之一;LDS SLAM 技術可視范圍廣,地圖精度更高;VSLAM技術成本更低,壽命長,不易損
將重復率較高,工作內容較枯燥的工作交給服務機器人去做,可以使員工把更多的精力集中在服務客戶上面,并可以降低一定成本,可降低總成本的17%
送餐已經可以通過機器人自主完成,員工可以把節省出來的時間和精力,投入在給客人慶生,涮菜涮肉等服務水平的提升上,機器人真正帶來了降本增效
送餐已經可以通過機器人自主完成,員工可以把節省出來的時間和精力,投入在給客人慶生,涮菜涮肉等服務水平的提升上,機器人真正帶來了降本增效
醫療機器人已成為智慧養老模式下的首選養老設備,醫院中有繁雜的配送藥物或餐食的任務,并且需在特定時間準時送達
服務機器人可以使人工成本降低50%左右;酒店場景中服務機器人便于給客戶打造私密空間;旅游場景中服務機器人可以給出完全透明且準確的信息
酒店引導機器人以機器人硬件為載體,依托云平臺強大的智能服務技術,引入智能語音交互系統,大數據分析系統,智能視覺識別系統,真正實現“能聽,會說,能思考,會判斷,看得見,認得出”的智能化服務
特斯拉量產后預計售價 2 萬美元;優必選Walker價格200 萬; Ameca價格13.3 萬美元; Digit價格25 萬美元;Atlas價格190 萬美元;Asimo價格近 300 萬美元
創澤知名的機器人推薦27寸超大屏智能服務機器人,用戶交互更便捷;接待講解,引導跟隨,業務咨詢,宣傳巡邏等功能,提高業務效率,提升企業形象
智慧圖書館服務機器人要比人類方便的多,可以隨意尋求幫助,不用尷尬,不用不好意思,會給你講笑話,逗你開心,幫你答疑解惑,排除你的煩惱
機場指路機器人通過語音和屏幕終端與旅客進行交流互動,獲取航班信息,服務流程,機場設施等各類信息,能準確定位,為旅客提出最優路徑指引