金沙江創投管理合伙人朱嘯虎向人形機器人“開炮”了。
3月28日,他在采訪中稱,因“商業化不清晰”,正批量退出對人形機器人的投資,引發行業震動。
對此,經緯創投創始合伙人張穎發朋友圈調侃:“朱老板別鬧”,直言朱嘯虎的言論可能影響其未來在機器人領域的投資機會;眾擎機器人CEO趙同陽更尖銳批評其“用眼前否定未來”。
趙同陽直言:“他(朱嘯虎)是非常成功和精明的商人,但很多創業者不是。”
一場投資人與創業者之間的唇槍舌劍,折射出人形機器人在資本狂熱、“泡沫疑云”與技術攻堅之間的復雜處境。
中關村論壇期間,21世紀經濟報道記者見到了銀河通用、星動紀元、穹徹智能、樂聚機器人等具身智能公司創始人,也采訪了智源研究院院長王仲遠,本文將總結他們對人形機器人“泡沫論”、“訓練數據瓶頸”、“人形必要性”、技術路線分歧等方面的觀點,拆解人形機器人爭議大全。
朱嘯虎的退出理由直指商業化前景不明,“誰會花十幾萬買一個機器人去干這些活?”但這一觀點遭到多位從業者反駁。
經緯創投張穎認為,機器人領域“大賽道,百花齊放,過程中有點泡沫也非常正常”,并強調“時間拉長,人形機器人賽道一定能出大公司”。
眾擎機器人趙同陽則表示,朱嘯虎更適合“今年投入后年見效的快餐式項目”,而AI和人形機器人需要長期投入,“質問人形機器人現階段有什么用,就像否定剛出生嬰兒的未來”。
智源研究院院長王仲遠告訴21世紀經濟報道記者,具身智能的訓練非常復雜,需要海量數據,5年時間都是樂觀的,也許需要10年后才能成熟,不同風格的投資機構就會出現分歧。
“如果是比較看重產業落地、希望迅速實現行業應用的機構,也許當下并不是進入具身智能的好時機。”王仲遠表示:“但我們對于具身智能長期發展是非常樂觀的,就好像10年前看無人駕駛技術是一樣的。”
樂聚機器人冷曉琨從產業視角補充:“具身智能是硬件與軟件的耦合,硬件從實驗室到產業化,需要3-5年,軟硬件最終合起來才能真正迎來質變。”
數據是具身智能發展的核心難題。銀河通用創始人王鶴指出,當前數據分為真實數據與仿真合成數據兩類。真實數據中,互聯網視頻雖量大但“不足夠”:“看別人游泳無法學會游泳,除非你已具備基本運動機能。”
他主張“用合成數據做預訓練,用真機數據完成后訓練”,并類比自動駕駛:“人形機器人存量達百萬臺前,合成數據是最寶貴資產。”
樂聚機器人冷曉琨坦言硬件采集觸覺等模態數據成本高企,現在采集的數據模態數量不夠,包括視覺信息、觸覺信息等,在模型未完全確定的時候,投入大量精力采集的數據有被推翻的可能性。
穹徹智能盧策吾更強調實踐檢驗:“數據價值如同配方,需在實踐中動態調整比例,互聯網數據、仿真數據、真機數據各有優劣,需互補克服缺點。”
關于“人形必要性”的爭論由來已久。
行業里有觀點認為,當前70%的場景并不需要機器人具備“人形”,所以“機器人做成人形”的必要性是否不夠充分。
王仲遠在一定程度上認同這一觀點,他舉例說明,行業內也有不少機器人公司已開始迭代輪式構型機器人,以克服雙足機器人穩定性欠佳的問題。
“不過,從長遠來看,人形機器人具有獨特優勢,因其與人的構型相似,能更好地適應社會基礎設施,復用技能,從互聯網數據中學習人類技能,推動具身智能和具身大腦模型的迭代。”王仲遠表示。
樂聚機器人冷曉琨透露:“我們交付的100臺人形機器人已進入工廠,需先解決拿、放、走等基礎技能泛化,再拓展復雜場景。”機器人進工廠以后,樂聚給自己定的標準是連續工作1500個小時左右,才能說人形機器人可以實際用起來。不過,目前人形機器人完成的任務比較簡單,比如搬箱子等,更多精細性任務,需要后期更復雜的訓練。
銀河通用王鶴認為,輪式機器人與人形機器人有不同的適應場景。“輪式機器人成本低、續航長,貨架場景無需雙腿,制約因素是智能而非形態。”他舉例說明,但有些復雜地形,就需要人形機器人穿越,并且,最終人形機器人的目標是走進家庭,不過,距離這個目標,還有很長的一段旅程要走。
穹徹智能盧策吾從工具使用角度力挺靈巧手:“拿錘子、筷子需五指靈活調整,二指無法完成復雜操作。”
當前,隨著具身機器人任務種類和任務量不斷增加,如何在跨本體、跨場景以及跨任務的情況下解決具身機器人的泛化問題,成為具身機器人和具身智能領域面臨的重大挑戰。
智源研究院王仲遠分享女兒的學習經歷,不到兩歲的孩子在春節期間通過觀看大量短視頻,自主學會拆糖果、用牙簽穿藍莓。在不斷嘗試失敗后最終成功。人類大腦的這種自主學習能力遠超當前具身智能模型。科研機構和模型公司始終要攻克的方向,就在于怎么讓機器人能夠自主學習,掌握技能。
銀河通用王鶴認同對人類學習過程的觀察很重要。他指出,人類在學習過程中,通過大模型提供獎勵函數助力強化學習。但目前具身智能在這方面仍處于探索階段。
具身機器人的物理世界智能研發需遵循特定過程。首先,沿著能產生生產力價值的維度探索泛化,如抓取、放置和場景移動等基礎技能。通過合成大數據和少量真機數據實現這些技能的泛化,為人形機器人創造生產力價值。隨后,研究機器人在家庭、工廠等更多場景中跨越技能,最后再探索跨本體。
對于人形機器人的爆發節點,各有闡述。
穹徹智能盧策吾認為,具身智能的ChatGPT時刻不是單一的,而是一批場景,階梯性、漸進地實現。“兩年一周期,物流、食品加工等場景可能會有第一波變化。”
星動紀元陳建宇表示,爆發點要看設定的標準是什么,如果只是簡單的推理問答,可能就比較早,但如果是復雜場景的實際應對與執行,這個標準還是蠻高的。“但這并不妨礙人形機器人的持續應用,一些垂類場景的規模化應用是在持續推進的。”
銀河通用王鶴預測,輪式機器人貨架級別的智能可能在2025年、2026年迎來突破,但如果是每個人都用上人形機器人,這個目標實現的周期就會比較長,尤其未來,人形機器人走進家庭,需要硬件成本與安全性再突破。
智源研究院王仲遠類比深度學習發展史:“從2006年論文到ChatGPT用了16年,具身智能受硬件制約,比較可能的突破時刻,可能是會現在受限的場景下具備可用性、一定的智能性以及一定程度的泛化,積累幾年之后,逐步進化。”他指出,受到大模型快速迭代的正面影響,具身智能的發展也會加速。
樂聚冷曉琨直言:“我覺得可能不會是忽然眼前一亮的時刻,而是整個社會面逐漸用起來,隨著產業化不斷成熟、智能性不斷成熟,慢慢泛化。”他說,硬件產業化沒有捷徑,五年后回頭看方知滲透,而非某刻突然爆發。
朱嘯虎的“撤退”,揭開了人形機器人行業理想與現實的激烈碰撞。短期內,商業化路徑不明、數據成本高企、硬件成熟度不足仍是攔路虎;但長期來看,多模態大模型、世界模型與硬件迭代的共振,可能逐步將具身智能推向“數字-物理”融合的臨界點。
泡沫是技術爆發的前奏,耐心者才能等到春天。當人形機器人真正走入家庭時,今天的爭議或許會成為一段精彩的注腳。