登錄
註冊
據 Woofun AI 消息,喬治亞理工學院機器人專家 Animesh Garg 在《物理人工智能領域的'數據驅動策略'》一文中提出警示,行業普遍信奉的通過增加遠程操控次數、擴大應用範圍及延長運行時間來構建數據循環系統的邏輯存在根本性缺陷。Garg 將體化智能領域的數據競爭比作棒球運動中的“數據驅動策略”時刻,質疑累計運行時間是否真能反映模型發展的實質性進展。對於投資者而言,這不僅是學術爭論,更關乎體化智能企業的成本結構、商業化速度及核心競爭優勢的重新定義,若數據資產無法轉化爲模型能力的提升,市場估值邏輯將面臨重構。Garg 借用了 2002 年奧克蘭運動家隊的經典案例,該隊以極低薪資贏得 103 場勝利,關鍵在於發現了球員估值中的市場低效,即傳統球探看重的打擊率、盜壘數不如上壘率關鍵。同理,物理人工智能領域可能正處於類似階段,業界雖認同數據是開發通用機器人模型的必備要素,卻往往只關注累計遠程操控時長、訓練案例數量、部署機器人數量及實際運行時間等易於量化的指標,而忽視了數據本身的內在質量與分佈特徵。機器人數據與文本數據的性質截然不同,大型語言模型可從互聯網、代碼倉庫及書籍中獲取海量低成本文本數據,其瓶頸主要在於計算能力、數據清洗以及訓練效率方面;而機器人模型則需要包含物理交互、動作反饋及環境變化信息,每一小時有效數據的獲取都需耗費實際資源,與設備成本、人力投入、場地條件、傳感器性能、故障處理機制及安全措施緊密相關。機器人專家 Ken Goldberg 曾用“10萬年的數據差距”這一術語來形容機器人數據與互聯網規模的人工智能數據之間的差異,即當前訓練大規模視覺語言模型的文本圖像數據若換算爲人類閱讀觀看時間,相當於 10 萬年量級,而機器人領域缺乏同等規模的真實世界交互數據。
這種說法並不是爲了爲機器人模型設定具體的評判標準,而是想提醒業界:真實世界交互數據的獲取成本遠高於網絡文本數據。這也正是 Garg 反對將'機器人遠程操控視爲低成本高效生產方式'的原因,雖然大量手動遠程操控能生成豐富訓練數據,但若僅根據數據總量評估價值,資金將流向重複性高、難度低且信息密度低的樣本,而非能有效降低故障率的場景。在 Garg 的分類體系中,物理人工智能數據大致可以分爲三類:觀測數據、干預數據和部署數據,它們在成本、使用限制及信息密度方面存在顯著差異。第一類觀測數據如第一人稱或第三人稱視角視頻,優勢在於成本低且覆蓋廣,有助於模型理解物體、空間、動作結果及環境因素,但缺點在於模型雖能觀察人類或物體行爲,卻未必能確定機器人在特定情況下應採取的行動。第二類是干預數據,這類數據包括遠程操控過程中產生的軌跡數據、教學過程中收集的數據以及人在其中參與指導所產生的數據,對機器人訓練具有直接價值,因包含'觀察到了什麼、如何移動及移動後發生什麼'的連續信息,但獲取高質量干預數據成本極高,且勞動力與設備成本下降速度可能遠低於軟件數據成本。第三類是部署數據,這類數據是指機器人在實際商業環境中運行時產生的遙測數據。從某種角度來看,這類數據與企業的業務發展模式非常相似,即機器人邊工作邊產生收益並生成訓練數據,但實際操作中存在統計陷阱。目前機器人首次應用通常發生在環境變化小、流程清晰且風險可控的場景,如結構整齊倉庫、工廠或單一任務場合,雖然生產數據數量可觀,但分佈狹窄且重複性高,一旦模型掌握局部規律,每多運行一小時產生的數據價值將顯著下降。部署數據並非毫無價值,真正有價值的是失敗案例、運行異常、特殊邊界條件及罕見干擾因素,但這些特殊數據不會以企業期望的穩定頻率出現,且篩選分析故障原因成本較高。Garg 對借鑑語言模型擴展規律持謹慎態度,增加數據量雖有助於降低訓練誤差,但收益會逐漸遞減,若訓練樣本高度重複或來自狹窄分佈,新數據幫助將迅速減弱。在機器人技術背景下,這一問題更爲明顯,例如學習從固定貨架取放包裹的機器人,最初幾千次訓練、失敗及調整產生的數據價值極高,但一旦動作、對象、光照及路徑信息被充分記錄,後續新增數據很可能只是重複已知知識。語言模型訓練領域也出現過類似情況,重複性強且幾乎完全相同的訓練數據會浪費資源並影響模型一般化能力,Garg 雖未直接將結論應用於機器人訓練,但藉此說明了一個重要的觀點:評估數據價值的依據不應該僅僅是數據量,還應該考慮不同樣本之間的差異程度。對於物理人工智能,'多樣性'至少具有兩層含義:一是讓模型接觸更多物體、空間環境、材料類型、光照條件、遮擋現象及不同操控方法;二是防止模型在簡單任務環境表現良好卻在稍有差異場景出問題。因此,極端情況或異常現象的訓練數據尤爲重要,現實世界情況從來不是均勻分佈,低頻出現的異常現象往往決定技術方案商業可行性,如物體位置偏差、包裝變形、表面反光、夾持器打滑、人爲干預、傳感器檢測失敗及地面摩擦力變化等,無論模型在常規樣本表現多好,若無法應對這些異常,實際應用仍會遇阻。這篇文章挑戰了體化智能企業普遍採用的商業化路徑:先在有限場景部署機器人,通過人工遠程操控確保運行並收集生產數據,再利用數據訓練更強模型並擴展應用範圍。Garg 將這種路徑稱爲'新型整合型'發展模式,試圖繞過單純數據收集環節,讓機器人儘快進入商業應用,用運營營收抵消數據收集成本,相比建立專門遠程操控基地,此路徑看似更高效。但要建立真正有效的數據循環系統,前提是早期商業應用產生的數據必須具有足夠新鮮度和多樣性,以助模型適應更多場景。若場景變異性低、熵值低且專爲特定任務設計,數據很快飽和,企業最終得到的可能不是具備通用功能的強大模型,而是一系列需持續集成、維護和處理異常的定製化項目,導致兩類成本增加:一是每個新場景需投入資金調整環境、優化流程、制定故障方案及加強安全;二是若部署未實現盈虧平衡,擴大規模不意味低成本獲取更多數據,反而可能需用大量重複數據彌補成本損失。因此,早期部署機器人並非無意義,而是需仔細分析實際效果:新場景能爲模型帶來多少新功能覆蓋?生成多少失敗案例和異常數據樣本?這些樣本是否可應用於其他場景?扣除硬件、人力、維護及集成成本後,每花費一美元獲得的模型改進效果是多少?Garg 建議並非停止數據收集,而是改變評估數據價值的重點,累計運行時間、遠程操控時長及訓練案例數量可作爲衡量指標,但不應直接代表模型發展進度。更值得思考的問題包括:某項具體任務的數據飽和點何時出現?添加新功能需投入多少系統集成成本?數據在多大程度上覆蓋不同應用場景和動作類型?生產數據中有多少由環境變化或異常樣本導致?部署過程中有多少常規'成功案例'應被過濾而非用於訓練。根據這三類數據的不同特點,資本分配方式也應有所區別:觀測數據應優先考慮低成本、高多樣性和廣泛應用範圍,以擴大模型基礎功能;成本較高的遠程操控和教學數據,當針對具體任務收集達到飽和後,應將預算轉向開發更多新應用功能而非重複訓練;部署數據則應重點關注失敗案例、特殊邊界條件及偏離正常分佈的樣本,同時剔除大量信息密度低的常規操作數據。這套觀點對評估物理人工智能價值有重要實踐意義,擁有更多機器人、更長運行時間或更龐大遠程操控團隊,不一定意味着企業具備更強競爭優勢,真正難以複製的競爭力可能在於能否持續獲取高價值的數據、能否及時判斷哪些數據已經達到了飽和狀態,以及能否以更低成本覆蓋更多應用場景。
然而,這仍只是關於資本分配的角度,並非行業共識,機器人模型是否像語言模型那樣呈現規模效應?部署數據是否能在某些高維應用場景持續產生新有用信息?不同應用場景間數據遷移效率如何?這些問題需更多實證研究解答。Garg 的提醒指向一個更具體問題:衡量物理人工智能發展成效的'關鍵指標'可能不是數據收集總量,而是每花費一美元所能獲得的具有新穎性的數據樣本數量。對於那些仍依賴'數據循環系統'講述發展故事的機器人企業,市場最