超参数科技训练了名为“猎户座α”的AI智能体-东森新闻直播
点击关闭

生存训练-超参数科技训练了名为“猎户座α”的AI智能体-东森新闻直播

  • 时间:

段奕宏妻子晒恩爱

近日,聚焦人工智能+遊戲賽道的初創公司超參數科技,第一次對外發佈其在遊戲領域的進展。在西山居研發中的吃雞類遊戲《榮耀之海》里,雙方合作的3D生存類AI「獵戶座α」通過從零開始的強化學習訓練,具備了複雜3D環境感知、物資搜索/使用、作戰、團隊配合等能力,展現出了廣闊的應用前景。

然而,遊戲AI仍有兩個懸而未決的問題始終縈繞,其一是環境的複雜度問題,其二是AI的擬人度問題。

自2016年AlphaGo的橫空出世,星際、Dota2、德州撲克、麻將相繼被AI攻克。隨着OpenAI Five和AlphaStar血洗天梯競技場,遊戲領域成為AI研究的主戰場之一。

超參數科技介紹,獵戶座α採用了深度強化學習方法,從零開始,通過與環境的交互和試錯,學會觀察世界、執行動作、合作與競爭策略。AI沒有使用任何人類玩家的對戰數據,完全基於自我對戰(self-play)的方式進行學習。在該項目中,「獵戶座α」訓練一天相當於人類玩家打了10萬年。「獵戶座α」的訓練在超參數科技自研的通用分佈式強化學習引擎Delta上進行,該引擎可以部署在任何公有雲上,目前已經支持了多款遊戲的AI訓練。

在《榮耀之海》里,超參數科技訓練了名為「獵戶座α」的AI智能體,取意宇宙星光,寄望遊戲AI指引人類邁向通用人工智能(AGI)的星辰大海。經過本階段研究,「獵戶座α」已經具備了複雜3D環境感知、物資搜索/使用、作戰、團隊配合等全方位的能力。

成立以來,超參數科技主攻深度學習、強化學習、大系統工程等技術領域。通過將AI能力和遊戲場景進行深度結合,為棋牌類、休閑類、角色扮演類、開放生存類等不同品類的遊戲公司提供人工智能解決方案,幫助遊戲廠商提升開發效率、開啟全新玩法,在遊戲設計、開發、運營等多個環節創造價值。

在AI的訓練過程中,超參數科技研究團隊還觀測到了許多與人類生存進化過程相似的地方。人類在進化過程中,先學會採集食物補充能量、應對惡劣天氣,然後學會各種工具的使用,掌握記憶等高級認知能力,進而學會與族群內同伴分工合作、與其他族群競爭對抗。AI通過多智能體的自我訓練的方式,也表現出了類似的進化現象。隨着訓練局數的增加,AI逐漸湧現出了物資搜集、物資使用、空間感知、認知能力和複雜策略等智能行為。

AI出生後會快速搜集物資,觀察到毒圈外有高級物資時,選擇快速出去拾取后再儘快返回安全區

超參數科技成立於2019年初,已獲得晨興資本、高榕資本A輪融資。創始人劉永升是原騰訊AI Lab總經理、T4技術專家。團隊成員包括來自騰訊AI Lab和IEG遊戲的多位人工智能科學家、技術骨幹,以及海內外頂尖院校的精英夥伴。在騰訊期間,劉永升與團隊主導了圍棋AI「絕藝」、王者榮耀AI「絕悟」的研發工作。

基於上述兩點,超參數科技判斷,具有複雜3D環境、要求多人在線的3D生存類遊戲將成為AI的下一大挑戰。西山居研發中的新遊戲《榮耀之海》作為一款3D遊戲,複雜度相比一般2D遊戲已經上了一個台階,而吃雞類遊戲的超大地圖、百人同局等要素又進一步增加了技術難度。

今日关键词:科比坠机通话曝光