逆戟鯨 2 是什麼? 微軟最新的下降可能會超越較小的型號並與較大的型號競爭

閱讀時間圖標 2分鐘讀


讀者幫助支持 MSpoweruser。如果您透過我們的連結購買,我們可能會獲得佣金。 工具提示圖標

請閱讀我們的揭露頁面,了解如何幫助 MSPoweruser 維持編輯團隊的發展 阅读更多

人工智慧競賽剛剛進入白熱化階段。 除了 OpenAI 領導層的改組之外,還涉及(現為前任)首席執行官 山姆·奧特曼該公司董事會和總部位於雷德蒙的科技巨頭微軟「悄悄」推出了其最新的小語言模型。 它被稱為 Orca 2,從它的外觀來看,這可能是微軟應對日益嚴峻的人工智慧挑戰的答案。 

Orca 2 不只是說說而已,而是言出必行。 Orca 2 的性能優於類似尺寸的模型,並與幾乎十倍大的模型進行正面交鋒,尤其是在測試高級推理的棘手任務中,Orca XNUMX 正在證明自己的價值。 

提供兩種大小,7 億和 13 億個參數,兩者都根據特殊的合成數據進行了微調,微軟表示,它正在為公眾制定權重,以「鼓勵研究」較小的語言模型。 

請參閱下面的圖表,了解 Orca 2 在各種基準測試中與其他類似尺寸的型號甚至是大 5-10 倍的型號相比的表現如何。

「產生的訓練資料可以教導 Orca 2 各種推理技術,例如逐步處理、回憶然後生成、回憶-推理-生成、提取-生成和直接答案方法,同時也教它選擇不同的任務有不同的解決方案策略。」微軟在 官方公告

幾個月前,雷德蒙的研究人員推出了前身 Orca 1,擁有 13 億個參數。 你可以閱讀微軟的 Orca 2 論文在這裡

發表評論

您的電子郵件地址將不會被發表。 必填字段標 *