Meta 即將推出的 Llama-3 400B 車型可能會擊敗 GPT-4 Turbo 和 Claude 3 Opus

它沒有超過它們，但它有潛力

閱讀時間圖標 2分鐘讀

日曆圖標發表於 2024 年 4 月 19 日

發表於 2024 年 4 月 19 日

讀者幫助支持 MSpoweruser。如果您透過我們的連結購買，我們可能會獲得佣金。

重點說明

Meta 將推出其迄今為止最強大的人工智慧模型美洲駝-3 具有 400B 參數。在其公告週四，開源模型將很快為 WhatsApp 和 Instagram 上的 Meta AI 助理工具提供支援。

但事實是，目前市場上有許多強大的人工智慧模型。 GPT-4渦輪 OpenAI 的 128k 上下文視窗已經存在相當長一段時間了，Anthropic 的 Claude 3 Opus 是現已在亞馬遜基岩上。

那麼，根據多個基準，這些模型之間的比較如何？以下是這些強大模型在多個選項中的測試情況的比較。這些數字取自公開資訊和 Meta 的公告.

如您所看到的，Llama-3 400B 實際上在這些基準測試中確實稍顯不足，在MMLU 中得分為86.1，在GPQA 中得分為48，在HumanEval 中得分為84.1，在MATH 中得分為57.8 。

但是，鑑於它仍處於訓練階段，一旦完全部署，很有可能會出現重大改進。對於開源模型來說，這遠遠超出了令人印象深刻的程度。

MMLU 測試模型在不直接教授不同主題的情況下對它們的理解程度，涵蓋了廣泛的主題。另一方面，GPQA 根據模型在生物學、物理和化學方面的表現對模型進行排序，而 HumanEval 則專注於它們的編碼方式。

拉夫利·吉朗

科技記者

Rafly 是一位擁有多年新聞經驗的記者，涉獵領域涵蓋科技、商業、社會和文化。目前在 Windows Report 和 MSPowerUser 上報告 Microsoft 相關產品、技術和 AI 的新聞。有小費嗎？發送至 [電子郵件保護].