Meta представила Llama 4 — нове покоління відкритих ШІ-моделей

08 квітня 2025 р.

Meta представила нове покоління відкритих ШІ-моделей — серію Llama 4. За результатами внутрішніх тестів, моделі перевершують конкурентів у низці бенчмарків, особливо в задачах STEM-напряму.

Флагман серії — Llama 4 Behemoth — це мовна модель (LLM) з 2 трильйонами параметрів, яка наразі перебуває на етапі навчання. Водночас її мультимодальні «учні» — Maverick та Scout — уже доступні розробникам і користувачам.

Оновлений Meta AI, інтегрований у WhatsApp, Messenger та Instagram, працює на базі Llama 4 і вже доступний у 40 країнах. Мультимодальні функції наразі обмежені США.

Архітектура нового покоління

Llama 4 — перша модельна серія Meta, що використовує архітектуру Mixture of Experts (MoE). У Maverick — 128 експертів і 400 млрд параметрів, з яких активно залучено лише 17 млрд. У Scout — 16 експертів, 109 млрд параметрів і ті ж 17 млрд активних.

Внутрішні тести показали, що Maverick впевнено випереджає GPT-4o та Gemini 2.0 у низці задач — від програмування до розуміння довгих текстів та зображень. Утім, модель поки що поступається Gemini 2.5 Pro, Claude 3.7 Sonnet та GPT-4.5.

Maverick краще підходить для чат-інтерфейсів та універсального застосування, тоді як Scout ефективний для роботи з великими документами та базами знань. Scout здатен працювати навіть на одному GPU Nvidia H100, тоді як Maverick потребує повноцінну H100-систему.

Скандал та спростування

Після публікації рейтингу LLM Arena, де Maverick посіла друге місце, дослідники звернули увагу, що в тесті використовувалася спеціально оптимізована версія моделі, яка недоступна публічно. Вона створювала довші відповіді й частіше використовувала емодзі, що викликало сумніви щодо її реальної ефективності у звичайному використанні.

Віцепрезидент Meta з генеративного ШІ Ахмад Аль-Дахле спростував твердження про цілеспрямоване налаштування моделі під конкретні тести. За його словами, коливання в якості відповіді пов’язані з процесом стабілізації фінальної версії.

«Це лише початок серії Llama 4, — підкреслили в Meta. — Наша мета — створювати системи, здатні вирішувати складні завдання, ефективно взаємодіяти з людьми та генерувати узагальнені рішення. Такі технології допоможуть нам створювати кращі продукти та відкриватимуть нові можливості для розробників».

Інші новини