Новая нейросеть от Meta* обогнала ChatGPT-4 по производительности в ИИ–тестах

Для twitter

Для facebook и дзен

Для Vkontakte

Для меню

Основное изображение

Meta* выпустила новую нейросеть Llama 3.1 с открытым исходнымкодом, насчитывающую более 400 млрд различных параметров. Модель умеетгенерировать изображения и текст.

«В отличие от закрытых моделей, все модели Llama доступны для загрузки.Разработчики могут полностью настраивать нейросети для своих нужд и приложений,обучаться на новых наборах данных и проводить дополнительную настройку», —сообщила компания в своем блоге.

Также, по словам разработчиков, Llama 3.1 превосходит альтернативныеИИ-модели — GPT-4o и Claude 3.5 Sonnet от OpenAI и Anthropic соответственно —по производительности в таких задачах, как рассуждение, руководство, математикаи многоязычный перевод.

Meta* заявляет, что Llama 3.1 обучалась более чем на 16 тыс. графическихпроцессоров Nvidia H100, а также на большем количестве неанглийских данных,«математических данных» и кода (для улучшения навыков математического мышлениямодели) и последних веб-данных (для улучшения знаний о текущих событиях).

«Как и ожидалось по законам масштабирования для языковых моделей, нашановая флагманская модель превосходит меньшие модели, обученные с использованиемтой же процедуры. Мы также использовали модель параметров 405B для улучшениякачества постобучения наших меньших моделей», — отметила компания.

Пользователи могут протестировать Llama 3.1 на сайте Meta AI*, в чат-ботекомпании, а в отдельных странах в Facebook*, Instagram* и WhatsApp. Такженейросеть, как заявляют разработчики, доступна у партнеров компании, включаяAWS, Nvidia, Databricks, Groq, Dell, Azure и Google Cloud.

Ранее OpenAIпоказала новую нейросеть для работы с большим объемомданных. Она представлена как «экономичная версия» GPT4o.

*Компания Meta признана экстремистской и запрещена на территорииРФ

Автор: Pupkin

Источник: ria novosti