«Яндекс» представил нейросеть YandexGPT Lite третьего поколения
«Яндекс» создал YandexGPT 3 Lite — облегченную версию собственнойгенеративной нейросети третьего поколения. Она будет доступна клиентам облачнойплатформы Yandex Cloud через API, сообщили в компании.
С помощью обновленной модели можно оптимизировать разные задачи для бизнеса.Например, консультация клиентов в чате и по телефону, подготовка ответов дляслужбы поддержки, создание маркетинговых материалов или дайджеста рабочихвстреч, а также анализ данных.
По итогам теста YaMMLU_ru (русскоязычной версии международного эталонноготеста MMLU), новая модель дает на 6 п.п. больше верных ответов, чем модельпредыдущего поколения.
Две нейросети сравнивали также по методике Side by Side: модели отвечали наодни и те же вопросы, а эксперты выбирали лучший ответ. В среднем YandexGPT 3Lite отвечала лучше, чем YandexGPT 2 Lite, в 68% случаев.

Кроме того, обновленная версия на 62% эффективнее генерирует контент и на67% лучше справляется с задачами классификации. Также новая модель допускаетменьше орфографических и фактических ошибок, чем YandexGPT 2 Lite.

Для создания нейросети третьего поколения разработчики усовершенствовали всеэтапы обучения. В частности, улучшили отбор данных для предварительного этапаобучения (pretraining), повысив долю полезной информации. А кроме того, сталииспользовать на этом этапе технологию curriculum learning, позволяющую поэтапноусложнять данные.
На втором этапе обучения (alignment, или выравнивание модели), включающем всебя обучение с подкреплением (reinforcement learning), улучшили модель дляоценки качества ответов. Кроме того, в архитектуру нейросети добавилитехнологию Grouped Query Attention — она ускоряет обработку данных без потерикачества.
YandexGPT 3 Lite можно интегрировать в свои продукты через API в сервисеFoundation Models. Новая модель заменит предыдущую в течение месяца, нопопробовать ее можно уже сейчас. Стоимость использования YandexGPT 3 Lite — 20копеек за 1 тыс. токенов. Новые пользователи Yandex Cloud смогут бесплатнопротестировать ее в демо-режиме.
Ранее сообщалось, что нейросети «Яндекса» испытывают нехваткутекстов на экзотических языках, что ухудшает качество работы ИИ. Разработчикимоделей машинного обучения (LLM) сталкиваются с проблемой во время работы.
Источник: ria novosti