На конференции AI Journey 2023 Сбер объявил о создании самой сильной продакшен-модели для русского языка, которая ляжет в основу следующей версии GigaChat.
Самыми первыми новую модель смогут опробовать бизнес-клиенты Сбера и участники академического сообщества.
Благодаря новой LLM GigaChat лучше следует инструкциям и может выполнять более сложные задания. Сравнительный анализ показал, что с новой моделью качество повысилось на 23%, при этом с фактологией анонсированная модель справляется на 25% лучше предыдущей версии.
По результатам внутренней оценки в бенчмарке MMLU (Massive Multitask Language Understanding) модель новой версии GigaChat с 29 млрд параметров превосходит самый популярный открытый аналог LLaMA 2 34B.
Автор: Нетипичная Москва | Новости
новость от 27.11.2023 13:15