Классические архитектуры вынуждены переписывать весь ответ целиком, если в процессе генерации обнаруживается ошибка. GFusion работает по принципу графических нейросетей: она дорабатывает текст пошагово, не ограничиваясь строгим движением слева направо. Модель сама определяет, какой фрагмент ответа требует проработки на конкретном этапе, что делает процесс генерации гибким.
Сбер представил первую российскую диффузионную модель GFusion
Сбер пересмотрел подход к генерации текстов, запустив GFusion — первую в России диффузионную языковую модель. В отличие от стандартных нейросетей, которые выстраивают предложения последовательно, эта система сначала создает черновой набросок, а затем итеративно уточняет его. Такой метод позволяет достичь прироста скорости работы до 45% по сравнению с GigaChat 3.
Помимо скорости, разработчики выделяют эффективность работы с данными: такие модели способны извлекать больше полезной информации из ограниченных обучающих выборок. Компания уже открыла доступ к исходному коду и инструментам для оптимизации обучения подобных систем. Это первый прецедент в российском секторе генеративного ИИ, когда технология такого уровня масштаба переходит в категорию open source.
Комментарии (0)
Пока нет комментариев. Будьте первым!