Технологический прорыв на пластинах Wafer-Scale
Результаты независимого аудита Artificial Analysis подтверждают: запрос объемом 10 000 входных токенов обрабатывается системой Cerebras за 5,6 секунды. Для сравнения, официальный облачный сервис Kimi тратит на аналогичную задачу более 160 секунд. Этот разрыв обусловлен архитектурой процессора Wafer-Scale Engine 3, который исключает сетевые задержки, характерные для кластеров из множества видеокарт. Поскольку все данные размещаются на едином кристалле с 44 гигабайтами сверхбыстрой памяти SRAM, маршрутизация экспертов в модели Kimi K2.6 происходит на аппаратной скорости.
Успех проекта доказывает состоятельность стратегии Cerebras, долгое время находившейся в тени рыночных стереотипов. Обладая капиталом в 95 миллиардов долларов после недавнего IPO, компания переходит от работы с небольшими нейросетями к поддержке полноценных триллионных моделей. Архитектура Mixture-of-Experts позволяет Kimi K2.6 демонстрировать показатели, сопоставимые с GPT-5.4, при этом предлагая бизнесу альтернативу дефицитным мощностям OpenAI и Anthropic.





Комментарии (0)
Пока нет комментариев. Будьте первым!