600 ватт против 2300 ватт — таков разрыв в энергопотреблении между одной профессиональной RTX PRO 6000 Blackwell и четырьмя игровыми GeForce RTX 5090. Тесты большой нейросети MiniMax M2.7 показали, что одна флагманская карта для рабочих станций практически не уступает в скорости массиву из четырех топовых видеокарт.
Пользователь Steveibe сравнил возможности профессионального и игрового железа Nvidia на примере работы нейросети MiniMax M2.7 с 230 миллиардами параметров. Чтобы уместить нейросеть в память, автор использовал сжатие IQ3_XXS — этот метод задействовал почти все 96 ГБ видеопамяти новой RTX PRO 6000 Blackwell. Эксперимент включал проверку скорости генерации при контексте в 32 тысячи токенов и максимальной длине ответа в 4096 токенов.Результаты тестов зафиксировали фактический паритет в производительности. Связка из четырех GeForce RTX 5090 выдала 120,54 токена в секунду, в то время как одна профессиональная карта Blackwell показала 118,74 токена. Разрыв в скорости генерации первого токена также минимален: 725 мс у игрового массива против 765 мс у Blackwell. Для сравнения, система из четырех RTX 4090 отстала от новинок почти вдвое, продемонстрировав лишь 71,52 токена в секунду. Специализированная платформа DGX Spark и вовсе оказалась аутсайдером сравнения с результатом 24,41 токена.





Комментарии (0)
Пока нет комментариев. Будьте первым!