Фокус новой версии смещен на многошаговые сценарии, где ИИ должен самостоятельно взаимодействовать с браузером, терминалом или API. По данным внутренних тестов, модель превосходит предшественницу 4.6 и вплотную приближается к возможностям дорогостоящего семейства Opus. В тестах BrowseComp и OSWorld-Verified система показала высокую эффективность при выполнении сложных действий на компьютере.
Пользователи раннего доступа отмечают улучшенную работу с длительными задачами, которые ранее требовали вмешательства человека. Claude Sonnet 5 научилась самостоятельно проверять промежуточные результаты и корректировать ошибки «на лету». Безопасность также была усилена: модель стала устойчивее к попыткам манипуляции через prompt injection и реже транслирует галлюцинации.
Комментарии (0)
Пока нет комментариев. Будьте первым!