
Anthropic представила новую флагманскую модель Claude Opus 4.8, которая блестяще справляется с математическими задачами и генерацией кода, но расходует весь лимит токенов за один запрос. Мы протестировали её в шести сценариях и делимся результатами.
Результаты тестирования Claude Opus 4.8
Математика и логика
Модель блестяще решила сложную математическую задачу, показав превосходство над предыдущими версиями. Точность вычислений и логических рассуждений оказалась на высоте.
Генерация кода
Claude Opus 4.8 без единой ошибки сгенерировала готовую игру, что подтверждает её способность к сложной программной разработке.
Расход токенов
Главный недостаток — чрезвычайно высокий расход токенов. Всего один промпт может исчерпать суточный лимит, что делает модель дорогой для массового использования.
Значимость для рынка
Claude Opus 4.8 — мощный инструмент для узких задач, требующих высокой точности, но его прожорливость ограничивает применение в реальных проектах. Пользователям стоит учитывать этот компромисс при выборе модели.

