Пока весь хайп крутился вокруг DeepSeek, Алибаба 27 января тихо выкатила своего монстра - Qwen3-Max Thinking.
Судя по цифрам, китайцы реально смогли. В тесте на логику (HMMT) выбили 98 баллов, обойдя и Gemini 3 Pro (97.5), и DeepSeek V3.2 (92.5). Пишут, что фишка в "нелинейном мышлении" - модель умеет сама себя исправлять в процессе, если заходит в тупик, а не просто лепит токены подряд.
По деньгам: $1.20 за вход и $6 за выход. Дороже "народного" Дипсика, но дешевле топов. В комментариях народ справедливо замечает: какие бы баллы не рисовали, для надежности всё равно приходится прогонять инфу через 3 разные нейронки, чтобы не словить галлюцинации.
Кто уже щупал API? Как она с русским языком дружит в этом режиме "мышления"?
Судя по цифрам, китайцы реально смогли. В тесте на логику (HMMT) выбили 98 баллов, обойдя и Gemini 3 Pro (97.5), и DeepSeek V3.2 (92.5). Пишут, что фишка в "нелинейном мышлении" - модель умеет сама себя исправлять в процессе, если заходит в тупик, а не просто лепит токены подряд.
По деньгам: $1.20 за вход и $6 за выход. Дороже "народного" Дипсика, но дешевле топов. В комментариях народ справедливо замечает: какие бы баллы не рисовали, для надежности всё равно приходится прогонять инфу через 3 разные нейронки, чтобы не словить галлюцинации.
Кто уже щупал API? Как она с русским языком дружит в этом режиме "мышления"?
