провел небольшой эксперимент касательно фронтенд дизайна

промпт в opencode: you need to redesign my @admin/app/[lang]/analytics/ page make it look modern, easy to read and digest, focus on making operations clear and focused on getting insights without clutter. feel free to use any appropriate UI widgets or UX techiques. you can install components in shadcn ui if needed [тут копипаста доступных shadcn компонентов]

начинали мы вот в таком состоянии:

это наша точка отсчета. интерфейс который формально имеет все необходимые контролы и инфо…
это наша точка отсчета. интерфейс который формально имеет все необходимые контролы и информацию, но безумно страшен

теперь результаты:

по часовой стрелке с верхнего левого угла: gpt5.3-codex, gemini3.1pro, gemini3.1pro-xhigh…
по часовой стрелке с верхнего левого угла: gpt5.3-codex, gemini3.1pro, gemini3.1pro-xhigh, opus4.6-max, opus4.6, gpt5.3-codex-xhigh

каждая модель начала от точки отсчета и независимо от остальных пришла к своему решению

в результате выросло вот такое вот дерево. ниже подробнее про каждую ветвь
в результате выросло вот такое вот дерево. ниже подробнее про каждую ветвь
gpt5.3-codex. это какойто ужас. на первый взгляд, выглядит лучше, но если вглядется, то в…
gpt5.3-codex. это какойто ужас. на первый взгляд, выглядит лучше, но если вглядется, то видно что куча информации просто напросто дублирована вместо того чтоб красиво упакована.
gpt5.3-codex-xhigh. проблема с дублированием сохранилась, но стало типа красивее. будто и…
gpt5.3-codex-xhigh. проблема с дублированием сохранилась, но стало типа красивее. будто идеи которые пришли в голову gpt5.3-codex в режиме xhigh были просто глубже продуманы и реализованы с большим старанием. бредовые идеи. зато старательно
при этом gpt5.3-code поменяла только один файлик который ее просили
при этом gpt5.3-code поменяла только один файлик который ее просили
в то время как в режиме xhigh было поменяно уже два файлика, второй правда без особой над…
в то время как в режиме xhigh было поменяно уже два файлика, второй правда без особой надобности, но да ладно...
gemini3.1pro. гораздо чище! жирный зеленый блок сразу приковывает взгляд к самой важной ц…
gemini3.1pro. гораздо чище! жирный зеленый блок сразу приковывает взгляд к самой важной цифре на странице, это хорошо. были добавлены иконки, тоже хорошо! контролы были переработаны и вынесены в одну строку, но к сожалению понять какой именно в данный момент выбран временной промежуток и источник траффика нет никакой возможности :(
та же самая gemini3.1pro но теперь в режиме xhigh. как будто бы ситуация которую мы наблю…
та же самая gemini3.1pro но теперь в режиме xhigh. как будто бы ситуация которую мы наблюдали с gpt повторилась и тут. ровно те же самые идеи, но более продуманные. на этот раз модель видимо сообразила что ей надо показать текущее состояние дней и траффика, но сдалась, переделав их в простой select контрол. технически это работает но я бы сказал что это шаг назад по сравнению с тем что нужно. в остальном, чистенько, но не более. иконки табов тоже кудато потерялись

кстати, про xhigh. с этим режимом вышел затык, так как gemini настолько хрупкая что ни один из 3(!) платных провайдеров не смог предоставить достаточно стабильно эту модель на таком высоком уровне effort. она постоянно спотыкалась и вконце где то финальную треть мне пришлось выполнять в режиме high, вместо xhigh. и в целом оба раза gemini3.1pro постоянно спотыкалась на элементарных вызовах типа прочитать файл и пыталась сделать это командой cat вместо встроенных средств в opencode. с горем пополам она дважды доползла до финиша но это было жалкое зрелище

относительно изменных файлов ситуация следующая. в базовом режиме gemini3.1pro поменяла т…
относительно изменных файлов ситуация следующая. в базовом режиме gemini3.1pro поменяла только то что ее просили, прям как gpt5.3-codex
а вот в режиме xhigh уже таки поставила новые компоненты из предложенных ей библиотечных…
а вот в режиме xhigh уже таки поставила новые компоненты из предложенных ей библиотечных и даже написала парочку своих кастомных.
opus4.6. наконецто мы имеем контролы которые не только красиво выложены в две строки по с…
opus4.6. наконецто мы имеем контролы которые не только красиво выложены в две строки по смыслу, но и верно подсвечены в зависимости от текущего статуса! приятные иконки также сопровождают буквально каждый блок куда вообще можно было воткнуть иконку! однако на странице как будто нет фокуса. взгляд размазывается не зная, на чем сфокусироваться... к тому же в угоду компактности, график воронки был значительно уменьшен, но его все еще легко разглядеть. в целом очень компактно!
опус при этом поставил новые библиотечные компоненты и вдобавок написал своих кастомных.…
опус при этом поставил новые библиотечные компоненты и вдобавок написал своих кастомных. э это без всякого режима высого effort! в стандартном режиме!
наконец, opus4.6-max. этот поразил меня больше всего. и вовсе не финальным результатом, к…
наконец, opus4.6-max. этот поразил меня больше всего. и вовсе не финальным результатом, который на мой взгляд чуть уступает opus4.6 в обычном режиме. но тем что в режиме max effort клод4.6 был единственным кто спросил меня чего я хочу! например он поинтересовался хочу ли я заменить наш график воронки на 3 статусбара которые будут занимать меньше места на странице и легче читаться. и он единственный кто заметил что страница используется на 3х языках и предложил сразу вписать переменные языковых строк, вместо того чтоб хардкодить англ!
и в результате в добавок ко всему что сделал обычный opus4.6 этот еще и перевел интерфейс…
и в результате в добавок ко всему что сделал обычный opus4.6 этот еще и перевел интерфейс на все нужные языки и сразу сделал "по красоте" без доп инструкций и итераций

что в итоге? кто победил? на мой личный вкус победил opus4.6 либо в режиме max, либо в обычном, в зависимости от личного вкуса и любви к иконкам. но что я могу сказать точно, так это то что для фронтенд дизайна gpt5.3-codex не подходит совершенно. может быть я не умею промптить, но на мой взгляд я скорее выпущу проект с LLM которая меня понимает, чем с той которую надо еще отдельно учиться промптить. YMMV как говориться!

ЗЫ: а теперь бонус раунд! чем же ответят китайские друзья? давайте посмотрим. я решил взя…
ЗЫ: а теперь бонус раунд! чем же ответят китайские друзья? давайте посмотрим. я решил взять 3 топ китайских модели и пропустить их через тот же самый процесс. в теории они должны быть на порядок дешевле чем модели из США
glm5 неприятно удивила. она оказалась еще хуже чем gemini3.1pro в том что касается вызова…
glm5 неприятно удивила. она оказалась еще хуже чем gemini3.1pro в том что касается вызова тулов в opencode оснастке. она спотыкалась буквально на каждом шагу, неверно отображала собственный reasoning и даже не смогда дойти до первой четверти испытания. в результате даже показать нечего. единственное что сохранилось от ее усилий это вот это дерево изменений. она успела поставить 1 компонент и на этом запнулась окончательно.
когда цена этих мытарств перевалила за доллар, я остановил это жалкое зрелище
когда цена этих мытарств перевалила за доллар, я остановил это жалкое зрелище
для контекста, вот во сколько мне обошлись опусы. около 2х долларов каждый в зависимости…
для контекста, вот во сколько мне обошлись опусы. около 2х долларов каждый в зависимости от уровня effort

Story image 20

и вот столько стоила "дешевая" gemini3.1pro. в нормальном режиме вышло действительно недо…
и вот столько стоила "дешевая" gemini3.1pro. в нормальном режиме вышло действительно недорого. но в режиме xhigh-high цена начала приближаться к opus4.6 и gpt5.3-codex во многом просто потому что gemini3.1pro постоянно спотыкалась и саботируя саму себя делала снова и снова ненужную работу в процессе

Story image 22

настала очередь kimi-k2.5. вполне достойно. немного разнопёро, но формально задача выполн…
настала очередь kimi-k2.5. вполне достойно. немного разнопёро, но формально задача выполнена. контролы на месте и их статус даже почти ясен с первого взгляда. иконки были приделаны, но как то не везде... воронка была переделана в прогресс бары и добавлен новый чарт с трендами. все это без лишних вопросов и мытарств. просто пошли и сделали
что особенно приятно, kimi-k2.5 во многом полагалась на стандартные компоненты, которые с…
что особенно приятно, kimi-k2.5 во многом полагалась на стандартные компоненты, которые сама же и установила. кастомного компонентного кода относительно немного.
но самое приятное это конечно цена! 12 центов карл! двенадцать ЦЕНТОВ! за примерно то же…
но самое приятное это конечно цена! 12 центов карл! двенадцать ЦЕНТОВ! за примерно то же самое что opus4.6 сделал за $1.79. неудивительно что anthropic обвиняют китайцев в воровстве! они не только выдают примерно то же самое качество, но и буквально в 10 раз(!) дешевле.
и наконец настала очередь minimax. я специально выбрал free режим, особенно ни на что не…
и наконец настала очередь minimax. я специально выбрал free режим, особенно ни на что не надеясь, просто хотелось попробовать, что же нынче можно сделать вообще ЗАДАРОМ?

барабанная дробь!

тада!
тада!

ок. это было не совсем честно по отношению к другим. формально minimax можно было бы дисквалифицировать прямо тут, как и glm5.

однако! там где glm5 сожрала больше доллара из моего кармана, ничего не дав взамен, minimax вообще не просил денег! решив что дареному коню в зубы не смотрят, с решил немного подыграть модели. и отправил ей в ответ ошибку. она извинилась, немного посопела и выдала:

это! ээх. мде... ладно. в третий раз закинул старик невод в бесплатное китайское море...
это!

ээх. мде… ладно. в третий раз закинул старик невод в бесплатное китайское море…

и вуаля! результат. который я бы посадил между gpt5.3-codex и gemini3.1pro. также как и g…
и вуаля! результат. который я бы посадил между gpt5.3-codex и gemini3.1pro. также как и gemini3.1pro оно считерило с контролом временного промежутка. и также как и gpt5.3-codex оно особенно ниче не сделало со всем остальным, лишь немного причесав все визуально и добавив график трендов, прям как kimi-k2.5 (видимо любят китайские модели этот график трендов, наверное это некое культурное различие востока и запада или чтото типа того...)
касательно файлов minimax вновь сделал по сути комбинацию из всего что мы видели до этого…
касательно файлов minimax вновь сделал по сути комбинацию из всего что мы видели до этого. немного библиотечных компонентов, немного своих кастомных. в целом, что называется "крепкий среднячок". но среднячок который обошелся мне в 0 долларов 0 центов это уже чтото... хоть он и требует в 3 раза больше туда-сюда боданий. но если вы совсем бедный, то вы платите своим временем, там где не можете заплатить деньгами.
и словно чтоб подтвердить слова antropic о том что китайцы их обворовали, minimax был еди…
и словно чтоб подтвердить слова antropic о том что китайцы их обворовали, minimax был единственной китайской моделью которая словно opus4.6-max поинтересовалась у меня парой моментов прежде чем чтото делать. в один момент, даже предложила "удивить меня" своим вкусом цветовой палитры! там где kimi-k2.5 тихонько пыхтит и делает свое дело, давая результат уровня opus, minimax расшаркивая ножкой старается надеть костюм дворецкого, чтоб быть похожим визуально на opus...
если вы добрались до сюда, поздравляю! вас ждет секретный трек на этом альбоме! предствал…
если вы добрались до сюда, поздравляю! вас ждет секретный трек на этом альбоме! предстваляю вашему вниманию big-pickle!

это секретная модель, никто пока что не знает кто ее сделал или даже какого она класса. но зато она бесплатная, а значит нам ничего не стоит ее попробовать. опять, же формально она прошла испытание. немного попахивает китайщиной, но и от западных ценностей недалеко… хм… что же это может быть за модель? дипсик4? новый грок илона маска? чтото совершенно невиданное? кто знает… одно я знаю точно, у этой модели есть режим max, как и у моделей антропик. давайте и его попробуем!

и в режиме max наш огурчик перестал быть таким уж big. немного съежился от холода... ниче…
и в режиме max наш огурчик перестал быть таким уж big. немного съежился от холода... ничего страшного, сейчас мы его разогреем...
ээм... ладно. важен не размер агурчика, а каков он на вкус. продолжаем наши манипуляции,…
ээм... ладно. важен не размер агурчика, а каков он на вкус. продолжаем наши манипуляции, скармливая ошибки обратно огурчику в ротик
так! я не могу сказать, что получилось совсем плохо... но и сказать чтоб было безупречно…
так! я не могу сказать, что получилось совсем плохо... но и сказать чтоб было безупречно тоже нельзя. такое ощущение что это чтото типа кими, или может быть всетаки ближе к гемини... сложно сказать. будто они все друг у друга списывали домашнюю работу и вся разница лишь в том насколько кто наделал ошибок "чтоб училка не запалила" специально, чтоб не точь в точь было списано...

но что действительно примечательно, во всех остальных моделях режим max или xhigh effort приводил к тому что идеи из обычного режима были амплифицированы и глубже проработаны в max режиме. тут же, такое ощущение будно за ярлыком max скрывается чуток другая модель… очень странные эти стелс модели…

в любом случае big-pickle-max потратил примерно столько же токенов что и все остальные и…
в любом случае big-pickle-max потратил примерно столько же токенов что и все остальные и выдал примерно такой же результат. не уверен что я бы стал за этот результат плотить из своего кармана, но для бесплатной модели неплохо от слова "лучше чем ничего"
в итоге, что мы сегодня узнали? что есть субъективные придирки и объективные провалы у ра…
в итоге, что мы сегодня узнали?

что есть субъективные придирки и объективные провалы у разных моделей. что колво денег потраченых не всегда транслируется линейно в качество. и что если у вас денег нету от слова совсем, но есть свободное время, вы вполне можете вообще никому не плотить и получать достойный результат лишь применив чуть больше усилий.

и наверное, что если вы можете позволить себе выкинуть 200 долларов в мес на claude code max подписку, вы будете получать неплохой выхлоп из нее за эти деньги, но конкуренция на рынке настолько высока, что целесообразность этого сильно зависит не только от вашего кошелька но и от вашего желания пробовать неизведанное и тестировать все доступные опции на себе лично.

это пожалуй главная мысль. не верьте ни бенчмаркам, ни инфлюенсерам. ни даже вашим коллегам и друзьям которые клянуться и божатся что только модель X дает то что вы ищете и все остальные сосут большой огурчик!

только ваши личные опыты дадут вам понять, что работает и не работает конкретно для вас!