
Тег
#llm
36 публикаций в русских тредах.

галерея фронтенда разных LLM
https://ui-design-bench.vercel.app/
обязательно к просмотру всем кто вайбит, чтоб понять вкус и предпочтения разных моделей
тем временем https://x.com/claudeai/status/2036195789601374705

очередное ясделие от артема. на этот раз чтоб экспортировали все свои чаты с ллм и загрузить в одно место для просмотра и хранения.
https://github.com/WiegerWolf/llm-chats-archive

необычайно крутая картинка. настоящая GPT в питоне без зависимостей(!) https://karpathy.github.io/2026/02/12/microgpt/

однако быстро мы подобрались. весна только началась а arcagi2 уже пал по сути https://openai.com/index/introducing-gpt-5-4/
любопытно.


Открыть тред →
хочу поделиться как изменилось мое отношение к компьютерам с приобретением нового опыта пользования Claude Code за последний месяц




Открыть тред →

Весной 2025 CEO Anthropic пообещал что в конце года "you'll get your own remote AI worker".
И в конце концов мы получили этого работника. Представляю вашему вниманию Ральфа Виггама! https://github.com/anthropics/claude-code/tree/main/plugins/ralph-wiggum
Если что, Ральф это тот самый маленький мальчик из Симпсонов, который кушает фломастеры и проявляет прочие чудеса "гениальных" решений тривиальных проблем.
Что в целом идеально описывает текущее состояние коммерчески доступного ИИ.

ну альтман конечно переплюнул пока что всех. но есть одна важная оговорка. версия эта gpt5.2pro была внутри openAI уже как минимум пару месяцев. просто они ее не релизили в паблик.
теперь видимо как подарочек на рождество, альтман решил рискнуть и наплевав на безопасность выложить карты на стол... его ход получился последним и оттого таким эффектным. ответить пока что некому да и нечем. антропик только недавно выложил свой лучший опус4.5 а гугл не дотягивает с gemini 3 pro даже в режиме deep think (крайний правый верний зеленый треугольник)
есть такой мем https://yearofthelinuxdesktop.net/
Открыть тред →
вот эт я понимаю, проплатили, аж при запуске программы рекламу gpt-oss показывают!)


Открыть тред →
ну пипец, теперь с тулзами https://github.com/ruvnet/claude-flow можно выжрать 200 баксов не за месяц а за час!
Открыть тред →
есть у меня маленький проектик, https://aiht.ml/ , который используя LLM генерирует страницу на лету по любому запросу в URL.



Открыть тред →

если тебе инстересно как выпекаются современные LLM, недавно вышла отличная https://huggingface.co/blog/smollm3
и там ценность в том что реально все оперсорс. и данные, и алгоритмы и объяснение ноухау. все честно и в открытую
для тех кто желает заплатить x3 но получить прирост в 1.8% есть o3-pro, для все остальных есть бесплатный gemini-cli и gemini code assist)




Открыть тред →

Когда запромптил LLM на успех
если тебе любопытно понять как именно LLM работает вот кусочек, который может прольет свет на этот черный ящик https://youtu.be/9YQW2mH9FyA?si=x_-FgtRfwtF6I1aA&t=463

минутка кибербезопасности от claude4
пишу ему: пойди проверь что все кнопки в приложении работают.
оно пошло, запустило проект, открывает его в браузере. видит, что это чат с llm. видит что в проекте есть база данных. и такое "ща посмотрим, пройдет ли sql инъекция". и такое херак туда в формочку: DROP TABLE!
сижу и думаю, хорошо что я его не на прод попросил проверить нажимаются ли все кнопочки пойти
ну пипец. гугл теперь сделал diffusion модель для текста. это значит что вместо трансформера который токен за токеном доставляет, эта балалайка делает текст как миджорни делает картинки -- начинает с шума и уточняет детали пока не закончит.
т.е. оно пишет как бы весь текст сразу, все подробнее и точнее с каждым шагом. https://deepmind.google/models/gemini-diffusion/#what-is-a-diffusion-model

помнишь, я может быть рассказывал про то как LLM играли в игру Pokemon и показателем было, что в прошлом году они не могли из первой локации даже выйти, а в январе этого года уже могли до первой деревни дойти?
так вот. 3мая2025 они прошли игру целиком https://x.com/demishassabis/status/1918512421385150500
теперь играют до 100% прохождения -- теперь LLM нужно поймать всех покемонов, чтоб собрать полный pokedex https://www.twitch.tv/gemini_plays_pokemon

когда смотришь одним глазом туториал на ютубе а другим спрашиваешь llm))

Смотрите какая интересная статистика появилась на https://aider.chat/HISTORY.html#release-notes
Такими темпами, действительно как босс Anthropic сказал: "к концу 2025 года весь новый код будет написан LLM"
Ещё один интересный бенчмарк: LLM играют в мафию
Открыть тред →

ценник однако космический задрали на gpt-4.5 https://openai.com/api/pricing/
я даже не могу представить класс задач где такая цена будет экономически оправдана

однако интересный прайсинг. по ночам. прям как интернет когда то был дешевле по ночам, так теперь LLM
Tred 2025-01-21

Открыть тред →
вот стартап который занимается симуляциями на LLM https://aaru.com/
Открыть тред →

https://www.anthropic.com/news/3-5-models-and-computer-use
Ну вот. 50% то есть половину реальных(!) задач уже может LLM решить в репозитории который она впервые в жизни видит. Осталось год два и никто не будет программировать руками, только ПМ будет тикеты писать))

однако до чего техника дошла. теперь LLM будут прям бинарные файлы видео и картинок выдавать. так скоро ктото догадается, бинари программ генерировать LLM https://huggingface.co/papers/2408.08459

ну вот, финальный счет от openAI за май (когда я ушел с chatGptPlus на lobeChat и пользуюсь весь месяц активно через API gpt-4)
в этом месяце вышло в 2 раза дешевле чем плотить подписку, упираться в лимиты и ждать по 3 часа когда еще 25 сообщений дадут написать за твои же деньги))

неплохая иллюстрация того где мы сегодня. внушает надежду что мы (пока) все еще нужны. https://simonwillison.net/2024/Mar/22/claude-and-chatgpt-case-study/
вот что gpt-4v позволяет стоить)
Открыть тред →
все как обычно в общем.


Открыть тред →
однако в интересные времена живем https://github.com/greshake/llm-securityspreading-injections-via-e-mail
Открыть тред →

отныне этот кусок кода решает 98% всех задач в вашей джире. расходимся.) https://github.com/max-sixty/aoc-gpt/blob/main/openai.py

еще один сервис который падет жертвой gpt 3 это квора и ответы мэйл ру. зачем ждать когда на твой вопрос ответит человек, когда нейросеть и так обладает всеми знаниями в мире