если 1 раз попробовать “взломать” систему построенную поверх ллм. то шанс что она поддастся около 5%.
но вот если всего 10(!) раз попробовать ту же самую атаку то шанс уже 35%! в семь (!) раз успешнее, просто применяя одну и ту же атаку, пока не получится систему буквально “уговорить”.
а вот если достать и реально 100 раз пристать к агенту, он сдастся уже в 70% случаев!
раньше я думал что вот эти моменты в фильмах и играх, где хакеру нужно 5 мин на взлом, пока остальные отстреливаются от охраны, это чушь киношная. но похоже что в будущем успех взлома реально будет определяться настойчивостью и временем!