вот пример как за 600 подходов glm5.1 от 5к QPS дошла до 21к
https://z.ai/blog/glm-5.1#:~:text=Approximate%20Nearest%20Neighbor%20Search%20Optimization05%2C00010%2C00015%2C00020%2C00025%2C000100200300400500600QPSOptimization
вот пример как за 600 подходов glm5.1 от 5к QPS дошла до 21к
https://z.ai/blog/glm-5.1#:~:text=Approximate%20Nearest%20Neighbor%20Search%20Optimization05%2C00010%2C00015%2C00020%2C00025%2C000100200300400500600QPSOptimization