Proxy resilience: rate limiting and concurrency controls

Tasks:
- Add request queue or per-model concurrency limits in OpenAI proxy.
- Optional rate limiting to prevent burst overload.

Acceptance:
- Proxy stays stable under spikes; limits configurable.