Adaptive Resource Allocation for Low-Latency LLM Serving in Dynamic Environments