Tag: serie-llm-ops-stack
-
Serie LLM Ops Stack (Teil 2): Observability, Fallbacks und Kostenkontrolle
Serie: LLMs produktiv betreiben (Teil 2 von 2) Serien-Navigation: Teil 1 · Teil 2 Im zweiten Teil geht es um die Realität nach dem Go-live: inkonsistente Antwortqualität, Spitzenlast, …
Written by

-
Serie LLM Ops Stack (Teil 1): Basis für produktiven Betrieb
Stand: April 2026 In den letzten Monaten habe ich viel damit gearbeitet, lokale LLMs von „läuft auf meinem Rechner“ auf „läuft stabil im Alltag“ zu bringen. Der Unterschied…
Written by
