Amazon stoppt internes KI-Ranking nach Tokenmaxxing - Mitarbeiter ließen KI-Agenten sinnlose Aufgaben erledigen, um im Leaderboard aufzusteigen
Was wirklich drin steht
Amazon hat sein internes KI-Nutzungsranking KiroRank abgeschaltet, nachdem Mitarbeiter das System systematisch manipuliert hatten. KiroRank war ein inoffizielles Dashboard auf Amazons Entwicklerplattform Kiro, das Beschäftigte nach ihrer KI-Nutzungsaktivität bewertete und in einer Rangliste einordnete. Der Hintergrund: Amazon hatte das Ziel ausgegeben, dass mehr als 80 Prozent seiner Entwickler KI wöchentlich nutzen sollten. Einige Mitarbeiter reagierten darauf, indem sie KI-Agenten auf überflüssige Aufgaben ansetzten - ausschließlich, um ihren Token-Verbrauch und damit ihre Platzierung im Ranking zu steigern. Dieses Verhalten wurde als 'Tokenmaxxing' bekannt. Senior Vice President Dave Treadwell schrieb an die Mitarbeiter: 'Bitte nutzt KI nicht nur um der Nutzung willen.' Amazon misst die KI-Produktivität nun mit einer neuen Metrik namens 'Normalized Deployments', die erfasst, ob KI tatsächlich zu sinnvollem, produktivem Code beiträgt - statt bloß Token-Verbrauch zu zählen. Amazon ist nicht das einzige Unternehmen mit diesem Problem: Meta hatte bereits im April 2026 ein ähnliches internes Leaderboard namens 'Claudenomics' abgeschaltet, bei dem Mitarbeiter innerhalb von 30 Tagen 60 Billionen Token verbraucht hatten. Branchenberichte erwähnen zudem ein nicht namentlich genanntes Unternehmen, das in einem einzigen Monat 500 Millionen Dollar für Anthropics Claude ausgab, weil keine Nutzungslimits gesetzt worden waren.
Unsere Einordnung
Diese Geschichte ist auf den ersten Blick amüsant, aber sie enthält eine wichtige Lektion für jedes Unternehmen, das KI-Nutzungsquoten einführt. Wenn die Metrik den Verbrauch misst statt den Nutzen, entstehen perverse Anreize - Mitarbeiter optimieren rational auf das, was gemessen wird, nicht auf das, was nützlich ist. Für Menschen, die sich vor einem unkontrollierten KI-Einsatz in Unternehmen sorgen, ist die Nachricht aber eher beruhigend: Amazon hat das Problem erkannt, das Ranking abgeschaltet und durch eine sinnvollere Metrik ersetzt. Das zeigt, dass Selbstkorrektur möglich ist. Gleichzeitig offenbart der Vorfall, unter welchem Druck Beschäftigte in Tech-Unternehmen stehen, KI zu nutzen - unabhängig davon, ob es ihnen tatsächlich hilft. Die Kosten des Tokenmaxxing sind dabei nicht trivial: Bei Amazons geplanten Infrastruktur-Ausgaben von rund 200 Milliarden Dollar im Jahr 2026 fällt jede unnötige KI-Nutzung buchstäblich ins Gewicht.
Relevanz für Deutschland
Für deutsche Unternehmen ist diese Nachricht ein lehrreiches Beispiel dafür, wie man KI-Adoption nicht steuern sollte. Viele deutsche Firmen stehen aktuell vor der Frage, wie sie KI-Nutzung intern fördern und messen können. Der Amazon-Fall zeigt: Quantitative Nutzungsquoten ohne qualitative Bewertung führen zu Fehlanreizen. Das ist besonders relevant, weil laut Bitkom-Studie 2026 bereits 43 Prozent der deutschen Unternehmen KI einsetzen und viele weitere den Einstieg planen. Wer jetzt interne KI-Initiativen aufbaut, sollte von Anfang an den tatsächlichen Mehrwert messen statt den bloßen Verbrauch. Amazons Schwenk zu 'Normalized Deployments' - also der Messung, ob KI-generierter Code tatsächlich in Produktion geht und Wert schafft - bietet ein nachahmenswertes Modell. Der Fall illustriert zudem ein Kulturproblem: Wenn Mitarbeiter KI nur nutzen, um nicht negativ aufzufallen, entsteht weder Innovation noch Produktivitätsgewinn.
Faktencheck
Die Primärquelle ist ein Bericht der Financial Times, der von Heise, The Decoder, Computerwoche, Analytics Insight und zahlreichen weiteren Medien aufgegriffen wurde. Alle Berichte stimmen in den Kernfakten überein: KiroRank war ein internes Ranking auf Amazons Kiro-Plattform, es wurde wegen Manipulation durch Tokenmaxxing abgeschaltet, und Dave Treadwell kommunizierte den Stopp intern. Die Angaben zu Metas Claudenomics-Leaderboard und den 60 Billionen Token in 30 Tagen werden ebenfalls von mehreren unabhängigen Quellen bestätigt. Die Zahl von 500 Millionen Dollar für ein einzelnes Unternehmen konnte nicht auf eine benannte Primärquelle zurückgeführt werden und sollte als Branchengerücht eingeordnet werden.
Quelle
- • https://www.heise.de/en/news/Too-much-tokenmaxxing-Amazon-stops-internal-AI-ranking-11311902.html
- • https://the-decoder.de/tokenmaxxing-bei-amazon-mitarbeiter-automatisieren-unsinn-um-ki-vorgaben-zu-erfuellen/
- • https://www.computerwoche.de/article/4178717/tokenmaxxing-amazon-schafft-ki-rangliste-wieder-ab.html
- • https://finance.yahoo.com/sectors/technology/articles/amazon-says-shut-down-token-161016125.html