Ein Kommentator von EA Sports FC hat dem Entwickler die Erlaubnis erteilt, eine KI-Version seiner Stimme zu nutzen, um bestimmte Sprachzeilen für das Spiel aufzunehmen.
Wie bekannt wurde, setzt das Entwicklerteam eine KI-Rekonstruktion von mindestens einem seiner Kommentatoren ein. Dabei handelt es sich um Guy Mowbray, der seit EA Sports FC 24 als Kommentator fungiert. In einem Interview mit der BBC erklärte er den Hintergrund.
20.000+ Spielernamen als Routineaufgabe
Mowbray schilderte, dass die Aufnahme von Kommentaren für ein umfangreiches Fußballspiel mit ständig aktualisierten Kadern zu seinem wöchentlichen Alltag gehört – „ziemlich jede Woche von November bis Anfang Juli“.
Die wohl repetitivste Aufgabe besteht darin, die Namen der mehr als 20.000 im Spiel enthaltenen Profis einzusprechen – und das jeweils in unterschiedlichen Betonungen. Je nach Spielsituation (Ballannahme, Torschuss, Treffer etc.) muss der Name variierend klingen.
An dieser Stelle greift EA unterstützend ein: Mit seiner Zustimmung wird eine KI eingesetzt, die Mowbrays Stimme repliziert, um einen Teil dieser Namensaufnahmen zu generieren.
„Zusammenarbeit, kein Ersatz“
In einer Stellungnahme gegenüber der BBC erklärte EA:
KI ist seit Langem Teil unserer Entwicklungspipeline – von Animationen bis hin zu Gameplay-Systemen – und unterstützt unsere Teams weiterhin dabei, bessere und reaktionsschnellere Fußballerlebnisse zu schaffen.
Aber wenn es um Kommentare und Inhalte geht, ist es immer eine Zusammenarbeit mit unseren Talenten – kein Ersatz.
Dieser Ansatz spiegelt sich auch in Mowbrays Aussagen wider. Längere Kommentarzeilen könnten nicht automatisiert entstehen, da sie seinem persönlichen Stil entsprechen müssten.
Er nennt als Beispiel eine Spielsituation an der Mittellinie:
Wenn ein Team die Mittellinie überquert, ohne dass klar ist, ob daraus eine Torchance entsteht, könnte er sagen: „Oh, ein vielversprechender Angriff – was machen sie daraus?“ Für eine solche Situation brauche es jedoch zehn verschiedene Formulierungen. Diese müsse er selbst entwickeln, da sie authentisch klingen müssten.
Konsistenz über Monate hinweg
Auch Co-Kommentatorin Sue Smith kommt in dem Bericht zu Wort. Sie erklärt, dass sich die Aufnahmen über mehrere Monate erstrecken. Dadurch sei es mitunter schwierig, bei späteren Sessions exakt denselben Stimmklang wie zuvor zu treffen.
Da die einzelnen Sprachzeilen im Spiel nahtlos zusammengesetzt werden, müsse der Klang absolut konsistent sein. Schon leichte Abweichungen könnten unnatürlich wirken.
Smith beschreibt die Sessions als intensiv: Die Aufnahmen dauerten häufig vier bis fünf Stunden, die Stimme müsse dabei „perfekt“ sein. Es habe Fälle gegeben, in denen sie mit den Aufnahmen begonnen habe, jedoch darauf hingewiesen worden sei, dass ihre Stimme nicht exakt wie bei der vorherigen Session klinge.
Sie betont, dass sie noch nie zuvor so sehr auf ihre Stimme geachtet habe wie für diese Arbeit.
Mit der Nutzung einer KI-gestützten Stimmreplikation unter Zustimmung der Sprecher zeigt sich, wie technische Hilfsmittel zunehmend in die Produktionsprozesse moderner Sportspiele integriert werden – laut EA jedoch ausdrücklich als Unterstützung der Talente, nicht als deren Ersatz.