Yoot Saito ist jemand, der es sich zur Aufgabe gemacht hat, Dinge anders zu machen. Ob es sich um das Flipper-Cross-Taktik-Gameplay von Odama oder das eklige, aber liebenswerte sprachaktivierte virtuelle Haustier in Seaman handelt, Saitos Absicht war es immer, die Spieler mit neuen Arten von Interaktionen zu überraschen.
Es ist sicherlich nicht einfach, seine Karriere auf genreübergreifende Spiele zu konzentrieren. In diesem Sommer sind es 20 Jahre seit der ursprünglichen japanischen Veröffentlichung von Seaman auf Segas ehrwürdiger Dreamcast. Das Spiel enthielt ein Mikrofon-Peripheriegerät, über das die Spieler mit einem seltsamen und oft mürrischen Meeresbewohner interagierten, der das Gesicht und die Stimme eines Menschen hatte.
Trotz seiner Seltsamkeit und der damit verbundenen Marketing-Herausforderungen war Seaman ein Verkaufsschlager und verkaufte sich über eine Million Mal auf Dreamcast und PlayStation 2.
Zwei Jahrzehnte nach der Veröffentlichung des Spiels beantwortet Saito unsere Fragen zu Seaman, erinnert sich an die Erfolge und Schwierigkeiten bei der Entwicklung eines so seltsamen Spiels und erklärt seine Neigung, eine andere Richtung einzuschlagen als andere Spieldesigner.
Mein kreativer Prozess für neue Spiele, die ich mit Leidenschaft entwickle, ist ziemlich einfach. Ich verwende oft Objekte/Dinge/Orte, die die meisten traditionellen Spieleentwickler nicht verwenden würden. Bei Tower sieht man eine Seite eines Wolkenkratzers von oben und beobachtet die Menschen darin, fast so, als würde man eine Ameisenfarm betrachten. Bei Seaman war die Grundidee, was wäre, wenn mein Haustier zu Hause sprechen könnte. Was würden sie sagen? In Odama wollte ich sehen, wie es sich anfühlt, als General eine Truppe von Tausenden von Soldaten zu befehligen. Im Grunde genommen wollte ich also, dass die Leute spüren, wie es ist, etwas zu erleben, was sie normalerweise nicht erleben können, indem sie Spiele als Kunstform nutzen, um dieses Gefühl zu vermitteln.
Yoot Saito
Auch mag ich es nicht, innerhalb der Linien eines bereits existierenden Genres wie RPGs, Schatzsuche, Schießerei usw. zu malen. Ich will mein eigenes Ding machen. Das ist für mich ein unglaublich motivierender Teil des Spielemachens. Es kostet jedoch viel Energie, etwas „Neues“ zu entwickeln und den Leuten zu präsentieren. Es dauert immer länger, als man erwartet, etwas wirklich Originelles zu schaffen, und auf dem Weg dorthin gibt es viele Fallstricke, die man nicht erwartet. Und wenn man erst einmal im Ungewissen ist, gibt es keine Einheitslösung für diese Art von Problemen. Es erfordert viel Zeit und Energie von einem Produzenten, diese Probleme zu lösen, und das Risiko ist ziemlich groß, aber genau das macht es lohnenswert.
Gab es einen Punkt, an dem Sie sich während der Entwicklung von Seaman kreativ verloren oder festgefahren fühlten? Wenn ja, woran sind Sie gescheitert?
Als ich Seaman entwickelt habe, gab es eine kreative Wand, an die ich mich besonders gut erinnern kann. Kurz vor der Fertigstellung des Spiels haben wir ein Testspiel mit ein paar zufälligen Leuten gemacht, und sie haben alle Dinge gesagt, von denen ich nie gedacht hätte, dass sie es in dieser speziellen Situation oder in diesem Teil des Gesprächs tun würden. Das war genau zu dem Zeitpunkt, als wir kurz davor waren, den Seaman-Werbezyklus zu starten. Der Marketingbeauftragte von Sega hielt eine Veranstaltung in einem Aquarium in Tokio ab und forderte die Leute auf, sich mit den Fischen im Aquarium zu unterhalten. Das war das Experiment.
Die Leute, die daran teilnahmen, wandten sich dem Mikrofon zu, wussten aber nicht, was sie sagen sollten, also taten sie das, was Leute in solchen Situationen immer tun. Sie plapperten in einem sehr langen Satz weiter und weiter. Ich habe Seaman nicht darauf trainiert, lange Gespräche zu verstehen, so dass er nicht in der Lage war, zu verstehen, was gesagt wurde. Also griff er auf die Standard-Wortwahl zurück: „Können Sie das noch einmal sagen?“ oder „Hm, haben Sie etwas gesagt?“ und stellte den Leuten damit eine Frage. Nachdem Seaman das Gespräch mehrmals nicht verstanden und die Teilnehmer gebeten hatte, sich zu wiederholen, wurden sie wütend oder hatten einfach keine Lust mehr und gingen nach Hause. Das, was die Leute sagten, unterschied sich so sehr von dem, was ich mit Seaman vorhatte, dass das Team völlig verzweifelt war.
Die Leute, die das Aquarium besuchten, wussten nicht, was sie in das Mikrofon sagen sollten, also fingen sie an, Dinge zu sagen wie „warum ist dieses komisch aussehende Fischding überhaupt hier“ und formten schließlich überlange Sätze, die Seaman nicht verstehen konnte. Da wir damit nicht gerechnet hatten, steckte Seaman in einer „Kannst du das noch mal sagen?“-Schleife fest.
Zu allem Übel sollte das Spiel kurz darauf veröffentlicht werden. Nachdem ich über eine Vielzahl von Lösungen nachgedacht hatte, beschloss ich, das Problem durch menschliches Verhalten und Verständnis zu lösen und nicht durch die logischen Entwürfe eines Computerprogramms. Im Grunde würde Seaman also Dinge sagen wie „Du redest zu lange, ich verstehe dich nicht“ und „Wenn du es nicht einfacher/kürzer formulierst, will ich nicht mit dir reden“ und sich beim Endbenutzer beschweren. Wenn sie diese Anweisungen nicht befolgten, schwamm Seaman in den hinteren Teil des Aquariums.
Diese Idee war schließlich eines der Dinge, die die Leute an dem Spiel wirklich mochten. Sobald die Endbenutzer merkten, dass sie keine langen Sätze verwenden konnten, begannen sie, mit Seaman wie mit einem Baby zu sprechen und einfache und leicht verständliche Sätze wie „Hallo“ und „Entschuldigung“ zu sagen. Noch besser war die Tatsache, dass sie langsam und deutlich sprachen. Dies führte zu einem neuen Spielstil bei Sega und half uns, das Image zu vermeiden, dass Spiele mit Spracherkennung schlecht seien und einfach nicht funktionierten. Andererseits wurde Seaman schnell als ein Wesen bekannt, das ziemlich egoistisch und schwer zu fassen war. (lacht)
Seaman selbst
Wie war es, in den 90er Jahren an der Dreamcast zu arbeiten?
Ich denke, man kann alles über die Dreamcast zusammenfassen, als sie in den 90er Jahren auf den Markt kam, als eine unglaublich einzigartige Erfahrung. Sega jagte seinen Rivalen Sony und Nintendo hinterher, so gut sie konnten. Aber die Leute bei Sega liebten es, „lustige“ und „interessante“ Dinge zu tun. Anstatt also auf Nummer sicher zu gehen und konservativ zu sein, gingen sie zum Angriff über und taten so viele kreative und verrückte Dinge wie möglich. Mit dieser Denkweise konnte ein so einzigartiges und ungewöhnliches Spiel wie Seaman entstehen. Sie standen dahinter und haben sich an der Werbefront stark dafür eingesetzt, so dass es ein ziemlicher Hit wurde.
Für mich ist die Dreamcast also eine großartige Spielkonsole mit vielen einzigartigen Funktionen, aber mehr noch, sie erinnert mich an die Tage, als Sega so viele kreative und wunderbare Dinge tat.
Warum hast du entschieden, dass Seaman so unverblümt und oft unhöflich sein würde?
Es gibt zwei Hauptgründe, warum Seaman so ein unhöflicher Charakter ist. Der erste ist, dass ich genug von niedlichen Figuren hatte und etwas ganz anderes machen wollte. Der zweite Grund ist der bereits erwähnte, dass diese Art von Persönlichkeit die Chancen erhöht, dass Seaman versteht, was der Endbenutzer sagt.
Wie haben Sie sich gefühlt, als Ihnen während der Entwicklung die Leute sagten, das Konzept sei „ekelhaft“ oder „gruselig“?
Ich wollte, dass Seaman seltsam und ekelhaft ist, also hatte ich kein Problem damit, wenn die Leute das sagten. Das war so geplant. Damit sich Seaman originell anfühlt und wirklich einzigartige Eigenschaften hat, musste Seaman einige Dinge tun, um wirklich herauszustechen:
- NICHT niedlich
- Durch den Fernseher in die Welt des Endverbrauchers schauen
- Sich auf die reale Welt konzentrieren, anstatt auf eine Fantasiewelt
Ich hatte das Gefühl, dass ich, wenn ich diese drei Punkte richtig umsetzen könnte, etwas hätte, was kein anderes Spiel hatte und den Leuten ein wirklich einzigartiges Erlebnis bieten würde. Das war das Ziel und das, was ich als Schöpfer wirklich tun wollte. Es ist immer noch das innere Feuer, das mich antreibt, einzigartige und originelle Dinge zu tun.
Sind Sie der Meinung, dass große Spielefirmen seit 1999 zu „sicher“ geworden sind, und glauben Sie, dass ein großer Verleger wie Sega hier, 20 Jahre später, ein Spiel wie Seaman veröffentlichen würde?
In letzter Zeit beinhaltet die Spieleindustrie, besonders die Verbraucherspielindustrie, Projekte, die eine riesige Menge an Kapital kosten und sich daher zu einem Hollywood-Film-Geschäftsmodell verlagert haben, bei dem man auf sichere Wetten wie Fortsetzungen setzen muss, um zu überleben. Das ist wahrscheinlich die einzige Möglichkeit, das enorme Entwicklungsrisiko im Vorfeld wieder hereinzuholen. Ich hoffe, dass das Äquivalent zu dem, was „The Blair Witch Project“ für Filme war, auch für Spiele gilt.
Ich weiß, dass Sega ein Unternehmen voller Leute ist, die gerne interessante Dinge machen. Und es gibt viele neue Leute, die diesen Geist weitertragen. Wenn also ein weiteres Spieldesign wie Seaman auftaucht, bin ich mir sicher, dass Sega die Art von Unternehmen wäre, die ihr Bestes tun würde, um es zu einem Erfolg zu machen.
Wie viel zusätzlicher Druck lastete auf Ihnen, um Seaman zu einem Hit zu machen, da Sega mit PlayStation konkurrierte? Wie war das?
Nein, ich glaube nicht, dass Sega durch die Tatsache, dass die PlayStation schon früh in Führung lag, Druck verspürt hat? Zumindest auf der Entwicklerseite im Studio haben wir uns nur darauf konzentriert, wie wir die neue Hardware am kreativsten einsetzen konnten. Natürlich bin ich mir sicher, dass das Vertriebsteam und das obere Management das ganz anders sahen und tatsächlich eine Menge Druck ausübten, aber die kreative Seite war wie ein Haufen Kinder, die sich darauf freuten, mit ihrem neuesten Spielzeug zu spielen.
Wie sind Sie bei der Gestaltung der Gespräche in Seaman vorgegangen? Welche Hilfsmittel haben Sie verwendet, und was waren Ihre Leitprinzipien beim Schreiben des Drehbuchs?
Die gesamte Gesprächsstruktur und -gestaltung wurde von mir allein übernommen. Das liegt daran, dass der größte Teil der Konversation auf meinen täglichen Beobachtungen des Lebens basiert. Und in der japanischen Version ist es ja auch meine Stimme als Seemann. Es war also einfach für mich, in der Rolle von Seaman „in-character“ zu sein.
Wenn wir mehrere Leute mit der Ausarbeitung von Seamans Charakter, Konversation und Gedanken beauftragt hätten, wäre Seaman völlig durcheinander gewesen. Das bedeutet also, dass Seaman im Grunde genommen ich bin. Und obwohl das ein ziemlich einfaches Charakterdesign ist, glaube ich, dass diese Einfachheit es uns ermöglicht hat, unsere Deadline einzuhalten, auch wenn es schwierig wurde. Bei der Ausarbeitung des Drehbuchs gab es einige Regeln. Wenn Seaman zu hart mit seinen Worten gewesen wäre, wäre das beleidigend gewesen oder hätte den Endbenutzer enttäuscht. Also haben wir Seaman Dinge sagen lassen, die eine saure, aber liebenswerte alte Dame sagen könnte. Es mögen harte Worte sein, aber man merkt, dass Wärme und Liebe dahinterstecken, so dass man diesen Tonfall schließlich zu schätzen weiß.
Als es von Sega America lokalisiert wurde, habe ich Sega of America lediglich das übergeordnete Konzept beschrieben, und sie haben es übernommen. Ich habe keine Ahnung, ob diese „Regeln“ in der englischen Version enthalten sind oder nicht.
Warum sind Spiele mit Spracherkennung nicht beliebter (oder vielleicht ist die Frage eher, warum nicht mehr Entwickler sie entwickeln?
Ich denke, das ist eine wirklich gute Frage, also erlaube mir, tief in ein Kaninchenloch zu gehen, um sie zu beantworten. Bei Spielen, die mit Spracherkennung arbeiten, gibt es zwei Hauptteile.
Die Richtung wird verwendet, um den Spieler auf den Pfad des Szenarios zu führen, den man festgelegt hat, und jede Art von Wort kann eine Art Richtungsgeber sein. Navigation hingegen findet nur statt, wenn der Spieler einen vorher festgelegten Befehl oder eine Eingabe wie „links“ oder „vorwärts“ eingibt. Seaman ist also ein Spiel, das auf der Navigation basiert. Sobald der Spieler den notwendigen Befehl oder die Eingabe eingibt, die der Entwickler vorgegeben hat, „springt“ man zum nächsten Teil des Gesprächs oder Dialogs.
Saitos Seaman-Konzepte
Es ist ein ziemlich einfaches Design. Aber um das Gefühl der Realität zu erzeugen, mussten wir 40.000 verschiedene Typen von Seeleuten erschaffen. Ein Seemann versteht nicht wirklich, was die einzelnen Spieler sagen. Es ist nur so, dass wir so viele verschiedene Antworten für die große Vielfalt an möglichen gesprochenen Antworten/Gesprächen, die ein Spieler sagen kann, vorbereitet haben und dann zu der natürlich korrekten Fortsetzung des Dialogs springen, die auf diesem System basiert, was es so aussehen lässt, als würde Seaman verstehen.
Eigentlich sind Spiele ein bisschen wie Sprachen. Bei Kartenspielen hat man eine begrenzte Anzahl von Karten, die man als Antwort auf einen anderen Spieler spielen kann. Die menschliche Kommunikation hat jedoch nicht dieselben Grenzen wie ein Kartenspiel oder ein Rollenspiel. Die Kommunikation kann ziemlich umfangreich sein. Der Versuch, ein Kartenspiel mit so vielen Möglichkeiten zu entwickeln, wäre für einen Menschen eine extreme Herausforderung… eigentlich fast unmöglich. Also bleibt uns nichts anderes übrig, als auf die KI zu warten, die uns hilft, diese unmögliche Lücke zu schließen.
Aber selbst wenn die KI-basierte Kommunikation immer besser wird, habe ich Zweifel daran, dass sie eine gute Basis für ein Spiel ist. Grundsätzlich sind Spiele relativ einfach und überschaubar. Je komplizierter sie werden, desto schwieriger ist es, angemessene „Gewinn-Verlust-Bedingungen“ zu schaffen. Das ist der Hauptgrund, warum diese Art von Spiel so schwierig ist. Übrigens entwickle ich gerade eine KI-Engine, die auf der japanischen Sprache und den japanischen Wörtern basiert.
Welche Art von Technologie aus dem Jahr 2019 würdest du verwenden, um einen neuen Seemanns-Stil zu entwickeln?
Um einen neuen Seemann in der heutigen Zeit zu entwickeln, brauchen wir eine absolut notwendige Technologie. Das ist eine Maschine, die in der Lage ist, ein Gespräch organisch fortzusetzen, ohne ein Skript zu benötigen. Man würde das natürlich KI nennen.
Beim ursprünglichen Seemann musste das gesamte Skript und die Konversation von einem Synchronsprecher als Sprachdatei aufgenommen werden. Und wenn man die ganze Stimme gehört hat, gibt es nichts mehr zu tun. Im Grunde genommen hat das Spiel so etwas wie ein „Ende“. Wenn man jedoch bedenkt, was man heute schon alles machen kann, da jeder ein Mobiltelefon bei sich trägt, würde man erwarten, dass Seaman in der Lage ist, die aktuellen Aktivitäten des Benutzers zu beobachten und zu kommentieren und dies ständig zu tun… fast unendlich oft. Deshalb braucht man an dieser Stelle eine KI-Engine, um diese Art von Design zu erreichen. Das ist auch der Grund, warum ich mich auf den Weg gemacht habe, um Kapital für die Entwicklung einer solchen Maschine zu sammeln und weiter daran zu arbeiten.
Mein Interesse gilt also nicht mehr den Spielen, sondern einer halbwegs dauerhaften Möglichkeit, weiterhin Japanisch zu sprechen, oder besser gesagt, einer Maschine, die die unglaublich komplizierte und nuancierte Sprache des Japanischen zerlegen und dann wieder zu sinnvollen Gesprächsantworten zusammensetzen kann. Wenn ich dieses Ziel erreichen kann, könnte ich mir vorstellen, dass auch andere komplizierte Sprachen in eine KI-Engine übersetzt werden könnten.
Das Dreamcast-Mikrofon-Peripheriegerät
Was haben Sie gelernt, als Sie sahen, wie Menschen mit Seaman interagierten?
Ja, ich habe sehr wichtige Lektionen gelernt. Durch eine Stichprobe von über einer Million Menschen und die Beobachtung, wie sich die Gespräche entwickelten, bekam man einen Einblick in die Menschen. Das war eine sehr wichtige Lektion für mich. Eine der größten Entdeckungen war, dass all die Leute, die auf das Mikrofon gerichtet waren und ihr Bestes taten, um eine Gesprächsverbindung mit Seaman herzustellen, meist nicht grammatikalisch korrekt sprachen. Das gab mir das Gefühl, dass man, wenn man sich bei der Entwicklung von Spracherkennungs-KI auf Lehrbuchregeln verlässt, niemals in der Lage sein wird, den organischen Fluss eines realen Dialogs zu erfassen, und dass man ohne dies niemals in der Lage sein wird, eine geeignete Engine zu entwickeln, die das leisten kann.
Und hier machte ich eine weitere große Entdeckung – Melodie. Dass es bei der Kommunikation nicht nur um Worte geht … dass die Melodie eine wichtige Rolle spielt und dass sie möglicherweise sogar wichtiger ist als die genaue Einhaltung der Wortfolge und der grammatikalischen Struktur. Und eigentlich ist das im Japanischen schon so. Die Wortfolge ist sehr locker. Japanisch ist wie Yoda, der spricht (lacht). Mir wurde also klar, dass die Entwicklung einer Maschine, die eine Melodie erkennen kann, ein effizienterer Weg wäre, das Problem der KI-Spracherkennung zu lösen, als zu versuchen, sich an die Satzstruktur zu halten. In meinem „KI-Forschungslabor Seaman“ entwickle ich also eine Spracherkennungsmaschine, die auf der so genannten „Melodiesprache“ basiert.
Was ist Ihre schönste Erinnerung an die Entwicklung von Seaman?
Als die englische Version von Seaman veröffentlicht wurde, war ich sehr gespannt, wie sie ankommen würde. Als Leonard Nimoy sich im Spiel mit seinem richtigen Namen vorstellte, war es wirklich großartig zu sehen, wie alle Benutzer lächelten, denn das Gleiche haben wir in der japanischen Version erreicht. Ich frage mich, warum das so ist? Vielleicht, weil die Vorstellung eines Schauspielers, der einen anderen Charakter mit seinem richtigen Namen vorstellt, eine Art vierte Wand durchbricht und etwas ist, das man von einem Drama und nicht von einem Spiel erwartet. Das war genau eine der Eigenschaften, die ich wollte – dass Seaman aus dem Inneren des Fernsehers zum Endverbraucher spricht und in die Welt hinausschaut. Der untypische, schräge und eklige Seaman hat also sowohl im Englischen als auch im Japanischen alle richtigen Regeln und Tropen gebrochen!