20 jaar na Seaman blikt Saito terug op creativiteit en het maken van nieuwe, vreemde dingen

Yoot Saito is iemand die er een punt van maakt om dingen anders te doen. Of het nu gaat om de flipperkast-cross-tactiek gameplay van Odama of de grove-maar-liefhebbende stem-geactiveerde virtuele huisdier in Seaman, Saito’s bedoeling is om spelers te verrassen met nieuwe soorten interacties.

Je carrière wijden aan genre-buigende games is zeker niet de gemakkelijke route. Deze zomer is het 20 jaar na de oorspronkelijke Japanse release van Seaman op Sega’s eerbiedwaardige Dreamcast. Het spel implementeerde een microfoon periferie, waardoor spelers interactie hadden met een vreemd en vaak chagrijnig zeebewonend wezen dat het gezicht en de stem van een man had.

Ondanks zijn vreemdheid, en de marketing uitdagingen daarin, was Seaman een grote verkoper, met meer dan een miljoen eenheden in de Dreamcast en PlayStation 2 versies.

Twee decennia na de release van het spel beantwoordt Saito onze vragen over Seaman, haalt hij herinneringen op over de successen en moeilijkheden van het maken van zo’n vreemd spel, en legt hij zijn neiging uit om een andere richting in te slaan dan andere spelontwerpers.

Mijn creatieve proces voor nieuwe spellen die ik met passie wil maken, is vrij eenvoudig van aard. Ik gebruik vaak voorwerpen/dingen/plaatsen die de meeste traditionele spelontwerpers niet zouden overwegen te gebruiken. In Tower zie je een kant van een wolkenkrabber van bovenaf en observeer je de mensen erin, bijna alsof je naar een mierenboerderij kijkt. Bij Seaman was het basisidee: wat als mijn huisdier thuis zou kunnen praten. Wat zouden ze dan zeggen? In Odama wilde ik zien hoe het zou voelen om als generaal het bevel te voeren over een troepenmacht van duizenden soldaten. Dus eigenlijk wilde ik mensen laten voelen hoe het zou zijn om iets te voelen dat ze normaal gesproken niet kunnen ervaren, waarbij ik games als kunstvorm gebruikte om dat gevoel over te brengen.


Yoot Saito

Ook schilder ik niet graag binnen de lijnen van een bestaand genre zoals RPG’s, schatzoeken, schieten, enzovoort. Ik wil mijn eigen ding maken. Dat is een ongelooflijk motiverend deel van het maken van spellen voor mij. Het kost echter veel energie om iets “nieuws” te maken en aan mensen te presenteren. Het duurt altijd langer dan je verwacht om iets echt origineels te maken en er zijn veel valkuilen onderweg die je nooit verwacht. En als je eenmaal in het onbekende bent, is er niet één pasklare oplossing voor dat soort problemen. Het vergt veel tijd en energie van een producent om die problemen op te lossen en het risico is vrij groot, maar dat is wat het de moeite waard maakt om te doen.

Heeft u zich op enig moment tijdens de ontwikkeling van Seaman creatief verloren of vastgelopen gevoeld? Zo ja, waar liep u op vast?

Tijdens het maken van Seaman is er één creatieve muur waar ik tegenaan ben gelopen die me echt is bijgebleven. Vlak voor de voltooiing van het spel deden we een test met een aantal willekeurige mensen en ze zeiden allemaal dingen waarvan ik nooit had gedacht dat ze die zouden zeggen in die specifieke situatie of in dat deel van het gesprek. Dat was juist toen we op het punt stonden de publiciteitscyclus van Seaman te beginnen. De Sega marketing vertegenwoordiger hield een evenement in een aquarium in Tokyo en vroeg mensen om te proberen te praten met de vissen in het aquarium. Dat was het experiment.

De mensen die deelnamen draaiden zich naar de microfoon maar wisten niet wat ze moesten zeggen dus deden ze wat mensen altijd doen in zulke situaties. Ze brabbelden maar door tot een hele lange zin. Ik heb Seaman niet gebouwd om lange gesprekken te begrijpen, dus hij was niet in staat om te begrijpen wat er gezegd werd. Dus viel hij terug op de standaard woordspeling van “kan je dat nog eens zeggen” of “Huh, zei je iets?” waarmee hij in feite een vraag stelde aan de mensen. Na meerdere keren dat Seaman het gesprek niet begreep en de deelnemers vroeg om zichzelf te herhalen, begonnen ze boos te worden of vonden ze het gewoon niet leuk en gingen ze naar huis. De dingen die de mensen zeiden waren zo verschillend van wat ik Seaman had ontworpen om te doen dat het team totaal ontredderd was.

De mensen die het aquarium bezochten wisten niet wat ze moesten zeggen in de microfoon, dus begonnen ze dingen te zeggen als “waarom is dit freaking uitziende vis ding hier in de eerste plaats” en creëerden uiteindelijk overdreven lange zinnen die Seaman niet kon begrijpen. Omdat we dat niet voorzien hadden, zat Seaman vast in een “Kan je dat nog eens zeggen?” loop.

Om het nog erger te maken, zou het spel kort daarna uitgebracht worden. Na het overwegen van een groot aantal oplossingen besloot ik het probleem op te lossen door menselijk gedrag en begrip in plaats van de logische ontwerpen van een computerprogramma. Dus in principe zou Seaman dingen zeggen als “Je praat te lang, ik begrijp het niet” en “Als je het niet eenvoudiger/kort houdt, wil ik niet met je praten” en klagen tegen de eindgebruiker. Als ze die instructies niet opvolgden, zou Seaman wegzwemmen achterin het aquarium.

Dit idee was uiteindelijk een van de dingen die mensen echt leuk vonden aan het spel. Zodra de eindgebruikers zich realiseerden dat ze geen lange zinnen konden gebruiken, begonnen ze tegen Seaman te praten alsof het een baby was die eenvoudige en gemakkelijk te begrijpen zinnen zei als “hallo” en “sorry.” Nog beter was het feit dat zij langzaam en duidelijk spraken. Dit leidde tot een nieuwe stijl van spelen binnen Sega en hielp ons het beeld te vermijden dat games met stemherkenning slecht waren en gewoon niet werkten. Aan de andere kant, Seaman werd al snel bekend als een wezen dat nogal egoïstisch was en moeilijk om mee te verbinden. (lacht)


Seaman zelf

Hoe was het om in de jaren 90 aan de Dreamcast te werken?

Ik denk dat je alles over de Dreamcast bij zijn debuut in de jaren 90 kunt samenvatten als een ongelooflijk unieke ervaring. Sega zat hun rivalen Sony en Nintendo achterna, zo goed als ze konden. Maar de mensen bij Sega hielden ervan om “leuke” en “interessante” dingen te doen. Dus in plaats van op veilig te spelen en conservatief te zijn, gingen ze in de aanval en deden ze zo veel creatieve en gekke dingen als ze konden. Dat is het soort mentaliteit waardoor een spel zo uniek en ongewoon als Seaman kon geboren worden. Ze gingen erachter staan en drongen er hard op aan op het promotionele front waardoor het een behoorlijke hit kon worden.

Dus voor mij is de Dreamcast een geweldige spelconsole met veel unieke functies, maar meer dan dat, het herinnert me aan die dagen toen Sega zoveel creatieve en prachtige dingen deed.

Waarom besloot je dat Seaman zo bot en vaak, onbeschoft zou zijn?

Er zijn twee basisredenen waarom Seaman zo’n onbeschoft personage is. De eerste is dat ik genoeg had van schattige personages en iets heel anders wilde doen. De tweede is de reden die ik eerder noemde, dat type persoonlijkheid hielp de kans te vergroten dat Seaman zou begrijpen wat de eindgebruiker zei.

Hoe voelde je je toen, tijdens de ontwikkeling, mensen je vertelden dat het concept “ranzig” of “griezelig” was?

Ik wilde dat Seaman raar en ranzig was, dus ik had er geen probleem mee dat mensen dat zeiden. Dat was de bedoeling. Om Seaman origineel te laten aanvoelen en echt unieke eigenschappen te laten hebben zijn er dingen die Seaman moest doen om echt op te vallen:

  • NIET schattig
  • Kijk in de wereld van de eindgebruikers via de TV
  • Focus op de echte wereld in plaats van een of andere fantasiewereld

Ik had het gevoel dat als ik deze drie punten goed kon bereiken, ik iets zou hebben wat geen enkel ander spel had en mensen een echt unieke ervaring zou kunnen bieden. Dat was het doel en wat ik echt wilde doen als schepper. Het is nog steeds het innerlijke vuur dat me pusht om unieke en originele dingen te doen.

Denk je dat grote game bedrijven te “veilig” zijn geworden sinds 1999, en denk je dat een grote uitgever als Sega hier, 20 jaar later, een spel als Seaman zou uitgeven?

De laatste tijd heeft de game industrie, vooral de consumenten game industrie, te maken met projecten die een enorme hoeveelheid kapitaal kosten en zijn daarom verschoven naar een Hollywood film business model waar je veilige weddenschappen moet plaatsen zoals sequels om te overleven. Het is waarschijnlijk de enige manier om zo’n enorme hoeveelheid aan ontwikkelingsrisico’s terug te verdienen. Ik hoop dat het equivalent van wat “The Blair Witch project” deed voor films, zal gebeuren in games.

Ik weet dat Sega een bedrijf is vol met mensen die graag interessante dingen doen. En er zijn veel nieuwe mensen die die geest verder zetten. Dus als er nog een spelontwerp als Seaman langskomt, weet ik zeker dat Sega het type bedrijf zou zijn dat zijn best zou doen om het tot een succes te maken.

Saito’s Seaman Classic Game Postmortem at GDC 2017

Hoeveel extra druk stond er op u om van Seaman een hit te maken, aangezien Sega concurreerde met PlayStation? Hoe was dat?

Nee, ik denk niet dat Sega druk voelde door het feit dat PlayStation een vroege voorsprong had genomen? Of tenminste aan de schepper kant van de dingen in de studio waren we enkel gefocust op hoe we de meest creatieve dingen konden doen met de nieuwe hardware. Natuurlijk weet ik zeker dat het verkoopteam en het hogere management er heel anders over dachten en in feite veel druk uitoefenden, maar de creatieve kant was net een stel kinderen die opgewonden waren om met hun nieuwste speeltje te spelen.

Wat was je proces voor het ontwerpen van gesprekken in Seaman? Welke hulpmiddelen heb je gebruikt, en wat waren je leidende principes bij het schrijven van het script?

De hele structuur en het ontwerp van de conversatie is alleen door mij gedaan. Dat komt omdat het grootste deel van de conversatie gebaseerd is op mijn dagelijkse observaties van het leven. En eigenlijk, is het mijn stem in de Japanse versie als zeeman. Dus het was makkelijk voor mij om “in-character” te zijn als ik als Seaman speelde.

Als we meerdere mensen het karakter, de conversatie en de gedachten van Seaman hadden laten uitwerken, zou Seaman helemaal van de wereld zijn geweest. Dus dat betekent eigenlijk dat zeeman mij is. En hoewel dat een vrij eenvoudig karakterontwerp is, denk ik dat die eenvoud ons in staat stelde onze deadline te halen, zelfs toen het moeilijk werd. Bij het uitwerken van het script, waren er enkele regels. Als Seaman te hard was met zijn woorden, zou dat beledigend zijn geweest of de eindgebruiker teleurgesteld hebben. Dus lieten we Seaman dingen zeggen die een zure maar lieftallige oude dame zou kunnen zeggen. Het mogen dan harde woorden zijn, maar je kan zien dat er een warmte en liefde achter zit tot het punt waar je uiteindelijk die tonaliteit apprecieert.

Toen het gelokaliseerd werd door Sega America, beschreef ik enkel het high-level concept aan Sega of America en zij gingen ermee aan de slag. Ik heb geen idee of deze “regels” zijn overgebracht in de Engelse versie of niet.

Met alle stem-technologie beschikbaar vandaag, waarom zijn voice-centric games niet populairder (of misschien is de vraag is, waarom zijn niet meer devs maken ze?

Ik denk dat dit een echt goede vraag, dus sta me toe om de vrijheid te nemen van het gaan diep in een konijnenhol om het te beantwoorden. In spellen met spraakherkenning zijn er twee hoofdonderdelen. De ene is richting en de andere is navigatie.

Richting wordt gebruikt als een vorm van het leiden van een speler naar het scenario pad dat u hebt opgezet en elk type woord kan een soort van richting apparaat zijn. Navigatie daarentegen vindt alleen plaats wanneer de speler een vooraf bepaald commando of invoer invoert, zoals “links” of “vooruit”. Seaman is dus een spel gebaseerd op navigatie. Dus als de speler het commando of de input invoert die de maker van tevoren heeft bepaald, “spring” je naar het volgende deel van het gesprek of de dialoog.


Saito’s Seaman-concepten

Het is een vrij eenvoudig ontwerp. Maar om het gevoel van realiteit te creëren, moesten we 40.000 verschillende soorten zeelieden creëren. Zeeman is niet echt begrijpen wat elke speler zegt. Het is gewoon dat we zoveel verschillende antwoorden hebben voorbereid voor de grote verscheidenheid van mogelijke gesproken antwoorden/conversaties die een speler kan zeggen en dan springen naar de natuurlijk correcte voortzetting van de dialoog gebaseerd op dat systeem waardoor het lijkt alsof Seaman begrijpt.

Eigenlijk zijn spellen een beetje zoals talen. In kaartspellen heb je beperkte kaarten die je kunt uitspelen in antwoord op een andere speler. Menselijke communicatie heeft echter niet dezelfde beperkingen als een kaartspel of een RPG. Communicatie kan behoorlijk uitgebreid zijn. Proberen een kaartspel te maken met zoveel mogelijkheden zou voor een mens een enorme uitdaging zijn… bijna onmogelijk eigenlijk. Dus hebben we geen andere keus dan te wachten op AI om die onmogelijke kloof te overbruggen.

Hoewel, zelfs als AI-gebaseerde communicatie beter en beter wordt, betwijfel ik of het een goede basis is voor een spel. In principe zijn spellen vrij eenvoudig en ongecompliceerd. Hoe ingewikkelder ze worden, hoe moeilijker het is om goede “win-verlies voorwaarden” te scheppen. Dat is de hoofdreden waarom zo’n spel een uitdaging is. Trouwens, ik ben eigenlijk een AI-engine aan het maken die gebaseerd is op Japanse taal en woorden.

Wat voor 2019 technologie zou je gebruiken om vandaag de dag een nieuwe Zeeman-stijl te maken?

Om in deze tijd een nieuwe Zeeman te maken is er één absoluut essentiële technologie die we nodig hebben. Dat is een motor die in staat is een gesprek organisch voort te zetten zonder een script nodig te hebben. Je zou dit natuurlijk AI noemen.

De originele Zeeman vereiste dat het hele script en de conversatie vooraf als een spraakbestand door een stemacteur werden opgenomen. En als je alle stemmen hebt gehoord, is er niets meer aan te doen. In principe heeft het spel wat je zou noemen een “einde”. Maar als je bedenkt wat je nu al kunt doen nu iedereen een mobiele telefoon bij zich heeft, zou je verwachten dat Seaman de huidige activiteit van de gebruiker kan observeren en becommentariëren en daar voortdurend commentaar op kan geven…bijna oneindig. Dat is waarom je op dit punt een AI engine nodig hebt om dat soort ontwerp te kunnen realiseren. Het is ook de reden waarom ik kapitaal ben gaan verzamelen om zo’n engine te gaan maken en eraan te blijven werken.

Dus mijn focus en interesse is niet langer spelletjes maar eerder een semi-permanente manier om Japans te blijven spreken of liever een engine die de ongelooflijk ingewikkelde en genuanceerde taal die Japans is uit elkaar kan halen en dan weer kan samenvoegen tot zinvolle gespreksreacties. Als ik dat doel kan bereiken, kan ik me voorstellen dat andere ingewikkelde talen ook in een AI-engine kunnen worden vertaald.


Het microfoon-randapparaat van de Dreamcast

Wat heb je geleerd van het zien hoe mensen met Seaman omgingen?

Ja, ik heb heel belangrijke lessen geleerd. U kreeg inzicht in mensen door een steekproef van meer dan een miljoen en zag hoe de gesprekken zich ontwikkelden. Het is een heel belangrijke les voor me geweest. Een van de grootste ontdekkingen was dat toen al die mensen naar de microfoon keken en hun best deden om een gesprek met Seaman te voeren, de meesten van hen geen grammaticaal correcte taal spraken. Het gaf me het gevoel dat als je vertrouwt op leerboekregels om stemherkennings-AI te maken, je nooit in staat zult zijn om de organische stroom van echte dialoog te vangen en zonder dat zou je nooit in staat zijn om een goede engine te maken die dat kan bereiken.

En dat is waar ik een andere grote ontdekking had-melodie. Dat communicatie niet alleen over woorden gaat… melodie speelt een belangrijke rol en dat die mogelijk nog belangrijker is dan het volgen van de exacte woordvolgorde en grammaticale structuur. En eigenlijk is dat in het Japans al zo. De woordvolgorde is erg losjes. Japans is als Yoda spreken (lacht). Dus realiseerde ik me dat het maken van een engine die melodie kon herkennen een efficiëntere manier zou zijn om het AI stemherkenningsprobleem op te lossen dan te proberen de zinsstructuur te volgen. Dus in mijn “Seaman AI Research Lab,” bouw ik aan een taalherkenningsengine gebaseerd op wat ik “melodietaal” noem.

Wat is je dierbaarste herinnering aan de ontwikkeling van Seaman?

Toen de Engelse versie van Seaman werd uitgebracht, was ik erg benieuwd hoe het zou worden ontvangen. Toen Leonard Nimoy zichzelf in het spel voorstelde met zijn echte naam, was het echt geweldig om alle eindgebruikers te zien glimlachen, omdat we hetzelfde bereikten in de Japanse versie. Ik vraag me af waarom dat is? Misschien omdat een acteur die een ander personage introduceert maar zijn echte naam zegt, een beetje de vierde-muur-breekt en gewoon iets is dat je zou verwachten van een drama en niet van een spel. Het was precies een van de kenmerken die ik wilde – dat Seaman tot de eindgebruiker zou spreken vanuit de TV, kijkend naar de wereld. Dus de atypische, vreemde en grove Seaman brak uiteindelijk alle juiste regels en stijlfiguren, zowel in het Engels als in het Japans!

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.