Yoot Saito è uno che si impegna a fare le cose in modo diverso. Che si tratti del gameplay del flipper incrociato di Odama o del disgustoso ma amabile animale domestico virtuale attivato dalla voce in Seaman, l’intento di Saito è stato quello di sorprendere i giocatori con nuovi tipi di interazioni.
Impegnare la propria carriera in giochi che piegano i generi non è certo una strada facile. Quest’estate segna 20 anni dall’uscita originale giapponese di Seaman sul venerato Dreamcast di Sega. Il gioco implementava una periferica microfonica, attraverso la quale i giocatori interagivano con una strana e spesso brontolona creatura marina che aveva la faccia e la voce di un uomo.
Nonostante la sua stranezza, e le sfide di marketing in essa contenute, Seaman fu un grande venditore, muovendo oltre un milione di unità tra le versioni Dreamcast e PlayStation 2.
Due decenni dopo l’uscita del gioco, Saito risponde alle nostre domande su Seaman, ricordando i successi e le difficoltà della realizzazione di un gioco così strano e spiegando la sua propensione ad andare in una direzione diversa rispetto agli altri game designer.
Il mio processo creativo per i nuovi giochi che mi appassionano è abbastanza semplice. Spesso uso oggetti/cose/luoghi che la maggior parte dei creatori di giochi tradizionali non prenderebbe in considerazione. Con Tower, si vede un lato di un grattacielo dall’alto e si osservano le persone al suo interno quasi come se si stesse guardando un formicaio. Con Seaman, l’idea di base era: e se il mio animale domestico a casa potesse parlare? Cosa direbbero? In Odama volevo vedere come ci si sentirebbe a comandare una forza di migliaia di soldati come generale. In pratica, volevo che la gente provasse qualcosa che normalmente non potrebbe provare, usando i giochi come forma d’arte per trasmettere questa sensazione.
Yoot Saito
Inoltre, non mi piace dipingere entro le linee di un genere preesistente come i giochi di ruolo, la caccia al tesoro, le sparatorie, ecc. Voglio fare le mie cose. Questa è una parte incredibilmente motivante del fare giochi per me. Tuttavia, ci vuole molta energia per creare e presentare qualcosa di “nuovo” alla gente. Ci vuole sempre più tempo del previsto per fare qualcosa di veramente originale e ci sono molte insidie lungo la strada che non ti aspetti. E una volta che sei nell’ignoto non c’è una soluzione unica per questo tipo di problemi. Richiede molto tempo ed energia da parte del produttore per risolvere questi problemi e il rischio è abbastanza grande, ma è ciò che lo rende degno di essere fatto.
In qualche momento ti sei sentito creativamente perso o bloccato durante lo sviluppo di Seaman? Se sì, su cosa ti sei bloccato?
Durante la creazione di Seaman, c’è un muro creativo contro cui mi sono scontrato e che mi è rimasto impresso nella memoria. Proprio prima di finalizzare il gioco abbiamo fatto una prova di gioco con alcune persone a caso e tutti hanno finito per dire cose che non avrei mai pensato che avrebbero detto in quella specifica situazione o parte della conversazione. Era proprio quando stavamo per essere il ciclo pubblicitario di Seaman. Il rappresentante marketing di Sega tenne un evento in un acquario a Tokyo e chiese alla gente di provare a parlare con i pesci nell’acquario. Questo era l’esperimento.
Le persone che parteciparono si girarono verso il microfono ma non sapevano cosa dire e fecero quello che la gente fa costantemente in queste situazioni. Hanno farfugliato una frase lunghissima. Non ho costruito Seaman per capire le conversazioni lunghe, quindi non era in grado di capire ciò che veniva detto. Così ritornava al normale percorso di parole “puoi dirlo di nuovo” o “Huh, hai detto qualcosa?” facendo effettivamente una domanda alle persone. Dopo più volte che Seaman non capiva la conversazione e chiedeva ai partecipanti di ripetersi, questi iniziavano ad arrabbiarsi o semplicemente non gli piaceva e andavano a casa. Le cose che le persone dicevano erano così diverse da quello che avevo progettato per Seaman che il team era completamente sconvolto.
Le persone che hanno visitato l’acquario non sapevano cosa dire al microfono, così hanno iniziato a dire cose come “perché questo pesce dall’aspetto strano è qui in primo luogo” e alla fine hanno creato frasi troppo lunghe che Seaman non poteva capire. Poiché non l’avevamo previsto, Seaman era bloccato in un loop di “Puoi dirlo di nuovo?”.
Per peggiorare le cose, il gioco stava per essere rilasciato poco dopo. Dopo aver pensato ad un’ampia varietà di soluzioni ho deciso di risolvere il problema attraverso il comportamento umano e la comprensione piuttosto che i disegni logici di un programma per computer. Quindi fondamentalmente Seaman avrebbe detto cose come “Parli troppo a lungo, non capisco” e “Se non lo dici in modo più semplice/breve, non voglio parlare con te” e si sarebbe lamentato con l’utente finale. Se non seguivano queste istruzioni, Seaman nuotava via nel retro dell’acquario.
Questa idea finì per essere una delle cose che piacevano davvero alla gente del gioco. Non appena gli utenti finali si resero conto che non potevano usare frasi lunghe, iniziarono a parlare con Seaman come se fosse un bambino dicendo frasi semplici e facili da capire come “ciao” e “scusa”. Ancora meglio era il fatto che parlavano lentamente e chiaramente. Questo portò ad un nuovo stile di gioco all’interno di Sega e ci aiutò ad evitare l’immagine che i giochi con riconoscimento vocale fossero cattivi e semplicemente non funzionassero. D’altra parte, Seaman divenne rapidamente noto come una creatura piuttosto egoista e difficile da collegare. (ride)
Seaman stesso
Come è stato lavorare sul Dreamcast negli anni ’90?
Penso che si possa riassumere tutto ciò che riguarda il Dreamcast al suo debutto negli anni ’90 come un’esperienza incredibilmente unica. Sega stava inseguendo i suoi rivali Sony e Nintendo come meglio poteva. Tuttavia, la gente alla Sega amava fare cose “divertenti” e “interessanti”. Così, invece di andare sul sicuro ed essere conservatori, andarono all’attacco e fecero tutte le cose creative e folli che potevano. Questo è il tipo di mentalità che ha permesso la nascita di un gioco così unico e insolito come Seaman. Lo hanno sostenuto e spinto molto sul fronte promozionale permettendogli di diventare un grande successo.
Quindi, per me, il Dreamcast è una grande console di gioco con molte caratteristiche uniche, ma più di questo, mi ricorda quei giorni in cui Sega stava facendo così tante cose creative e meravigliose.
Perché hai deciso che Seaman fosse così schietto e spesso maleducato? La prima è che ero stanco di personaggi carini e volevo fare qualcosa di veramente diverso. La seconda è la ragione che ho menzionato in precedenza, quel tipo di personalità ha aiutato ad aumentare le possibilità che Seaman capisse ciò che l’utente finale stava dicendo.
Come ti sei sentito quando, durante lo sviluppo, la gente ti diceva che il concetto era “volgare” o “inquietante”?
Volevo che Seaman fosse strano e volgare, quindi non avevo problemi con la gente che lo diceva. Questo è stato progettato. Per far sentire Seaman originale e avere caratteristiche veramente uniche ci sono cose che Seaman doveva fare per distinguersi veramente:
- NON è carino
- Guarda nel mondo degli utenti finali attraverso la TV
- Focalizzarsi sul mondo reale invece che su qualche mondo di fantasia
Ho sentito che se fossi riuscito a realizzare correttamente questi tre punti, avrei avuto qualcosa che nessun altro gioco aveva e le persone a presentare un’esperienza veramente unica. Questo era l’obiettivo e ciò che volevo davvero fare come creatore. È ancora il fuoco interiore che mi spinge a fare cose uniche e originali.
Pensi che le grandi compagnie di videogiochi siano diventate troppo “sicure” dal 1999, e pensi che un grande editore come Sega pubblicherebbe un gioco come Seaman qui, 20 anni dopo?
In questi ultimi tempi l’industria dei videogiochi, specialmente quella dei giochi di consumo, comporta progetti che costano un’enorme quantità di capitale e quindi si sono spostati verso un modello di business cinematografico di Hollywood dove devi fare scommesse sicure come i sequel per sopravvivere. È probabilmente l’unico modo per essere in grado di recuperare una tale quantità di rischio iniziale di sviluppo. Spero che l’equivalente di ciò che “The Blair Witch project” ha fatto per i film accada nei giochi.
So che Sega è una società piena di persone a cui piace fare cose interessanti. E ci sono molte nuove persone che continuano a portare avanti questo spirito. Quindi se arriva un altro game design come Seaman sono sicuro che Sega sarebbe il tipo di azienda che farebbe del suo meglio per renderlo un successo.
Quanta pressione aggiuntiva c’era su di te per rendere Seaman un successo, visto che Sega era in competizione con PlayStation? Com’era?
No, non credo che Sega abbia sentito la pressione dovuta al fatto che PlayStation aveva preso un vantaggio iniziale? O almeno sul lato creatore delle cose nello studio eravamo semplicemente concentrati su come fare le cose più creative con il nuovo hardware. Naturalmente, sono sicuro che il team di vendita e l’alta dirigenza la pensavano diversamente e in effetti c’era molta pressione, ma il lato creativo era come un gruppo di bambini entusiasti di giocare con il loro nuovo giocattolo.
Qual era il tuo processo per progettare le conversazioni in Seaman? Quali strumenti hai usato e quali sono stati i tuoi principi guida quando hai scritto la sceneggiatura?
L’intera struttura della conversazione e il design sono stati gestiti solo da me. Questo perché la maggior parte della conversazione è basata sulle mie osservazioni quotidiane sulla vita. E, in realtà, è la mia voce nella versione giapponese come marinaio. Quindi è stato facile per me essere “nel personaggio” quando giocavo come Seaman.
Se avessimo avuto più persone a costruire il personaggio, la conversazione e i pensieri di Seaman, Seaman sarebbe stato dappertutto. Quindi questo significa fondamentalmente che Seaman sono io. E anche se questo è un character design abbastanza semplice, penso che la semplicità ci abbia permesso di rispettare la scadenza anche quando le cose si sono fatte difficili. Quando si costruiva la sceneggiatura, c’erano alcune regole. Se Seaman fosse stato troppo duro con le parole, sarebbe stato offensivo o avrebbe deluso l’utente finale. Così abbiamo fatto dire a Seaman cose che una vecchia signora acida ma amabile potrebbe dire. Possono essere parole dure ma si può dire che c’è un calore e un amore dietro di esse al punto che alla fine si apprezza quella tonalità.
Quando è stato localizzato da Sega America, ho semplicemente descritto il concetto di alto livello a Sega of America e loro lo hanno seguito. Non ho idea se queste “regole” siano state trasmesse nella versione inglese o meno.
Con tutta la tecnologia vocale disponibile oggi, perché i giochi incentrati sulla voce non sono più popolari (o forse la domanda è, perché non ci sono più sviluppatori che li fanno?
Penso che questa sia davvero una buona domanda, quindi permettetemi di prendere la libertà di andare in profondità nella tana del coniglio per rispondere. Nei giochi che coinvolgono il riconoscimento vocale, ci sono due parti principali. Una è la direzione e l’altra è la navigazione.
La direzione è usata come una forma di guidare un giocatore lungo il percorso dello scenario che avete impostato e qualsiasi tipo di parola può essere un tipo di dispositivo di direzione. La navigazione d’altra parte avviene solo quando il giocatore immette un comando o un input predeterminato come “sinistra” o “avanti”. Quindi Seaman è un gioco basato sulla navigazione. In pratica, una volta che il giocatore immette il comando o l’input necessario che il creatore ha predeterminato, si “salta” alla parte successiva della conversazione o del dialogo.
Concezioni di Seaman di Saito
È un design piuttosto semplice. Ma per creare la sensazione di realtà, abbiamo dovuto creare 40.000 tipi diversi di marinai. Il marinaio non è davvero capire cosa sta dicendo ogni giocatore. È solo che abbiamo preparato così tante risposte diverse per la grande varietà di possibili risposte/conversazioni vocali che un giocatore può dire e poi saltare alla continuazione naturalmente corretta del dialogo basata su quel sistema che fa sembrare che Seaman capisca.
In realtà, i giochi sono un po’ come le lingue. Nei giochi di carte si hanno carte limitate che si possono giocare in risposta ad un altro giocatore. Tuttavia, la comunicazione umana non ha gli stessi limiti di un gioco di carte o di un RPG. La comunicazione può essere piuttosto espansiva. Cercare di creare un gioco di carte con così tante possibilità sarebbe estremamente impegnativo per una persona… quasi impossibile in realtà. Quindi non abbiamo altra scelta che aspettare che l’IA ci aiuti a colmare questo divario impossibile.
Tuttavia, anche se la comunicazione basata sull’IA migliorasse sempre di più, ho dei dubbi che sia una buona base per un gioco. Fondamentalmente, i giochi sono abbastanza semplici e diretti. Più complicati diventano, più è difficile creare adeguate “condizioni di vittoria-perdita”. Questa è la ragione principale per cui questo tipo di gioco è impegnativo. A proposito, sto effettivamente creando un motore AI basato sulla lingua e le parole giapponesi.
Che tipo di tecnologia del 2019 useresti per creare un nuovo stile Seaman oggi?
Per creare un nuovo Seaman in questo preciso giorno ed età c’è una tecnologia assolutamente essenziale di cui abbiamo bisogno. Cioè un motore che sia in grado di continuare organicamente una conversazione senza bisogno di uno script. Questo lo chiamereste AI ovviamente.
Il Seaman originale richiedeva che tutto il copione e la conversazione fossero preregistrati come file vocale da un doppiatore. E una volta che hai sentito tutte le voci, non c’è più niente da fare. Fondamentalmente il gioco ha quello che chiamereste un “finale”. Tuttavia, se si considera ciò che si può già fare ora con tutti che portano in giro un telefono cellulare, ci si aspetta che Seaman sia in grado di osservare e commentare l’attività corrente dell’utente e commentarla costantemente… quasi all’infinito. Questo è il motivo per cui è necessario un motore AI a questo punto per essere in grado di realizzare quel tipo di design. È anche il motivo per cui sono andato a raccogliere il capitale per iniziare a creare un tale motore e continuare a lavorarci.
Quindi il mio obiettivo e il mio interesse non sono più i giochi ma piuttosto un modo semi-permanente per continuare a parlare giapponese o meglio un motore che possa scomporre il linguaggio incredibilmente complicato e sfumato che è il giapponese e poi ricombinarlo in risposte di conversazione significative. Se riesco a raggiungere questo obiettivo, immagino che anche altre lingue complicate potrebbero essere tradotte in un motore di IA.
La periferica microfono del Dreamcast
Cosa hai imparato vedendo come le persone interagivano con Seaman?
Sì, ho imparato lezioni molto importanti. Hai avuto un’idea sulle persone attraverso un campione di oltre un milione di persone e guarda come si sono sviluppate le conversazioni. È stata una lezione molto importante per me. Una delle più grandi scoperte è stata che mentre tutte quelle persone puntavano il microfono e facevano del loro meglio per trovare una connessione conversazionale con Seaman, la maggior parte di loro non parlava un linguaggio grammaticalmente corretto. Mi ha fatto sentire che se ci si basa su regole da manuale per creare un’IA di riconoscimento vocale, non si sarà mai in grado di catturare il flusso organico del dialogo nel mondo reale e senza questo non si sarà mai in grado di creare un motore adeguato che possa raggiungere questo obiettivo.
E qui è dove ho avuto un’altra grande scoperta: la melodia. Che la comunicazione non è fatta solo di parole… la melodia gioca un ruolo significativo e che è potenzialmente ancora più importante che seguire l’ordine esatto delle parole e la struttura grammaticale. E in realtà è già così in giapponese. L’ordine delle parole è molto libero. Il giapponese è come Yoda che parla (ride). Così ho capito che creare un motore in grado di riconoscere la melodia sarebbe stato un modo più efficiente per risolvere il problema del riconoscimento vocale dell’IA piuttosto che cercare di aderire alla struttura delle frasi. Così nel mio “Seaman AI Research Lab”, sto costruendo un motore di riconoscimento linguistico basato su quello che chiamo “linguaggio melodico”.
Qual è il suo ricordo più bello dello sviluppo di Seaman?
Quando è uscita la versione inglese di Seaman, ero molto curioso di sapere come sarebbe stato accolto. Quando Leonard Nimoy si presenta nel gioco usando il suo vero nome, vedere tutti gli utenti finali sorridere è stato davvero fantastico, perché abbiamo ottenuto la stessa cosa nella versione giapponese. Mi chiedo perché sia così. Forse perché avere un attore che presenta un personaggio diverso ma dicendo il suo vero nome era un po’ una rottura della quarta parete e qualcosa che ci si aspetta da un dramma e non da un gioco. Era esattamente una delle caratteristiche che volevo – che Seaman parlasse all’utente finale da dentro la TV, guardando fuori nel mondo. Così l’atipico, strano e grossolano Seaman ha finito per rompere tutte le regole e i tropi giusti sia in inglese che in giapponese!