FOLIO

Il Voice User Interface Design: progettare per le applicazioni a controllo vocale

Il Voice User Interface Design
progettare per le applicazioni a controllo vocale

Alessandro Piccioni - Founder and Director tonidigrigio.it


Con l’introduzione sempre più massiva di funzioni e dispositivi a controllo vocale, come Apple HomePod , Google Home e Amazon Echo, stanno sempre più diventando rilevanti gli aspetti legati all’esperienza utente basata sulle interazioni vocali. Il tema di ricreare una conversazione naturale, semplice ed intuitiva è l’elemento chiave dello sviluppo di questa tecnologia, ecco perché si rende sempre più necessario lo sviluppo di una nuova figura, il Voice User Interface Designer.

Si prevede che il mercato globale dei sistemi conversazionali raggiungerà 37 miliardi di dollari entro il 2027, crescendo ad un tasso annuale di circa il 26%. Le aziende possono sfruttare la tecnologia del "linguaggio naturale" per migliorare il servizio clienti, aumentare l'efficienza dei dipendenti, facilitare l'uso dei loro prodotti o servizi o comprendere le informazioni nascoste in dati vocali o testuali non strutturati.

Mentre il COVID-19 ha avuto impatto molto negativo sulla maggior parte delle aziende, la pandemia sta influenzando favorevolmente la crescita del mercato dei sistemi conversazionali. I sistemi basati sull'intelligenza artificiale migliorano le esperienze dei clienti online e la reputazione del marchio, offrono supporto in tempo reale ai clienti, rispondono con soluzioni e prodotti adeguati, suggeriscono sconti e offerte personalizzate e riducono al minimo i reclami e i tassi di abbandono dei clienti.


Cosa possono fare gli utenti con i comandi vocali?

ComScore attraverso una ricerca ha individuato che oltre la metà degli utenti che possiedono uno smart speaker utilizza il proprio dispositivo per porre domande generali, controllare il meteo e ascoltare musica in streaming, assegnare un promemoria, azionare un timer o una sveglia. Sono in rapida evoluzione anche applicazioni legate alla domotica e al controllo di altri dispositivi, così come nuove forme di intrattenimento e servizi al cliente.


Lo sviluppo di un'interfaccia vocale parte dalla customer journey

Lo sviluppo di un’interfaccia vocale parte dalla comprensione dei bisogni, dei comportamenti e delle motivazioni dell'utente attraverso l'osservazione e il feedback. Un customer journey che includa la voce come possibile canale non solo può aiutare i ricercatori della user experience a identificare le esigenze degli utenti nelle varie fasi del coinvolgimento, ma può anche aiutarli a vedere come e dove la voce può essere uno strumento efficace di interazione.


Raccogliere i requisiti: le user stories

Per progettare un'applicazione basata sull’interazione vocale si rende necessario definire i requisiti degli utenti. Oltre a mappare la customer journey e condurre analisi della concorrenza o di buone pratiche, possono essere utili anche altre attività di ricerca come interviste e soprattutto attività di esplorazione come la pratica delle user stories.

Per la progettazione VUI, questi requisiti scritti sono tanto più importanti poiché comprenderanno la maggior parte delle specifiche di progettazione per gli sviluppatori. Si rende quindi necessario individuare i possibili scenari prima di trasformarli in un flusso di dialogo di conversazione tra l'utente e l'assistente vocale.
Un esempio di user story per un'applicazione di news potrebbe essere:

Come utente, desidero che l'assistente vocale legga gli ultimi articoli di notizie in modo da poter essere aggiornato su ciò che sta accadendo senza dover guardare il mio schermo.

Con questa user story in mente, possiamo quindi progettare un flusso di dialogo per essa.


Come è strutturato un comando vocale

Prima di poter creare un flusso di dialogo, è necessario approfondire come è strutturato un comando vocale. Durante la progettazione di VUI, i progettisti devono costantemente pensare all'obiettivo delle interazioni vocali (ad esempio, cosa sta cercando di ottenere l'utente in questo scenario? ).
Il comando vocale di un utente è costituito da tre fattori chiave, che useremo con la stessa terminologia usata all’interno degli ambienti di sviluppo di questo tipo di applicazioni:

  • Intent
  • Utterance
  • Slot

Proviamo a sviluppare un esempio che abbia come focus la seguente richiesta:

Riproduci musica rilassante su Spotify

L'Intent (l’obiettivo dell’interazione)

L’intent rappresenta l'obiettivo più ampio del comando vocale di un utente e può trattarsi di un'interazione più o meno complessa e articolata. Un'interazione potrebbe riguardare l'esecuzione di un compito molto specifico, come richiedere che le luci del soggiorno siano spente o che la doccia abbia una certa temperatura. Progettare queste richieste in realtà è più semplice poiché è molto chiaro cosa ci si aspetta dall'assistente vocale.
Altre richieste però possono essere più vaghe e più difficili da interpretare. Ad esempio, se l'utente desidera avere più informazioni su una città potrebbe non essere chiaro il suo obiettivo (deve pianificare un viaggio? vuole avere informazioni generiche sulla città? Vuole conoscere le ultime notizie che riguarda quella città?).
Nel nostro esempio, l’obiettivo è evidente: l'utente vuole ascoltare la musica.


L'Utterance (il modo in cui l’utente esprime il comando)

Un Utterance riflette il modo in cui l'utente formula la frase per fare la sua richiesta. Nel nostro esempio sappiamo che l'utente desidera riprodurre musica su Spotify dicendo "Fammi ascoltare ...", ma questo non è l'unico modo in cui un utente può effettuare questa richiesta. Ad esempio, l'utente potrebbe anche dire: "Voglio ascoltare musica ...", “Vorrei sentire...”, etc.
Il ruolo del VUI designer diviene qui fondamentale perché ha il compito di considerare ogni possibile variazione dell'enunciato. Ciò aiuterà il motore di intelligenza artificiale a riconoscere la richiesta e collegarla all'azione o alla risposta giusta.


Gli Slot (le variabili)

A volte un intent da solo non è sufficiente a definire la richiesta, e si rende necessario chiedere maggiori informazioni. Alexa lo chiama uno "slot" e gli slot sono essenzialmente delle variabili, che definiscono con maggiore precisione l’obiettivo dell’utente. Nel nostro caso lo slot è “rilassante”, ma poiché la richiesta può ancora essere completata senza di esso, questo slot è opzionale.
Se volessi effettuare la prenotazione di una pizza, sapere la tipologia voluta dall’utente diviene invece un elemento essenziale per poter concludere l’ordine.


Prototipazione di conversazioni VUI con flussi di dialogo

La fase di prototipazione può assomigliare allo sviluppo di una sceneggiatura, dovendo strutturare un vero e proprio dialogo tra l’assistente vocale e l’utente. Il flusso che ne risulterà prevederà al suo interno:

  • Parole chiave di attivazione che portano all'interazione
  • Ramificazioni che rappresentano dove potrebbe portare la conversazione
  • Finestre di dialogo di esempio sia per l'utente che per l'assistente

Un flusso di dialogo è uno script che illustra la conversazione avanti e indietro tra l'utente e l'assistente vocale. Esistono persino dei tool che permettono all’interno dello stesso ambiente di sviluppare un prototipo e poi finalizzarlo direttamente come applicazione. E’ il caso di Voiceflow, uno strumento in rapida crescita che rappresenta una grande innovazione nel settore e permette anche a chi non conosce direttamente i linguaggi di programmazione propri di questa tecnologia, di sviluppare applicazioni a controllo vocale.

PROGETTI CORRELATI

link to project

ELICA SPA

2020 - Radio Elica Podcast

link to contatti
Vuoi saperne di più?

Scrivici cosa ne pensi, ci piace scambiare opinioni!