Post pubblicato il 6 agosto 2008 in blogs.technet.com/terminologia
Ho finito di leggere un po’ di numeri di The New Yorker che mi ha passato una mia amica. Interessante l’articolo Hello, Hal, una panoramica dell’evoluzione di sintesi vocale e riconoscimento vocale dai primi esperimenti ai giorni nostri, delle difficoltà in questo campo e delle applicazioni pratiche più recenti.
Molte informazioni sono note e facilmente reperibili (cfr. le voci Sintesi vocale e Riconoscimento vocale in Wikipedia) ma alcuni dettagli sono curiosi, specialmente quelli usati per illustrare come alcune capacità del cervello umano siano praticamente impossibili da riprodurre artificialmente. Due esempi:
▄ | In una conversazione telefonica, siamo in grado di percepire se l’interlocutore stia sorridendo, e di che tipo di sorriso si tratti, grazie alla capacità dell’orecchio umano di riconoscere le variazioni di suono causate dalle diverse espressioni facciali: proprio per questo agli operatori di call center verrebbe detto di sorridere sempre e comunque (Smile – and the world can hear you). |
▄ | Il nostro udito è così sofisticato che, a quanto pare, basta il suono per farci capire se del liquido che viene versato è caldo o freddo. |
Per chi è interessato all’articolo, direi che si può iniziare a leggere da pagina 2.