Sempre piu` voci artificiali affollano le nostre giornate. Alcune voci
sono servili e vogliono aiutarci ad esaudire i nostri bisogni di
consumatori, altre voci ci intrattengono e divengono fenomeni o prodotti
artistici. In questo frastuono e’ difficile capire e le nostre orecchie
si stanno ormai abituando alle voci meccanizzate. Per questo ci siamo
munite di apparecchi acustici avanzatissimi e ci siamo avventurati in un
percorso interdisciplinare tra voci umane ed artificiali.
Inizieremo dalle voci artificiali come probabilmente non le avete mai
sentite. Non saranno le Syri, Cortana o Alexia a riempire le nostre
casse, ma le voci festose delle Vocalidols. Ma attenzione! queste voci
ci annoieranno presto e ci faranno perdere il senso del tempo. Se
riuscirete a non addormentarvi vi offriremo una panoramica su quello che
e’ il mondo contemporaneo delle cantanti artificiali (soprattutto
donne), dove sono, che lingue parlano e come si rapportano con i loro
colleghi umani.
Da questa ricerca storico-tecnologica ne emerge che vi sono solo poche
tecnologie che permettono di produrre suoni umani. Una di queste l’ha
sviluppata l’evoluzione in migliaia di anni, le altre sono venute furi
nel corso degli ultimi due secoli. Analizzeremo allora il tratto vocale
e le sorgenti di voci sintetiche con un sofisticato radar acustico
fastfurietrasformato in python. Metteremo a confronto delle sequenze
parlate e cantate simili -niente di meno che Vivaldi!- e vedremo che la
voce umana e’ sostanzialmente piu’ sporca!
La sporcizia e’ cio’ che ci rende umani, la sporcizia e l’unicita’ delle
nostre corde vocali, delle nostre emozioni e del nostro accento.
Ciascuna voce ha delle caratteristiche idiosincratiche che la macchina
non sa riprodurre, o non vuole. Sara’ qui che lasceremo la tecnica
acustica per avventurarci nelle neuroscienze della corteccia auditiva.
Vedremo come il sistema percettivo umano sa sfruttare quest imperfezioni
per riconoscere una voce familiare.
Sara’ allora il momento di capire qual’e’ la capacita’ di una macchina
di riconoscere il parlato e come se la cava con le imperfezioni di cui
le nostre voci si compongono. Vedremo allora la differenza tra il
riconoscere una voce parlata e una voce cantata, la seconda con le sue
variazioni e’ inaccessibile alla macchina, invece e’ intellegibile e
apprezzata dall’ascoltatore umano. Anche questa volta sara’ un approccio
hacker, con le mani in pasta.
Infine cercheremo di chudere il ciclo vedendo se la comunicazione
macchina-macchina e’ piu’ efficace, e in caso potremmo- e dovremmo-
lasciare le macchine a parlare tra loro!
A difesa dei valori macchinici intendiamo precisare che la tecnologia di
sintetizzazione vocale ci piace, e anche molto! Tuttavia, ci rifiutiamo
di paragonare l’umano e la macchina nell’arte canora. In questo impari
confronto perderemo entrambi le nostre specificita` e ci ritroveremo in
uno standard freddo e alienante. Alrettanto, cercheremo di mettere in
luce le contraddizioni di un sistema tecno-culturale che esalta
tecnologie piuttosto imperfette. Un sistema che dietro la maschera
dell’innovazione consuma infinite risorse energetiche, creando
ineguaglianze nell’accesso a questi strumenti e promuovendo l’utilizzo
di standard ragiungibili solo da pochi.