iKoala

Ciò che si scopre aprendo la mente e guardando il mondo con occhi diversi.
Tu ordini lui fa: Linux ascolta e parla!

Quanti di voi hanno sognato di controllare il computer semplicemente pronunciando i comandi? Quanti di voi hanno solamente immaginato di utilizzarlo sfruttando la nostra voce? Dialogare con il computer? Io non l’ho sognato! Già lo faccio! ;-)

Hai detto nulla? Stavo parlando con il PC!

Hai detto nulla? Stavo parlando con il PC!

Vediamo come interagire con il computer usando non solo il mouse e la tastiera, ma anche un microfono e le casse audio:  ci sono software per GNU/Linux capaci di riprodurre e comprendere le parole e comportarsi di conseguenza. That’s so cool!

Di cosa abbiamo bisogno? Vediamo di andare in giro per un supermercato e comperare le seguenti cose:

  • Un microfono
  • Degli altoparlanti
  • Almeno un orecchio ed una bocca
  • Un cervello

Dovreste avere a disposizione tutto il necessario! Andremo ad installare il sintetizzatore vocale, che permetterà al computer di riprodurre del testo e dei contenuti sotto forma di voce umana. Successivamente vedremo come utilizzarlo nel software di IM Pidgin.  Installeremo un software capace di riconoscere e tradurre in azioni la nostra voce. Il risultato non sarà garantito al 100%, ma di sicuro potrete controllare il computer con le sole corde vocali :)

GNU/Linux Parla

Installaimo Mbrola e Festival: Mbrola rappresenta un tipo di algoritmo che è capace di analizzare meglio il testo e riprodurlo in base ad una struttura di suoni e quantità di sillabe. Per questo motivo Mbrola renderà la voce del computer molto più umana e meno metallica: resterà comunque una voce computerizzata! Festival, invece, è un software che prenderà il contenuto da riprodurre e lo darà in pasto all’algoritmo, ottenendo un suono che verrà riprodotto. Procediamo con l’installazione su ArchLinux di Mbrola:

yaourt -S mbrola mbrola-italian

Così facendo compileremo ed installeremo mbrola e le librerie italiane. Procediamo ora con l‘installazione di Festival digitando da terminale:

yaourt -S festival festival-italian

A questo punto il nostro computer sarà in grado di pronunciare parole, ma come? Apriamo un terminale e digitiamo il comando festival e quindi digitiamo questa riga di codice:

(SayText "You Are So Stupid!")

Ma a parte questo, bisogna dire che ci sono software capaci di farlo mediante plugin specifici proprio come Pidgin. Installiamo il plugin per Pidgin per fare in modo che quest’ultimo ci legga i messaggi che riceve. Digitiamo da terminale:

sudo yaourt -S pidgin-festival

Niente di più facile! Ora potrete riavviare pidgin e dal menu Strumenti > Plugins abilitare e configurare il plugin Festival! Et voilà!
Googlando
per il web potrete notare come Festival si integri con altri programmi di ogni genere e natura! Sta a voi fare le scelte giuste!

GNU/Linux Ascolta

Ora arriva il bello, la vostra macchina fatta di freddo metallo è anche capace di comprendere le vostre parole… Mediante il software Perlbox-voice potremo instaurare una relazione tra la nostra voce ed i comandi da avviare. Questo programma ci sarà utile per impostare le azioni da compiere quando pronunciamo una determinata parola.

Per prima cosa scarichiamo sphinx2, che anche se il software si è evoluto fino alla versione 4.1, perlbox ha bisogno dell’antico e poco affidabile sphinx2, ma incrociamo le dita e scarichiamo gli ultimi sorgenti di questa versione con il seguente comando:

wget http://cmusphinx.org/download/nightly/sphinx2.nightly.tar.gz

non ci resta che decomprimere il file appena scaricato. Eseguiamo questo comando che farà tutto per noi:

tar -xvvzf sphinx2.nightly.tar.gz

Quindi spostiamoci nella cartella appena creata e avviamo la compilazione digitando questo comando:

./configure --prefix=/usr --sysconfdir=/etc --bindir=/usr/bin

Così facendo verrà creato e controllato tutto il necessario per una buona compilazione. Il software saprà dove andare ad installare i file e come costruire il programma, impostando i percorsi giusti per il nostro caso. Se tutto è andato liscio, non ci resta che avviare la compilazione con il seguente comando:

make && sudo make install

Con il precedente comando si è compilato ed installato nel sistema sphinx2. Ma il sorgente appena scaricato necessita di qualche piccola modifica, in modo da adattarlo alle esigenze di altri programmi, come perlbox. Quindi dovremo fare in modo che alla richiesta del file /usr/bin/sphinx2-continuous dovremo dirottare il tutto sul file /usr/bin/sphinx2_continuous mediante un semplice link simbolico. Quindi digitiamo da terminale il seguente comando:

sudo ln -s sphinx2_continuous /usr/bin/sphinx2-continuous

Il peggio è passato, ora non ci resta che installare perlbox-voice, ma prima dovremo assicurarci di avere tutte le dipendenze giuste. Avviamo il seguente comando, installando e verificando tutto il necessario:

sudo pacman -S perl perl-tk festival

Il processo controllerà e installerà tutti i pacchetti mancanti. Quindi possiamo scaricare i file sorgenti auto-installanti di perlbox-voice. Questi script faranno tutto il necessario per noi: controllano le dipendenze, ricercano eventuali errori e si installano nel sistema.  Rechiamoci sulla pagina di download del progetto e scarichiamo l’ultima versione. Oppure digitiamo da terminale i seguenti comandi:

wget http://tinyurl.com/ycpktvc

e successivamente decomprimiamo il file appena scaricato in una cartella. Quindi digitiamo:

tar -xvvzf perlbox-voice-0.09.noarch.tgz

L’unica cosa da fare ora, è procedere con l’installazione. Abbiamo tutto quanto pronto, dobbiamo solo avviare lo script auto-installante. Date i seguenti comandi:

chmod +x ./perlbox-voice-0.09/perlbox-voice.install

sudo ./perlbox-voice-0.09/perlbox-voice.install

Et voilà! Una volta finita l’operazione non ci resta che avviare il programma digitando da terminale il programma:

perlbox-voice

Una comoda interfaccia grafica, molto comprensibile e non tanto difficile da usare, vi guiderà alla configurazione del programma. In breve vediamo il suo funzionamento.

La finestra principale di perlbox-voice

La finestra principale di perlbox-voice

Avviato il programma, ci si presenterà una nuova finestra identica a quella mostrata nell’immagine. Tralasciando le discussioni sul Logo, risalta subito all’occhio il pannello laterale che permette di accedere alle principali funzionalità di questo programma:

  • Control, ovvero dove è possibile controllare la riproduzione e l’ascolto
  • Vocab, ossia il campo che ci permette di modificare il vocabolario a disposizione, in modo da aggiungere e rimuovere contenuti e comandi relativi.
  • Config, il pannello che permette di configurare il programma.
  • Help, nel caso abbiate bisogno di un aiuto.

Per prima cosa clicchiamo sul pulsante Config, in modo da impostare la giusta configurazione del programma: selezioneremo un browser come Firefox, il livello di Verbosità ( ossia quanto il nostro computer dovrà parlare) ed una parola magica che precederà i comandi da lanciare. Niente di più facile: Modificheremo solo il necessario! Il primo campo da modificare è il livello di verbosità: dovrete portarlo a 5/4 in modo che questo ci avverta quando sta ascoltando o quando si è fermato. Il secondo campo è il browser, consiglio vivamente Firefox. Ricordate di applicare le modifiche, sempre e comunque!

Come riempire i campi

Come riempire i campi

Cliccando sul pulsante Vocab, invece, si accede ad una lista di comandi e parole. Ad ogni termine viene associato un comando da inviare. Se si desidera inserire un proprio messaggio si può fare come in figura: Riempite i campi When You Say: con il testo che dovrà essere pronunciato, e Computer Does: con il comando da eseguire. Al posto del comando si può anche utilizzare la funzione speciale say che ti permette di far dire al computer del testo, o, mediante l’uso degli apici ( ` ) si può far leggere un output di un programma.

Se si realizza un ricco vocabolario bisogna stare attenti ad una cosa fondamentale: la pronuncia dell’inglese. Infatti quando direte delle parole, queste saranno trasformate in testo grazie al riconoscimento vocale basato sulla lingua inglese.

Cliccando ed aprendo la tabella Control è possibile, da come avrete sicuramente intuito, controllare il programma: Sarà possibile digitare del testo da far riprodurre al sintetizzatore vocale, e non solo. Cliccando sul pulsante Sart Listener potrete avviare l’ascolto: Il programma aprirà le orecchie per ottenere da voi gli ordini stabiliti in Vocab preceduti dalla parola magica. Quando avrete finito, vi basterà cliccare sul pulsante Stop Listener e tornare alla normalità.

Avrete pieno controllo del computer: Potrete dialogare con lui e, se siente molto asociali, instaurare un rapporto di amicizia con una gelida lastra di metallo. Ricordate che l’amore non ha confini…

Tornando a noi vi basterà pronunciare la parola magica, che di default è Listen ed in seguito il nome del comando definito nella tabella Vocab. Facile e divertente! Non è vero? :)

E ricordate: Non usate il microfono per altri scopi quando avete avviato questo programma: potrebbe succedere qualche cosa di brutto ;-)

13 dic 09 | Guide, Informatica, News, Progetti, Programmi, gnu/Linux, inUtility
« Eventi: Siderus Meeting suona male?
La differenza di uno 0 ed una O »
blog comments powered by Disqus

I am koalalorenzo!

Lorenzo Setale: Giovane, Sviluppatore, Appassionato d'informatica e delle nuove tecnologie.

Pagine

  • About Me
  • Progetti

Articoli casuali

  • Più corri, più va veloce internet! :)
  • Autenticazione USB su Debian GNU/Linux
  • Non commettere anche tu lo stesso errore!
  • Visa & Linux, per combattere la crisi.
  • Nokia cosa???

RSS Eucalipto

  • My Mom's on Facebook
  • come si usano queste? Aiuto!
  • Rai: Non stiamo subendo pressioni o censure
  • #Twitter è down, per me è crisi... meno male che c'è #Meemi! :D
  • Pubblicità: Fototessera 3D

Categorie

  • Apple
  • Attualità
  • Come tira il vento
  • Comuni mortali
  • Copia e Incolla
  • Distribuzioni
  • Divertente
  • Giochi
  • gnu/Linux
  • google
  • Grafica
  • Guide
  • Informatica
  • inUtility
  • Life
  • musica
  • NetBook
  • News
  • Nintendo
  • Progetti
  • Programmazione
  • Programmi
  • Propaganda del buon senso
  • Sito del giorno
  • Telefonini
  • Web
  • Youtube

Archivi

  • marzo 2010
  • febbraio 2010
  • gennaio 2010
  • dicembre 2009
  • novembre 2009
  • ottobre 2009
  • settembre 2009
  • agosto 2009
  • luglio 2009
  • giugno 2009
  • maggio 2009
  • aprile 2009
  • marzo 2009
  • agosto 2008
  • luglio 2008
  • giugno 2008
  • maggio 2008
  • aprile 2008
  • marzo 2008
  • febbraio 2008
  • gennaio 2008

Blogroll

  • Bl@ster's Blog
  • Brand:GNU
  • Damym
  • g3cko
  • Gica & Oltre
  • GicaTech
  • iKoala Answers
  • Luca Marchi
  • Navback's blog
  • Piplos’ Blog

Cerca nel blog

Creative Commons License © Lorenzo Setale iKoala · RSS Feed