Come NaturallySpeaking impara a riconoscere Speech

12/02/2010 by admin

I computer sono molto intelligenti, quando si tratta di cose cervello-Tendendo come giocare a scacchi e la compilazione di dichiarazioni dei redditi, quindi si può pensare che sarebbero sfreccia a "semplici" attività come il riconoscimento dei volti o nel comprendere le parole.

Ma dopo circa 50 anni di tentativi di rendere i computer fanno queste cose semplici, i programmatori sono giunti alla conclusione che una competenza non è semplice solo perché gli esseri umani padroneggiare facilmente. In realtà, il nostro cervello e gli occhi e le orecchie sono pieno zeppo di sofisticati sensori e apparecchiature per il trattamento che funziona ancora anelli intorno qualcosa che possiamo progettare in silicone e metallo.

Noi esseri umani pensiamo che sia semplice da capire il discorso perché tutto il lavoro veramente duro è fatto prima di diventare coscienti. A noi, sembra che le parole inglesi solo pop in testa non appena le persone aprono la bocca. La natura inconscia (o preconscio) del processo rende doppiamente difficile per i programmatori di computer di imitare.

Per avere un'idea del perché i computer hanno tali problemi con il discorso, pensare a qualcosa che sono molto bravi a riconoscere e comprendere: i numeri di telefono a toni. Quei puntini e bloops sulle linee telefoniche sono molto più significative per i computer di quanto non siano le persone. Diverse importanti caratteristiche rendono i toni del telefono un linguaggio semplice per i computer, elencati di seguito. Inglese, d'altra parte, è completamente diverso.

  • Il touch-tone "vocabolario" ha solo 12 "parole" in esso. Dopo aver individuato i toni per le dieci cifre più * e #, siete in. Inglese, d'altra parte, ha centinaia di migliaia di parole.
  • Nessuna delle parole lo stesso suono. Sul telefono a toni, la "1" tono è nettamente diverso dal tono "7". Ma l'inglese ha omonimi, come nuovi e GNU, e vicino omonimi, come più allegro e sposarla. A volte intere frasi suonano allo stesso modo: "I figli sollevano carne" e "I raggi si incontrano del sole", per esempio.
  • Tutti i "diffusori" della lingua dire le parole nello stesso modo. Premere il tasto 5 su qualsiasi telefono, e si ottiene esattamente lo stesso tono. Ma un uomo anziano e una ragazza di 10 anni, usano toni molto diversi quando parlano; e persone provenienti da Gran Bretagna, Canada e Stati Uniti pronunciare le stesse parole inglesi in modi molto diversi.
  • Il contesto è privo di significato. Per il telefono cellulare, un 1 è un 1 è un 1. Come interpretare il tono non dipende dal numero precedente o il numero successivo. Ma in inglese scritto, il contesto è tutto. Ha senso "andare a New York." Ma ha molto meno senso di "andare a due a New York" o "andare troppo di New York."

Articoli Correlati