Fiche de cours

Reconnaissance vocale

Lycée   >   Terminale   >   Physique Chimie   >   Reconnaissance vocale

  • Fiche de cours
  • Quiz et exercices
  • Vidéos et podcasts
Objectifs
Présenter succinctement la voix humaine et en donner quelques caractéristiques.
Rappeler quelques mots-clés (hauteur et timbre).
Reprendre la notion d’analyse spectrale et introduire la notion de spectrogramme.
Donner les principes généraux de la reconnaissance vocale et quelques unes de ses applications.
1. La voix humaine
► En expirant de l’air par la trachée, l'homme est capable de parler. Cet air passe par le larynx, là où les cordes vocales peuvent se resserrer ou s’écarter afin de vibrer à des fréquences différentes. D’autres parties du corps, dont les fosses nasales, interviennent pour amplifier certaines fréquences des sons émis, comme une caisse de résonance. On les englobe sous le terme de conduit vocal. ⇔ La parole est une fonction physiologique complexe de l’Homme.

► Elle lui permet d’émettre une très large panoplie de sons différents. Cependant, l’homme n'utilise qu'un nombre restreint de sons élémentaires afin de se faire comprendre de ses semblables. Ces sons élémentaires sont nommés phonèmes. Dans la langue française, on recense 36 phonèmes distincts :

Phonème voyelle Phonème consonne Phonème semi-consonne
et issues de langues étrangères
/a/ cas
/ɑ/ pâte
/ɑ̃/ sans
/ə/ ce
/ø/ peu
/œ/ cœur
/e/ clé
/ɛ/ père
/ɛ̃/ plein
/i/ cil
/o/ pot
/ɔ̃/ ton
/ɔ/ porc
/u/ hibou
/y/ sangsue
/œ̃/ brun
/b/ bar
/k/ caillou
/ʃ/ méchant
/d/ dingue
/f/ flamme
/ɡ/ garçon
/ɲ/ agneau
/ʒ/ jeu
/l/ lanterne
/m/ mère
/n/ naguère
/p/ patriote
/ʁ/ radar
/s/ statique
/t/ tamis
/v/ voix
/z/ zirconium
/j/ yoyo
/w/ oui
/ɥ/ suie

/ŋ/ parking
/h/ hop
 

Les phonèmes sont les mêmes, mais les sons correspondants ne sont pas strictement identiques, d'une personne à une autre. En effet, bon nombre de paramètres physiques interviennent. Généralement, les femmes ont des cordes vocales et un conduit vocal plus courts que pour les hommes. Il en résulte qu’un homme a souvent une voix plus grave que celle d’une femme. On appelle hauteur d’un son sa fréquence correspondante.

► Cependant, les phonèmes ne sont pas constitués d’une seule fréquence, mais comportent des harmoniques: cela constitue le timbre de la voix, ce qui explique qu’il est rare que deux personnes aient exactement la même voix.
2. Analyse spectrale : le spectrogramme
L'analyse spectrale se présente sous la forme d’un spectre de Fourier.

Principe : tout signal peut se décomposer en une somme de sinusoïde
s. Ce graphe donne ainsi, pour chaque fréquence, le "poids" de celle-ci dans le signal. Pour un son pur et un son complexe, par exemple :

Doc. 1 : Son pur

 
Doc. 2 : Son complexe

Mais, pour faire une analyse fréquentielle de la parole, le spectre de Fourier tel quel ne suffit pas. En effet, le son émis change au cours du temps, donc la composition en fréquence varie de même. D’ailleurs, dans des logiciels de lecture de sons ou les chaines hi-fi, il est courant de voir différentes barres verticales qui évoluent au cours du temps. C’est en fait un spectre de Fourier mis à jour régulièrement. Naturellement, ce type de représentation est esthétique mais peu exploitable.

Le spectrogramme sur lequel le temps est selon un axe horizontal, et les fréquences en vertical.

Principe :
faire une analyse en fréquence pour des temps différents, et la représenter selon un dégradé coloré (selon la verticale). On travaille sur des fenêtres temporelles d’environ 20 ms. Les deux spectrogrammes ci-dessous montrent ce que donne l’analyse du son "a" par une voix féminine et masculine :




extrait sonore Voix féminine
extrait sonore Voix masculine

→ La différence de timbre est visible, via une différence des harmoniques. Maintenant, si on analyse les deux voix prononçant le mot « Maxicours », cela nous donne :



extrait sonore Voix féminine prononçant "Maxicours"
extrait sonore Voix masculine prononçant "Maxicours"

→ Les deux voix ne parlent pas à la même vitesse, n’insistent pas forcément sur les mêmes sons.
3. Principe de la reconnaissance vocale
Reconnaissance vocale = technique informatique dont la finalité est que la machine puisse analyser la parole de l’utilisateur, afin de transcrire ses propos en texte.

Exemple : Une stratégie de reconnaissance vocale est de travailler sur la reconnaissance des phonèmes car ils sont en nombre limité pour une langue donnée. Ainsi, le logiciel de reconnaissance vocale tente dans un premier temps de séparer les différents sons, qui constitueront les phonèmes à reconnaître. Cela passe par un filtrage, afin d’enlever les bruits.

Ensuite, il fait l’analyse son par son. Il choisit alors le phonème le plus probable, grâce à des algorithmes (notamment aux probabilités). Pour cette étape, on distingue deux types de logiciel :

♦ Les logiciels monolocuteurs, utilisés par une seule personne. Le programme propose durant son installation, d’effectuer une empreinte vocale de son utilisateur. Cela consiste à prononcer des phrases clés qui contiennent tous les phonèmes. C’est une sorte de phase d’apprentissage. Cet étalonnage permet d’optimiser la correspondance entre les sons captés et les phonèmes à reconnaître.

♦ Les logiciels multilocuteurs sont quant à eux destinés à plusieurs utilisateurs. Dans ce cas-là, pas de phase d'apprentissage.

A ce stade-là, le logiciel a bâti le texte, mais de manière phonétique. A l’aide d’une base de données comparable à un dictionnaire, il fait alors la correspondance entre groupes de phonèmes et mots existants. Une correction orthographique automatique se charge d’appliquer les règles d’accord, ce qui produit finalement le texte transcrivant le message vocal de l’opérateur.
4. Quelques applications de la reconnaissance vocale
► En informatique, on parle d’interface homme/ machine pour désigner le logiciel qui permet la communication entre l’utilisateur et la machine. La reconnaissance vocale trouve sa place dans une interface évoluée, car l’utilisateur n’est plus obligé de taper son texte.

Logiciels de dictée vocale = c'est un mode monolocuteur où l’utilisateur dicte son texte.
Du côté des applications multilocuteurs, la tâche est plus complexe, seul un ou plusieurs "mots clés" sont utilisés tels que "composer numéro", "chercher route", "menu" …

► En science fiction et/ou dans des technologies d’avant garde, on trouve la reconnaissance vocale. Elle revêt un côté futuriste. Elle "humanise" la machine. La reconnaissance vocale joue également un rôle de sécurité : la voix d’une seule personne autorisée permet d’accéder à certaines fonctions d’une machine.
L'essentiel
Parole = fonction physiologique humaine lui permettant de communiquer.

Phonèmes = sons élémentaires. L’analyse spectrale par spectrogramme révèle que ce sont des sons complexes, composés de nombreuses fréquences. D’une personne à l’autre, la hauteur (fréquence) des sons varie, tout comme le timbre (importance des harmoniques).

Reconnaissance vocale = outil informatique dont le but est de transcrire un message vocal en texte écrit. L’idée est de capter les sons émis par la parole, afin de les faire correspondre aux phonèmes.

Autres applications : la reconnaissance vocale peut servir pour la dictée de messages, en téléphonie ou pour identifier l'empreinte vocale d'une personne.

Évalue ce cours !

 

Des quiz et exercices pour mieux assimiler sa leçon

La plateforme de soutien scolaire en ligne myMaxicours propose des quiz et exercices en accompagnement de chaque fiche de cours. Les exercices permettent de vérifier si la leçon est bien comprise ou s’il reste encore des notions à revoir.

S’abonner

 

Des exercices variés pour ne pas s’ennuyer

Les exercices se déclinent sous toutes leurs formes sur myMaxicours ! Selon la matière et la classe étudiées, retrouvez des dictées, des mots à relier ou encore des phrases à compléter, mais aussi des textes à trous et bien d’autres formats !

Dans les classes de primaire, l’accent est mis sur des exercices illustrés très ludiques pour motiver les plus jeunes.

S’abonner

 

Des quiz pour une évaluation en direct

Les quiz et exercices permettent d’avoir un retour immédiat sur la bonne compréhension du cours. Une fois toutes les réponses communiquées, le résultat s’affiche à l’écran et permet à l’élève de se situer immédiatement.

myMaxicours offre des solutions efficaces de révision grâce aux fiches de cours et aux exercices associés. L’élève se rassure pour le prochain examen en testant ses connaissances au préalable.

S’abonner

Des vidéos et des podcasts pour apprendre différemment

Certains élèves ont une mémoire visuelle quand d’autres ont plutôt une mémoire auditive. myMaxicours s’adapte à tous les enfants et adolescents pour leur proposer un apprentissage serein et efficace.

Découvrez de nombreuses vidéos et podcasts en complément des fiches de cours et des exercices pour une année scolaire au top !

S’abonner

 

Des podcasts pour les révisions

La plateforme de soutien scolaire en ligne myMaxicours propose des podcasts de révision pour toutes les classes à examen : troisième, première et terminale.

Les ados peuvent écouter les différents cours afin de mieux les mémoriser en préparation de leurs examens. Des fiches de cours de différentes matières sont disponibles en podcasts ainsi qu’une préparation au grand oral avec de nombreux conseils pratiques.

S’abonner

 

Des vidéos de cours pour comprendre en image

Des vidéos de cours illustrent les notions principales à retenir et complètent les fiches de cours. De quoi réviser sa prochaine évaluation ou son prochain examen en toute confiance !

S’abonner

Découvrez le soutien scolaire en ligne avec myMaxicours

Plongez dans l'univers de myMaxicours et découvrez une approche innovante du soutien scolaire en ligne, conçue pour captiver et éduquer les élèves de CP à la terminale. Notre plateforme se distingue par une riche sélection de contenus interactifs et ludiques, élaborés pour stimuler la concentration et la motivation à travers des parcours d'apprentissage adaptés à chaque tranche d'âge. Chez myMaxicours, nous croyons en une éducation où chaque élève trouve sa place, progresse à son rythme et développe sa confiance en soi dans un environnement bienveillant.

Profitez d'un accès direct à nos Profs en ligne pour une assistance personnalisée, ou explorez nos exercices et corrigés pour renforcer vos connaissances. Notre assistance scolaire en ligne est conçue pour vous accompagner à chaque étape de votre parcours éducatif, tandis que nos vidéos et fiches de cours offrent des explications claires et concises sur une multitude de sujets. Avec myMaxicours, avancez sereinement sur le chemin de la réussite scolaire, armé des meilleurs outils et du soutien de professionnels dédiés à votre épanouissement académique.

Fiches de cours les plus recherchées

Physique Chimie

Production de dihydrogène

Physique Chimie

Piles à combustible

Physique Chimie

Les pluies acides

Physique Chimie

L'eau lourde

Physique Chimie

Mers, océans, climat ; traceurs chimiques et isotopiques

Physique Chimie

Érosion - dissolution - concrétion

Physique Chimie

Mesures et incertitudes -terminale

Physique Chimie

Phénomène d'interférences des ondes

Physique Chimie

L'effet Doppler

Physique Chimie

Analyse spectrale