Technologie et Solutions


FAQ

Q. Qu'entend-on par reconnaissance vocale "Continue" et "Discrète"?

A. La reconnaissance vocale "continue" consiste à parler ou à dicter de manière continue ou ininterrompue à un PC, sans pause entre chaque mot, comme s'il s'agissait d'une conversation, pour obtenir l'exécution immédiate de commandes déterminées du système d'exploitation ou programme utilisé ou bien une retranscription textuelle de la dictée avec un minimum d'erreurs. L'objectif est de remplacer totalement le clavier et la souris, c'est-à-dire les principales "interfaces" de l'ordinateur et d'augmenter ainsi au maximum le confort et le rendement professionnel de l'utilisateur. En réalité, plusieurs études ont confirmé que l'on peut générer un texte en le dictant à un PC seize fois plus rapidement que ne le ferait la meilleure dactylo du monde !

En revanche, la reconnaissance vocale "discrète" exige de l'utilisateur qu'il prenne de légères pauses après avoir prononcé chaque mot, ce qui demande de la pratique et de la discipline. La reconnaissance continue doit se faire avec un ordinateur qui a une plus grande capacité de traitement. Cette dernière est en outre beaucoup plus gratifiante pour l'utilisateur. Les applications actuelles pour la reconnaissance vocale continue sont "Speaker-dependent" ou "dépendantes de l'utilisateur". C'est pourquoi, l'utilisateur doit les "entraîner" à reconnaître sa propre voix en prononçant un certain nombre de phrases et de mots modèles. Cet entraînement dure en moyenne de 15 à 20 minutes, bien qu'avec les nouveaux programmes qui ont été optimisés pour le Pentium IV et le Core Duo -- comme par exemple Dragon NaturallySpeaking Professional -- cet entraînement ne dure que 3 à 5 minutes!

 

top

Q. Quand et comment cette nouvelle technologie est-elle apparue sur le marché de l'informatique?

A. La reconnaissance vocale continue a toujours été un objectif à long terme du secteur informatique. Avec l'arrivée des ordinateurs Pentium et les progrès substantiels effectués dans le traitement des signes acoustiques et du langage humain, cet objectif est devenu réalité plus vite que prévu. En juin 1997, Dragon Systems lançait son premier programme commercial et générique pour la reconnaissance vocale continue sur PC, sous la marque déposée Dragon NaturallySpeaking. Peu après, IBM Corp. suivait cette initiative avec son ViaVoice. Deux autres fabriquants, Lernout & Hauspie Speech Products (VoiceXpress) et Philips Electronics (FreeSpeech), ont été introduits sur ce nouveau marché depuis lors même si les deux produits ne sont plus disponibles.

top

Q. Qui peut tirer des avantages de la reconnaissance vocale continue? Est-elle adaptée à mes besoins professionnels?

A. Les personnes pour qui ces nouvelles applications sont les plus intéressantes sont:

Les vendeurs professionnels et les hommes d'affaires qui voyagent

Toute personne, qui doit prendre des notes pendant ou après de nombreuses réunions et procéder à l'envoi de commandes fréquentes, pourra organiser ses idées bien plus facilement grâce à la reconnaissance vocale continue, même lorsqu'il n'est pas sur son lieu de travail

Les cadres ou autres personnes qui ne savent pas ou ne veulent pas taper à l'ordinateur

De nombreux cadres ne disposent pas d'une équipe administrative pour les aider. Beaucoup n'ont jamais appris à taper ou se sentent mal à l'aise face à un clavier. Ces applications permettent désormais de dicter un texte à l'ordinateur rapidement, avec précision et sans aucune faute d'orthographe!

Les petites entreprises et les personnes qui font du télé-travail depuis leur domicile

Toute personne qui n'a pas de secrétaire à sa disposition pourra s'aider de la reconnaissance vocale continue pour produire plus rapidement un texte écrit dans un grand nombre d'applications informatiques, avec la gain de temps et l'augmentation de productivité que cela suppose

Les aveugles, les personnes handicapées et les utilisateurs qui risquent un "Syndrome du canal carpien" (ou toute autre RSI)

Etant donné que les versions professionnelles de la majorité de ces programmes comprennent une fonction de reproduction ou "Play Back", les aveugles peuvent écouter le texte qu'ils dictent au PC pendant que l'application effectue la reconnaissance. De plus, pour ceux qui passent un temps considérable à dactylographier des documents, la reconnaissance vocale peut diminuer le risque de "syndrome du canal carpien" dû à l'utilisation intensive du clavier et de la souris.

Veuillez noter que la Directive Europénne 2000/78/CE, oblige aux entreprises et institutions publiques à garantir la pleine " égalité de traitement" à leurs travailleurs qui souffrent de ces maladies, depuis 2003.

top

Q. Existe-t-il une application de reconnaissance vocale continue pour le système d'exploitation Macintosh?

A. Dragon Systems et IBM Corp. ont toutes deux annoncé le lancement, fin 1999, de versions spéciales pour iMac de leurs programmes respectifs, Dragon NaturallySpeaking et ViaVoice. Cependant, seulement ViaVoice est actuellement disponible pour le Macintosh.

top

Q. Quel est le meilleur programme sur un PC pour la reconnaissance vocale continue?

A. D'après l'une des enquêtes officielles les plus complètes publiées jusqu'à aujourd'hui ("Speech Recognition: Finding Its Voice", PC Magazine):

"Sur les quatre produits existants, NaturallySpeaking est sans nul doute le plus précis en matière de reconnaissance. VoiceXpress impressionne l'utilisateur dans un premier temps par sa bonne intégration dans Microsoft Word et ensuite par sa précision. ViaVoice offre des possibilités de commande et de contrôle vocal inégalées, même si sa précision laisse à désirer. Enfin, FreeSpeech est moins cher que ses produits concurrents mais offre aussi beaucoup moins de possibilités".

Il est cependant nécessaire de souligner que la précision et la rapidité ne sont pas les seuls critères à prendre en compte. Étant donné que la majorité des versions professionnelles de ces programmes offrent un rendement similaire, la principale différence ou le plus grand avantage pour un utilisateur professionnel est de disposer d'un "interface" simple à utiliser, qui facilite au maximum la correction et la mise en forme du texte dicté.

top


Q. Quelle est la précision et la rapidité de la reconnaissance?

A. Des enquêteurs indépendants et de nombreux utilisateurs réussissent à dicter jusqu'à 160 mots par minute avec une précision de 95 à 98%, c'est-à-dire avec seulement 2 à 5% d'erreurs de retranscription, en utilisant les versions professionnelles de ces produits pour leur travail quotidien. Par exemple, Dragon NaturallySpeaking "a atteint une précision de près de 99%" lors des essais objectifs effectués par PC Magazine ("Speech Recognition: Finding Its Voice"). Même si des résultats aussi impressionnants nécessitent quelquefois un certain entraînement de la part de l'utilisateur et une configuration sur mesure du programme -- création de dictionnaires spécialisés qui facilitent le processus de reconnaissance et macro-commandes vocales pour l'insertion de textes répétitifs complexes et autres fonctions --, on peut arriver à plus de 100 mots par minute avec une précision de 90 à 92% sans aucune préparation, si ce n'est l'entraînement initial de 3 à 5 minutes, avec les versions professionnelles de ces produits.

top

Q. Pour quelles langues les applications de reconnaissance vocale continue existent-elles? Existe-t-il une version multilingue de ces applications pour les polyglottes?

A. Les applications sont disponibles pour:

  • l'allemand,
  • l'anglais (américain, britannique, hindou et du sud-est asiatique),
  • le chinois mandarin,
  • l'espagnol,
  • le français,
  • l'italien,
  • le suedois,
  • et le néerlandais.

D'autres langues, sont en cours d'élaboration et seront disponibles bientôt... De plus, la plupart des versions professionnelles supportent déjà le multilinguisme. Les utilisateurs polyglottes ouvrent ou ferment les différents modules linguistiques d'un même programme en vue d'en changer, chaque fois qu'ils travaillent dans une langue différente. Veuillez noter que certaines applications multilingues, comme par exemple Dragon NaturallySpeaking, sont offertes avec plusieurs modules linguistiques. Pour plus de renseignements, allez dans la rubrique "Software" de notre site web. Ceci réduit considérablement les coûts d'acquisition de l'application!

top

Q. Est-il facile de dicter à un ordinateur et d'importer le cas échéant le texte retranscrit dans d'autres applications?

A. Les utilisateurs peuvent dicter directement dans la fenêtre du traitement de textes simplifié fourni par ces applications, ou dans tout autre programme de Windows, comme par exemple les principaux traitements de textes disponibles sur le marché --Microsoft Word, WordPerfect et Lotus WordPro--, ou les programmes de courrier électronique. La première de ces solutions est la plus efficace, car ces traitements de textes ont été optimalisés pour offrir le meilleur rendement possible. Si l'utilisateur décide de procéder de cette façon, il pourra exporter le texte retranscrit dans toutes les autres applications de son choix grâce à la méthode classique "couper/coller" de Windows. De même, il pourra sauvegarder son document en format ASCII, RTF, Doc, etc. qui sont compatibles avec tous les traitements de texte précités. NaturallySpeaking, ViaVoice et VoiceXpress admettent également ce que l'on appelle la "modeless operation", c'est-à-dire qu'elles permettent à l'utilisateur de combiner indistinctement la dictée avec d'autres tâches --correction et mise en forme du texte, exécution de commandes de l'application elle-même ou de Windows, utilisation du clavier à tout moment, etc.-- de façon spontanée et naturelle. Ces trois produits reconnaissent également les commandes de Microsoft Word en langage "naturel" ou quasi familier, sans obliger l'utilisateur à se souvenir du nom exact de ces dernières.

top

Q. Est-il possible de dicter, de corriger ou de mettre en forme ultérieurement, ou faut-il nécessairement effectuer toutes ces tâches successivement lors d'une même session?

A. Toutes les versions professionnelles de ces programmes permettent de dicter, de corriger ou de mettre en forme le texte ultérieurement. De plus, certaines d'entre elles comportent une fonction très utile: la reproduction ou le "Play Back" de la voix de l'utilisateur lorsque l'on souligne les mots ou phrases correspondants et que l'on formule la commande "ad hoc". Avec notreTranscription Aid pour Dragon NaturallySpeaking vous pouvez confier à un assistant la correction et la mise en forme du texte dicté plus tard. Au moment de corriger les erreurs de retranscription commises durant la reconnaissance, celui-ci pourra même remettre à jour les fichiers du Profil de l'utilisateur, tâche essentielle si l'on souhaite améliorer la précision de la reconnaissance!

top

Q. Est-il possible de dicter dans un environnement bruyant tout en obtenant de bons résultats?

A. Depuis la récente introduction sur le marché de microphones munis de dispositifs actifs de suppression du bruit ambiant --"Active Noise Cancelling"--, qui se révèlent très efficaces, il est possible de dicter pratiquement partout tout en obtenant d'excellents résultats: un bureau bruyant, une gare ou même un avion...

top

Q. Plusieurs utilisateurs peuvent-ils utiliser la même application?

A. Oui, plusieurs collègues de bureau peuvent partager le même programme à différents moments de la journée, pour autant qu'ils installent la version professionnelle du programme sur un PC d'utilisation commune et que chacun d'entre eux crée son Profil d'utilisateur respectif, en entraînant le programme à reconnaître sa voix durant quelques minutes.

top

Q. Peut-on utiliser ces applications sur un réseau?

A. Certains systèmes professionnels, comme le Dragon NaturallySpeaking permettent l'utilisation simultanée de ces aplications par de multiples utilisateurs connectés en réseau. Chacun d'entre eux conserve les archives de son profil de voix dans son propre ordinateur tandis que le moteur de la reconnaissance et les autres archives du programme se partagent sur le serveur. Cette méthode est idéale pour les grandes organisations, car elle est beaucoup plus efficace et diminue considérablement les coûts d'acquisition et d'entretien de l'application.

top

Q. La mobilité est essentielle pour moi: puis-je utiliser un "laptop", un "notebook", un "sub-notebook", ou même un enregistreur manuel avec ces applications?

A. Tous les programmes pour la reconnaissance vocale continue peuvent être utilisés avec succès sur un bon "laptop", "notebook" ou "sub-notebook", alimenté par une batterie. Néanmoins, un problème commun aux "notebooks" est qu'ils ne répondent pas aux normes strictes de son de ces applications. Ils génèrent en effet beaucoup plus de "bruit interne" que les postes fixes étant donné le niveau d'intégration physique élevé de leurs composantes. Cependant, Speechware peut vous recommander plusieurs modèles d'une qualité exceptionnelle et qui fonctionnent à la perfection. Si vous avez déjà un "notebook" dont le son est de basse qualité, vous pouvez utiliser un microphone et une carte-son intégrés avec connexion USB, optimalisés pour la reconnaissance vocale. Ce produit innovateur offre trois avantages clés:

  • l'utilisation de l'interface digital USB, qui est exempt de bruits internes et d'interférences;
  • la compatibilité parfaite entre le casque, le microphone et la carte-son intégrés, ce qui garantit le meilleur rapport signal/bruit possible;
  • la mobilité pour l'utilisateur, qui peut désormais changer facilement d'ordinateur sans avoir besoin de "réentraîner" ou d'adapter à nouveau sa voix au programme, étant donné qu'il introduit un signal de qualité toujours égal en utilisant toujours le même micro et la même carte-son.

En ce qui concerne les enregistreurs manuels, il existe un certain nombre de modèles sur le marché --fabriqués par Olympus, Sony, Norcom, etc.-- qui peuvent éventuellement s'utiliser avec les versions professionnelles de ces programmes comme vous pouvez lire dans la section "Hand-held digital recorders" de ce web. Ces machines sont optimisées pour offrir une transcription "en différé" ou postérieure, lorsqu'on les connecte à pratiquement n'importe quel PC. De plus, le taux de reconnaissance est assez élevé --jusqu'à 96%-- si vous utilisez un micro professionnel connecté à son port Mic-In.

Finalement, avec Transcription Aid pour Dragon NaturallySpeaking, vous pouvez donc obtenir les mêmes résultats qu'avec un dictaphone numérique mais en utilisant n'importe quel assistant numérique personnel (PDA) --Pocket PC, PalmPilot ou Clié -- et même un Smartphone Windows Mobile !

top