Tecnolog�a y soluciones


FAQ

top

P. �Qu� se entiende por Reconocimiento "continuo" y "discreto" del habla?

R. El proceso de hablar o dictar continuamente o de corrido a un ordenador, sin hacer pausas entre las palabras y como si se tratara de una conversaci�n, con el fin de conseguir la inmediata ejecuci�n de determinados comandos del sistema operativo o del programa que se utilice o bien una transcripci�n textual del dictado con gran precisi�n. La meta consiste en sustituir por completo al teclado y al rat�n, principales "interfaces" del ordenador hasta ahora, incrementando al m�ximo el confort y el rendimiento profesional del usuario. De hecho, varios estudios han confirmado que cualquier persona puede generar texto dictando a un ordenador a una velocidad diecis�is veces m�s r�pido que la mejor mecan�grafa del mundo. En cambio, el Reconocimiento "discreto" del habla requiere que el usuario se detenga brevemente tras pronunciar cada una de las palabras que emite, lo cual exige un cierto grado de pr�ctica y disciplina mental. El Reconocimiento continuo exige bastante m�s capacidad de procesamiento del ordenador y es mucho m�s gratificante para el usuario. Las aplicaciones actuales para el Reconocimiento continuo del habla son "Speaker-dependant" o "Dependientes del usuario". Por tanto, requieren que cada cual "entrene" a la aplicaci�n para que reconozca su propia voz mediante la pronunciaci�n de un cierto n�mero de frases y palabras modelo. Este entrenamiento requiere de 15 a 20 minutos por t�rmino medio, aunque los nuevos programas que han sido optimizados para el Pentium III y IV --como por ejemplo Dragon NaturallySpeaking Professional--, s�lo necesitan de 3 a 5 minutos.

top

P. �Cu�ndo y c�mo apareci� esta nueva tecnolog�a en el mercado inform�tico?

P. El Reconocimiento continuo del habla ha constituido siempre una meta a largo plazo de la industria inform�tica. Quiz�s antes de lo que se esperaba, con la introducci�n de ordenadores Pentium y avances sustanciales en el procesamiento de la se�al ac�stica y del lenguaje humano, el Reconocimiento continuo del habla se ha convertido en realidad. En junio de 1997, Dragon Systems introdujo el primer programa comercial y gen�rico para el Reconocimiento continuo del habla en un ordenador, bajo la marca registrada Dragon NaturallySpeaking. No pas� mucho tiempo hasta que IBM Corp. secundase la iniciativa con su ViaVoice. Otros dos fabricantes, Lernout & Hauspie Speech Products (VoiceXpress) y Philips Electronics (FreeSpeech), han penetrado este nuevo mercado desde entonces, aunque ninguno de los dos productos existe actualmente.

top

P. �Qui�n puede beneficiarse del Reconocimiento continuo del habla? �Es adecuado para mis necesidades profesionales?...

A. Los colectivos m�s beneficiados por estas nuevas aplicaciones son:

Vendedores profesionales y comerciales ambulantes Cualquiera que tome notas durante o despu�s de m�ltiples reuniones y curse pedidos de clientes con frecuencia, encontrar� que sus ideas pueden plasmarse mucho m�s r�pida y eficazmente con el Reconocimiento continuo del habla, incluso cuando se encuentren fuera de la oficina.

Ejecutivos y otras personas que no saben o no desean mecanografiar Bastantes ejecutivos no disponen por m�s tiempo de un equipo administrativo de apoyo. Muchos de ellos no aprendieron nunca a mecanografiar o se sienten inc�modos ante el teclado. Estas aplicaciones permiten ahora dictar texto al ordenador con gran rapidez, precisi�n y una ortograf�a siempre impecable.

Peque�as empresas y tele-trabajadores desde el hogar Cualquiera que no disponga de una secretaria encontrar� que resulta mucho m�s f�cil generar texto escrito en un gran n�mero de aplicaciones inform�ticas, con el consiguiente ahorro de tiempo e incremento de productividad, mediante el Reconocimiento del habla.

M�dicos y juristas Ambos necesitan redactar un gran n�mero de textos en el ejercicio cotidiano de la profesi�n. Algunos fabricantes ofrecen versiones especiales de sus productos, como por ejemplo, Dragon NaturallySpeaking Medical Suite y Dragon NaturallySpeaking Legal Suite, que proporcionan vocabularios espec�ficos y otras ventajas a dichos profesionales, aunque s�lo en ingl�s americano y alem�n por el momento. Versiones especiales en otros idiomas est�n en desarrollo o se proporcionan por terceros.

Escritores y traductores Quienes crean una cantidad significativa de textos pueden dictar a un ordenador, en lugar de mecanografiar, para contemplar c�mo sus ideas fluyen r�pidamente en la pantalla. Incentiva la creatividad y resulta bastante m�s divertido...

Ciegos, minusv�lidos y otros usuarios con riesgo de "S�ndrome carpiano" Dado que las versiones profesionales de la mayor�a de estos programas incorporan una funci�n de reproducci�n o "Play Back", los ciegos pueden escuchar el texto que dictan al ordenador mientras la aplicaci�n realiza su reconocimiento. Adem�s, cualquiera que dedique un tiempo considerable a mecanografiar documentos encontrar� que el Reconocimiento del habla puede reducir el riesgo de "S�ndrome carpiano" derivado del uso repetitivo del teclado y el rat�n.

Por cierto, que la Directiva Europea 2000/78/CE, obligar� a empresas e instituciones p�blicas a garantizar la estricta "igualdad de tratamiento" a cuantos de sus trabajadores sufran de estas dolencias a finales del 2003.

top

P. �Existe alguna aplicaci�n de Reconocimiento continuo del habla para el sistema operativo Macintosh?

R. Tanto Dragon Systems como IBM Corp. anunciaron el lanzamiento de versiones especiales de sus respectivos programas, Dragon NaturallySpeaking y ViaVoice, para el iMac a finales de 1999. Sin embargo, s�lo algunas versiones de ViaVoice para el MacIntosh est�n disponible actualmente. No obstante, con la última generación de ordenadores Mac-Intel y las aplicaciones Parallels o Bootemps, es posible correr Windows XP y Dragon NaturallySpeaking, aunque no soportamos oficialmente este entorno de trabajo.

top

P. �Cu�l es el mejor programa para el Reconocimiento continuo del habla en un ordenador?

A. De acuerdo con uno de los reportajes m�s completos y autorizados publicados hasta la fecha ("Speech Recognition: Finding Its Voice", PC Magazine):

""De los cuatro existentes, NaturallySpeaking proporciona consistentemente la m�xima precisi�n en el reconocimiento. Voice Xpress causa impresi�n en su estreno con una buena integraci�n en Microsoft Word y un segundo lugar en cuanto a precisi�n se refiere. ViaVoice brinda posibilidades de comando y control vocal sin paralelo, aunque su precisi�n deja que desear. Finalmente, FreeSpeech cuesta m�s barato que la competencia, pero tambi�n ofrece bastante menos"." Sin embargo, observe que precisi�n y velocidad en el reconocimiento no son los �nicos criterios a tener en cuenta. Dado que la mayor�a de las versiones profesionales de estos programas ofrecen un rendimiento cada vez m�s parecido, un "interface" sencillo de utilizar, que facilite al m�ximo la correcci�n y edici�n del texto que se dicta, constituye la mayor diferencia o ventaja para un usuario profesional.

top

P. �Cu�l es la precisi�n y velocidad del Reconocimiento?

R. Evaluadores independientes y muchos usuarios consiguen dictar hasta 160 palabras por minuto con una precisi�n del 95-98%, es decir con tan s�lo un 2-5% de errores de transcripci�n, utilizando las versiones profesionales de estos productos para su trabajo cotidiano. Por ejemplo, Dragon NaturallySpeaking "consigui� una precisi�n de hasta el 99%" en las pruebas objetivas realizadas por PC Magazine ("Speech Recognition: Finding Its Voice"). Aunque tan impresionantes resultados impliquen a veces unas ciertas dosis de entrenamiento del usuario y configuraci�n a medida del programa (desarrollo de diccionarios especializados que faciliten el proceso del reconocimiento e incluso macro-comandos vocales para la inserci�n de textos repetitivos complejos y otras funciones), se pueden conseguir m�s de 100 palabras por minuto con una precisi�n del 90-92% sin preparativos de ning�n tipo y tras el entrenamiento inicial de 3 a 5 minutos, con las versiones profesionales de estos productos. Tal y como ocurr�a con el Reconocimiento �ptico de Caracteres (OCR) hace unos pocos a�os, tasas inferiores de precisi�n no son realmente admisibles en tareas profesionales, puesto que el usuario tendr�a que invertir la mayor parte del tiempo que ahorra dictando al ordenador, corrigiendo errores de transcripci�n. Por tal raz�n, SpeechWare s�lo trabaja con las mejores versiones, normalmente las profesionales, de estos productos.

top

P. �Para qu� idiomas existen actualmente aplicaciones de Reconocimiento continuo del habla? �Existe alguna versi�n multiling�e para los pol�glotas?

A. Hay paquetes de "software" disponibles para:

  • alem�n
  • espa�ol
  • franc�s
  • chino mandar�n
  • holand�s
  • ingl�s (americano, brit�nico, hind� y del Sudeste asi�tico)
  • y el italiano.

Otros idiomas, incluyendo el japon�s, est�n en desarrollo y se lanzar�n pr�ximamente. Por otra parte, las versiones profesionales de estos productos soportan ya el multiling�ismo. Los usuarios pol�glotas abren o cierran los correspondientes m�dulos ling��sticos de una misma aplicaci�n, seg�n cambien de idioma. Por cierto que, algunas aplicaciones multiling�es como por ejemplo Dragon NaturallySpeaking, incluyen un par de m�dulos ling��sticos, lo que reduce significativamente el coste total de adquisici�n.

top

P. �Es f�cil dictar a un ordenador e importar eventualmente el texto transcrito en otras aplicaciones?

R. Los usuarios pueden dictar directamente en la ventana del procesador de textos simplificado que proporcionan estas aplicaciones, o bien en cualquier otro programa de Windows, como por ejemplo los principales tratamientos de texto del mercado (Microsoft Word, WordPerfect y Lotus WordPro), o programas de correo electr�nico. La primera soluci�n es m�s efectiva, especialmente en ordenadores lentos, porque dichos procesadores est�n optimizados para conseguir el m�ximo rendimiento. Cuando el usuario procede de esta forma, puede exportar el texto transcrito a cualquier otra aplicaci�n con el m�todo cl�sico "cortar/pegar" de Windows. Asimismo, puede guardar su archivo en formatos Ascii, RTF, Documento de Word, etc. compatibles con cualquiera de los antedichos tratamientos de texto. NaturallySpeaking, ViaVoice y VoiceXpress soportan tambi�n la denominada "modeless operation", es decir, permiten al usuario combinar indistintamente el dictado con otras tareas (correcci�n y edici�n del texto, ejecuci�n de comandos de la propia aplicaci�n o de Windows, uso del teclado en todo momento, etc.) de forma espont�nea y natural. Los tres reconocen tambi�n comandos de Microsoft Word en lenguaje "coloquial", es decir, sin obligar al usuario a recordar el nombre exacto de los mismos.

top

P. Es posible dictar y corregir o editar la transcripci�n con posterioridad, o es preciso acometer todas estas tareas sucesivamente durante una misma sesi�n? �C�mo?.

R. Todas las versiones profesionales de estos programas permiten dictar y corregir o editar el texto transcrito con posterioridad. Adem�s, algunas de ellas incluyen una funci�n muy �til: la reproducci�n o "Play back" de la voz del usuario cuando se subrayan las correspondientes palabras o frases y se emite el comando adecuado. Esto permite incluso encargar a un asistente la correcci�n y la edici�n del texto dictado m�s tarde, y actualizar los archivos del Perfil del Usuario, una tarea imprescindible para mejorar la precisi�n del reconocimiento de quien genera el fichero, al corregir los errores de transcripci�n generados durante el reconocimiento. �Much�simos ejecutivos est�n actualmente inici�ndose en el Reconocimiento vocal, gracias a esta impresionante funci�n!...

top

P. �Es posible dictar en un ambiente ruidoso con buenos resultados?

R. R. Tras la reciente introducci�n de micr�fonos con dispositivos de supresi�n del ruido ambiental "Active Noise Canceling" muy eficaces, es posible dictar pr�cticamente en cualquier lugar con excelentes resultados: una oficina ruidosa, una estaci�n de tren, un avi�n....

top

P. �Pueden varios usuarios utilizar la misma aplicaci�n?

R. S�, varios compa�eros de oficina pueden compartir el mismo programa en diferentes momentos del d�a, con tal de que instalen la versi�n profesional del mismo en un ordenador de uso conjunto y cada uno de ellos cree su respectivo Perfil de Usuario, entrenando al programa a reconocer su propia voz durante unos minutos.

top

P. �Pueden utilizarse estas aplicaciones en red?

R. Algunos sistemas profesionales, como por ejemplo Dragon NaturallySpeaking Enterprise Edition sólo disponible en Inglés de momento, ofrecen una versi�n especial que permite su uso simult�neo por m�ltiples usuarios conectados en red. Cada uno de ellos guarda los archivos de su Perfil de voz en su propio ordenador; mientras que el motor del Reconocimiento y otros archivos del programa se comparten en el servidor. Esta soluci�n es ideal para grandes organizaciones, al ser mucho m�s eficaz y disminuir considerablemente los costes de adquisici�n y mantenimiento de la aplicaci�n.


P. Necesito movilidad por encima de todo: �Puedo utilizar un ordenador "laptop", "notebook", "sub-notebook", o incluso una grabadora digital con estas aplicaciones?

P. Todos los programas profesionales para el Reconocimiento continuo del habla pueden utilizarse con �xito en un buen "laptop", "notebook", "sub-notebook", funcionando a base de bater�as. Sin embargo, un grave problema gen�rico de estos equipos es que no siempre cumplen con las estrictas especificaciones de sonido de estas aplicaciones, al generar mucho m�s "ruido interno" que los ordenadores de sobremesa debido al alto nivel de integraci�n f�sica de sus componentes. Sin embargo, SpeechWare le recomienda varios modelos de excepcional calidad ac�stica, que funcionan impecablemente, en la secci�n Computers de esta p�gina web. Si ya tiene un "notebook" con baja calidad de sonido, puede utilizar un micr�fono y tarjeta de sonido integrados con conexi�n USB, optimizados para el Reconocimiento del habla. Este singular producto ofrece tres ventajas claves: - uso del interface USB digital, que est� exento de "ruido interno" o interferencias - perfecta compatibilidad entre el casco, micr�fono y tarjeta de sonido integrados, lo cual garantiza la mejor relaci�n se�al/ruido posible - m�xima movilidad para el usuario, que puede ahora cambiar f�cilmente de ordenador sin necesidad de "re-entrenar" o adaptar de nuevo su voz al programa, dado que introduce siempre una se�al ac�stica de la misma calidad al transportar consigo tanto el micr�fono como la tarjeta de sonido. Respecto a las grabadoras digitales, existen un cierto n�mero de modelos en el mercado fabricados por Olympus, Sony, Norcom, etc. que pueden utilizarse eventualmente con las versiones profesionales de estos programas, como puede consultar en la secci�n "Hand-held Recorders" de esta p�gina web. Estas proporcionan la transcripci�n "en diferido" o con posterioridad de los archivos grabados al conectarla pr�cticamente a cualquie rordenador, incluso un antiguo Pentium 266MHz MMX. La tasa de reconocimiento es muy elevada (hasta el 96%), especialmente cuando se utilizan con un micr�fono profesional para el Reconocimiento vocal conectado al puerto Mic-In.

top