¿Está buscando el mejor software gratuito de voz a texto de Windows? La recomendación pagada más repetida es Dragon Naturally Speaking (DNS). Pero algunos podrían burlarse de pagar dinero por el software. Afortunadamente, hay varios excelentes programas gratuitos como Google Docs Voice Typing (GDVT) y Windows Speech Recognition (WSR).
Conceptos básicos de Dragon NaturallySpeaking 13 Conceptos básicos de Dragon NaturallySpeaking 13 Comprar ahora En Amazon $ 29.84
Tal vez se pregunte cómo se comparan estos dos productos con el DNS, y si el DNS cumple o no con sus necesidades. Para este artículo, identifiqué tres tipos de usuarios: aquellos que necesitan transcripción de voz a texto para escribir novelas, aquellos que necesitan transcripción académica y aquellos que escriben documentos comerciales, como memos. Con este fin, probé tres programas de transcripción de voz (DNS, GDVT y WSR).
Configuración de transcripción de voz
Antes de abordar la prueba, veamos primero la configuración recomendada de hardware y software.
Requisitos de hardware y software
Google Docs Voice Typing requiere el navegador Chrome y un micrófono. Y también necesita una conexión a Internet persistente (que no se menciona en los requisitos). De lo contrario, este es probablemente el método más fácil para comenzar la transcripción del habla.
DNS requiere un procesador hecho en 2001 o posterior, Windows 7 o posterior, y alrededor de 4 GB de almacenamiento gratuito. Su requisito más estricto es 2 GB de RAM. Aquí hay una lista completa de los requisitos de hardware de DNS.
Reconocimiento de voz de Windows Habilite el control de voz y texto configurando el reconocimiento de voz en Windows Habilite el control de voz y voz mediante la configuración del reconocimiento de voz en Windows El reconocimiento de voz sigue siendo más poderoso que Cortana. Conduce voz a texto y control de voz. Este artículo le mostrará lo que el Reconocimiento de voz puede hacer, cómo configurarlo, entrenarlo y usarlo. Leer más, también conocido como Speech Platform Runtime (descargar WSR), no cuesta nada y solo requiere un sistema operativo Windows 7 o posterior.
Consideraciones sobre el micrófono
Uso un micrófono dinámico (el mejor micrófono para podcasts El mejor micrófono de podcast para su dinero en 2017 El mejor micrófono de podcast para su dinero en 2017 Los micrófonos son muy importantes cuando se hace un podcast. Los costos iniciales son bastante bajos: software de grabación, un escritorio o portátil, y por supuesto, un micrófono. ¿Cuál es el mejor micrófono de podcast? Lea más) y un procesador Intel Core i7 relativamente rápido. Si bien se desea un micrófono de alta calidad, no es necesario. Aun así, sus resultados mejorarán con una mejor calidad de sonido y ruido de fondo reducido.
El micrófono de menor precio que recomendaría para la grabación de alta calidad es el Audio-Technica ATR-2100. Sin embargo, la diferencia de precisión entre un micrófono de $ 5 y un dispositivo de $ 200 es bastante mínima.
Audio-Technica ATR2100-USB Cardioide dinámico USB / micrófono XLR Audio-Technica ATR2100-USB cardioide dinámico USB / micrófono XLR Comprar ahora En Amazon $ 74.10
Por otro lado, los requisitos mínimos para Microsoft Speech son prácticamente cualquier computadora remotamente moderna (la mayoría de las computadoras hechas en los últimos diez años) y un micrófono. Si posee una computadora portátil o tableta fabricada en los últimos cinco años, debería tener lo que necesita de forma predeterminada.
Configuración de programas de transcripción de voz
A continuación, le mostramos cómo usar Google Voice Typing:
Aquí le mostramos cómo comenzar con el Reconocimiento de voz de Windows:
Y, finalmente, he aquí cómo comenzar con Dragon Naturally Speaking:
Metodología de prueba
Quiero encontrar la mejor aplicación gratuita de voz a texto basada en Windows. Debido a que diferentes consumidores pueden necesitar un producto diferente, he ideado una prueba simple. Leí tres pasajes diferentes de textos sin derechos de autor: uno de Sobre la tendencia de las especies a las variedades de formas de Charles Darwin. Uno de Call of Cthulu de HP Lovecraft. El último es el discurso del Estado de la Unión 2017 de Jerry Brown. Mi metodología no es perfecta, pero da una impresión de las precisiones de cada conjunto de reconocimiento de voz.
Muestra de escritura de ficción (del Call of Cthulu de HP Lovecraft)
"Lo más misericordioso del mundo, creo, es la incapacidad de la mente humana para correlacionar todos sus contenidos. Vivimos en una plácida isla de la ignorancia en medio de mares negros del infinito, y no fue necesario que viajáramos lejos. Las ciencias, cada una esforzándose en su propia dirección, hasta ahora nos han perjudicado poco; pero algún día el empalme del conocimiento disociado abrirá perspectivas tan aterradoras de la realidad y de nuestra espantosa posición en él, que nos volveremos locos por la revelación o huiremos de la luz mortal a la paz y la seguridad de una nueva era oscura. "
Muestra de escritura empresarial (discurso del Estado de la Unión 2017 de Jerry Brown)
"Es habitual en una ocasión como esta diseñar una agenda específica para el próximo año. Seis veces antes desde esta tribuna, lo he hecho y con cierto detalle. Y, al releer las propuestas expuestas en anteriores discursos del Estado del Estado, me sorprendió ver cuánto hemos logrado juntos ".
Muestra de escritura académica (Charles Darwin sobre la tendencia de las especies a las variedades de formas )
"Ahora bien, cuando se produce una variedad de ese tipo de animal, que tiene un mayor poder o capacidad en cualquier órgano o sentido, tal aumento es totalmente inútil, nunca se llama a la acción e incluso puede existir sin que el animal se dé cuenta de ello. En el animal salvaje, por el contrario, todas sus facultades y poder se ponen en plena acción para las necesidades de la existencia, cualquier aumento se vuelve disponible inmediatamente, se fortalece con el ejercicio y debe incluso modificar ligeramente la comida, los hábitos y el todo economía de la raza ".
3 suites de transcripción de voz probadas
Es sorprendente cómo el reconocimiento de voz gratuito Las mejores aplicaciones para hacer listas para los comandos de voz Las mejores aplicaciones para hacer listas para los comandos de voz Muchas herramientas de productividad gratuitas son compatibles con las listas de voz a texto. Le mostraremos las mejores aplicaciones para hacer listas con reconocimiento de voz y comandos que debe probar. Leer más pruebas realizadas contra software pago. Pero al final del día, la aplicación más precisa es Dragon Naturally Speaking. Sin embargo, ni Google Voice Typing ni Windows Speech Recognition cuestan nada y ofrecen una precisión superior al 90 por ciento. Pero cada uno tiene sus propias fortalezas y debilidades y es posible que prefiera uno sobre el otro.
HP Lovecraft (Prueba de escritura de ficción)
A Lovecraft le encantaba escribir en prosa larga, ininterrumpida y entre paréntesis. Mientras que las tres suites hacen un gran trabajo al transcribir con precisión el texto vocalizado de Lovecraft, DNS sale por delante de sus competidores . Incluye tanto mayúsculas como puntuación (lo cual es completamente loco).
DNS: DNS solo eliminó una sola palabra del texto. En general, obtuvo 107 correctas de 108 palabras. Clavó varias oraciones largas e ininterrumpidas también.
WSR: Windows hizo un muy buen trabajo, pero no sorprendente, de transcribir Lovecraft. Aproximadamente 97 de las 108 palabras correctas. Si bien esto no es suficiente tanto para GDVT como para DNS, sigue siendo bueno para un programa de texto libre que no requiere acceso en línea.
GDVT: No estoy seguro de lo que pasó porque Google seleccionó la transcripción para los otros extractos. GDVT solo logró 103 de 108, dejando caer dos palabras y maltranscribiendo tres. Incluso una vez deletreó "punto y coma" en lugar de insertar la puntuación correcta. También puso en mayúsculas ciertas palabras, convirtiéndolas en sustantivos propios (pero no los penalizaré, ya que es la precisión y no las mayúsculas lo que importa).
Estoy bastante seguro de que si volviera a leer el documento por segunda vez, no tendría ningún error.
Charles Darwin (Prueba de escritura científica o académica)
Darwin escribe, como Lovecraft, oraciones largas cargadas con información entre paréntesis. Sin embargo, su uso del lenguaje es muy claro y casi no usa ninguna jerga, que difiere de la casi incomprensible escritura científica actual.
DNS: el texto de Darwin sale casi perfecto en Dragon Naturally Speaking. DNS escribió mal una sola palabra ("dentro") y de otra manera completó la prueba con 87 palabras directamente de 88.
WSR: Microsoft hizo un gran trabajo, combinando 82 de 88 palabras. Sin embargo, cometió algunos errores relativamente extraños, como la ortografía de "sentido" como "centavos".
GDVT: Google hizo un gran trabajo en el extracto de Darwin. GDVT solo cometió un error en dos palabras, de un total de 88. En general, para una aplicación gratuita, no puede encontrar una alternativa más precisa.
Jerry Brown Estado del Estado Dirección 2016 (Prueba de Escritura Empresarial)
El discurso de Brown no usa muchas oraciones o vocabulario complicados (aparte de la palabra "rostrum"). En general, la mayoría de los servicios de transcripción tuvieron un desempeño sorprendente. Más o menos, si necesita un servicio que maneje oraciones simples y vocabulario limitado, cualquiera de estos funciona bien.
DNS: DNS anotó la dirección de estado del estado de Brown. Mientras que cayó un período, de lo contrario, consiguió cada palabra perfectamente. Tenga en cuenta, sin embargo, que los discursos políticos a menudo carecen del tipo de lenguaje complejo que puede ver en la ficción o la academia. Una nota o discurso es directo y al grano. Eso es algo que un cliente de reconocimiento de voz no debería tener ningún problema con el manejo.
WSR: Windows Speech Recognition hizo un gran trabajo, aunque no tan bueno como DNS o Google, al transcribir el discurso de Brown. Marcó 55 de 58 palabras. Incluso reconoció la palabra "tribuna", que ni siquiera sabía que era una palabra, ni sabía cómo pronunciarla. Aparentemente, o lo entendí bien o la tecnología de reconocimiento de voz incluso puede captar malas palabras.
GDVT: el software de transcripción de Google enarboló completamente la transcripción, con un 100% de precisión. Incluso logró capitalizar correctamente "Estado del Estado", sin necesidad de la intervención del usuario. Usó extrañamente el número, en lugar de la ortografía, para la palabra "seis". Lo que resultó en un error de estilo.
¿Los servicios de transcripción gratuitos valen la pena?
Existe una diferencia entre Dragon Naturally Speaking, Google Voice Typing y Microsoft Speech Recognition de Windows. Dragon es más preciso que sus competidores. Sin embargo, el mejor programa gratuito en términos de precisión es, por un margen estrecho, la escritura de voz de Google. Si bien tanto los servicios de transcripción de Microsoft como los de Google se comparan de manera menos favorable que el DNS, no cuestan $ 30.
Al contrastar los dos servicios gratuitos entre sí, Google ofrece una mejor precisión de reconocimiento de voz, puntuación y caso, requiere una conexión a Internet. Google también captura mucho que no tiene la intención, como la puntuación y las mayúsculas.
Sin embargo, si desea un programa de transcripción gratuito para el cual no necesita conexión a Internet, el Reconocimiento de voz de Windows se ajusta a la ley ¿Windows puede hacer esto? 15 características sorprendentes que no tenías ni idea sobre Windows pueden hacer esto? 15 características sorprendentes que no tenías ni idea acerca de Windows puede hacer mucho más de lo que piensas. Incluso si eres un veterano usuario de Windows, apuesto a que descubrirás una función de nuestra lista que nunca supiste que existía. Lee mas . De ninguna manera es malo y ofrece el 90 por ciento de lo que ofrece Dragon Naturally Speaking. Dale una oportunidad si no lo has hecho ya.
¿Cuál es tu servicio de transcripción favorito? ¡Por favor, háganos saber en los comentarios!