El reconocimiento de voz solía ser horriblemente impreciso. Solo funcionó para un puñado de personas un puñado de veces. Pero ahora en realidad es bastante bueno, gracias a los esfuerzos combinados de Nuance, Microsoft, Apple y Google, que han invertido innumerables recursos para mejorarlo.
De todas esas compañías, pocas han igualado el compromiso con el reconocimiento de voz de Google, que lo ha convertido en un eje fundamental de su estrategia de servicios y móviles.
Una de las incursiones más tempranas de Google fue la de corta duración GOOG-411 (o Google Voice Local Search). Se lanzó en 2008 y permitió a las personas buscar números de teléfono de la empresa utilizando su voz. La tecnología de reconocimiento de voz también ha sido una pieza central de Android, y con el lanzamiento de JellyBean ¿Cuáles son las mayores mejoras en Android 4.2 y 4.3? ¿Cuáles son las mayores mejoras en Android 4.2 y 4.3? Si estás atrapado en 4.0 Ice Cream Sandwich o 4.1 Jelly Bean, ¿deberías actualizar? Leer más, finalmente estuvo disponible sin conexión.
A principios de esta semana, Google finalmente introdujo el reconocimiento de voz en Google Docs.
Los usuarios pueden, literalmente, dictar sus documentos (al igual que yo estoy haciendo con este artículo) sin la necesidad de instalar ningún software adicional o complementos. Es un salto significativo para el conjunto de aplicaciones de oficina en línea, pero ¿es bueno?
Empezando
Antes de comenzar a profundizar en sus características, quiero referirme a cómo obtiene el dictado por voz de Google. Si tienes una cuenta de Google, ya tienes esto. Simplemente abra Google Docs y abra un documento nuevo o existente. Luego, aparecerá una ventana que le preguntará si desea probar el dictado de voz. Haga clic en Pruébelo .
A continuación, debe otorgar permiso a Google Docs para usar su micrófono. Solo se trata de hacer clic en Permitir a una ventana emergente.
Luego, debe seleccionar el idioma que desea usar con Google Voice Typing. La gama de idiomas y dialectos en oferta van desde el inglés y el español hasta el afrikaans y el árabe.
Luego, simplemente haga clic en el ícono del micrófono y comience a hablar.
¿Qué tan preciso es?
Uno de los mayores obstáculos para el reconocimiento de voz que golpea la corriente principal es que a menudo no es lo suficientemente preciso . Solía ser un hecho que si ves usar el reconocimiento de voz, tendrás que pasar unas horas editando y corrigiendo tu texto. Entonces, ¿cómo le va a la oferta de Google a este respecto?
Muy favorablemente, en realidad . En su mayor parte, Google Voice Typing entendió lo que dije, aunque tengo un acento regional en inglés ( hablaremos de acentos más adelante ).
Me impresionó especialmente la forma en que el reconocimiento de voz de Google manejó el ruido de fondo. Mientras escribía este artículo, un Yorkshire Terrier ladraba en mi sala de estar y mi ventana estaba parcialmente abierta. Vivo en una calle concurrida donde los autos pasan constantemente. Pero a pesar de eso, Google pudo filtrar eso y enfocarse en lo que estaba diciendo.
El mayor problema fue Google Voice Typing a menudo luchó con la puntuación. Yo diría "coma", "punto" y "punto final", e interpretaría eso como que quiero escribir "coma", "punto" y "punto final". Esto fue frustrante por dos razones.
En primer lugar, porque me provocaría, usando primero la puntuación correcta, antes de volver inmediatamente a la versión explicada de la palabra. No había forma de detener esto, y tendría que editar manualmente el documento para solucionarlo.
Pero, tal vez peor, no pude evitar que sucediera. No hay un diccionario donde puedas anular la ortografía. Simplemente sucede, y tienes que lidiar con eso.
No quiero subestimar cuán frustrante es esto. Es realmente molesto . Pero también es algo que estoy seguro se mejorará a medida que más y más personas usen esta característica, y mientras Google compromete más recursos para mejorar su reconocimiento de voz.
Además de esa molestia particular, estaba bastante satisfecho con la precisión del reconocimiento de voz de Google.
Cómo maneja los acentos
Me sorprendió la cantidad de idiomas y dialectos compatibles con Google Voice Typing. Solo en inglés, admite los dialectos de Nueva Zelanda, Australia, India, Sudáfrica, Estados Unidos y Gran Bretaña, por nombrar solo algunos. El problema es que no hay realmente un acento estadounidense, al igual que no hay un acento británico. Por el contrario, hay una gama de acentos y dialectos que difieren de un lugar a otro.
Es una perogrullada que el Reino Unido tiene un acento para cada código postal. El equipo MakeUseOf cuenta con una gama de acentos diferentes entre el personal británico. Christian Cawley habla con un amplio acento de Middlesbrough. Rob Nightingale, que proviene de Southport, tiene un acento más del norte. Mientras que Mark O'Neil tiene un toque escocés.
Vivo en Liverpool, así que tengo un acento de Scouse que flota ligeramente en el Atlántico, en gran parte gracias a mi prometida estadounidense y al tiempo que viví en Suiza.
Y es justo decir que los programas de reconocimiento de voz a menudo luchan por comprender los dialectos regionales en inglés. Cuando salió Siri, por ejemplo, su incapacidad para entender a los usuarios escoceses se convirtió en una broma.
Pero la oferta de Google fue excepcional. Créame cuando digo que no tendrá que practicar hablar con un acento diferente. ¿Qué aplicaciones y sitios web ayudarán a mejorar mi acento cuando hablo en otro idioma? ¿Qué aplicaciones y sitios web ayudarán a mejorar mi acento cuando hablo en otro idioma? Realmente quiero hacer que mi pronunciación coincida con la de un hablante nativo. ¿Hay alguna aplicación o sitio web que pueda ayudarme? Lee mas . He hablado con un puñado de amigos que también tienen acento regional en inglés, y han tenido experiencias positivas similares. Aunque admito que es una muestra pequeña y completamente no científica, sin duda es prometedora.
Velocidad de dictado de voz
Los programas de reconocimiento de voz tradicionalmente han sido obstaculizados por la incapacidad de mantenerse al ritmo de la velocidad que el usuario dicta. Es cierto que estaba un poco preocupado de que la oferta de Google no fuera diferente, especialmente dado que es un servicio en línea, en lugar de un programa que se ejecuta en mi MacBook Pro trucado.
Pero estaba impresionado. Google pudo mantenerse al día con mi alto nivel de cafeína y no actuó como un obstáculo para mi productividad. Fue todo lo contrario de mis experiencias con otras herramientas de dictado de voz.
No sé si eso fue porque tengo un FTTC rápido (fibra para el gabinete) ¿Cuál es la diferencia entre FTTC y FTTP, y por qué debería importarme? ¿Cuál es la diferencia entre FTTC y FTTP, y por qué debería importarle? Todos hemos estado allí en algún momento u otro. Harto de nuestro servicio de Internet, buscando una nueva forma de conectarse a Internet, pero confundido por las muchas opciones diferentes. Lea más la conexión a Internet doméstica, o el hecho de que Google tiene un suministro ilimitado de servidores rápidos a su disposición. De cualquier manera, pude hacer cosas.
Una nota sobre micrófonos
Los micrófonos incorporados tienden a ser impredecibles. En mi experiencia, son excelentes, como si estuvieran en las computadoras portátiles de Apple, o no lo son. Rara vez hay un término medio.
Como regla general, las computadoras portátiles más baratas Las mejores computadoras portátiles con menos de $ 300: todo lo que necesita saber Mejores computadoras portátiles con menos de $ 300: todo lo que necesita saber Encontrar una buena computadora portátil por menos de $ 300 es casi imposible en estos días, pero se puede hacer buscar. Aquí encontrará todo lo que necesita saber para hacer una compra que ... Leer más tendrá los peores micrófonos internos. Es solo una de esas características que tienden a ser ignoradas por los fabricantes de dispositivos.
Empecé a dictar este artículo usando el micrófono interno en mi MacBook Pro. Aunque Google Docs solía decir que tenía problemas para escucharme, eso no se traducía en dictados más lentos o inexactos. Todo funcionó bien.
También probé Google Voice Typing con un caro micrófono externo Blue Yeti. Estos son micrófonos con calidad de podcast que se venden en Amazon por más de $ 100.
Micrófono USB Blue Yeti - Plata Micrófono USB Yeti - Plata Compre Ahora En Amazon $ 110.00
Es cierto que no noté ninguna diferencia en lo que respecta a la precisión o la velocidad del dictado. Sin embargo, la mayor ventaja de usar este micrófono fue que pude insertar un par de auriculares AKG y usarlos como monitor. Esto me permitió ser más consciente del ruido de fondo y autoajustarme si estaba demasiado alto o demasiado bajo.
Pensamientos finales
El reconocimiento de voz de Google no es perfecto. Pero eso no es una sorpresa, ya que el reconocimiento de voz sólido es una hazaña bastante difícil de lograr. Hay mucho que sentí que podría mejorarse.
Esto se centra principalmente en cómo el software se ocupa de la puntuación y la estructura de las oraciones. En un mundo ideal, Google insertaría automáticamente signos de puntuación basados en el ritmo y la cadencia de su voz, pero estamos muy lejos de eso.
También es una lástima que este software aún tenga que abrirse paso en otras ofertas de Google, como Gmail. Idealmente, me gustaría tener la oportunidad de descargar Google Voice Typing como una aplicación, y usarlo con otras piezas de software, como iWork's Pages Pages 5.0 para Mac. Incluye Smart Inspector Panel, pero menos Features Pages 5.0 para Mac incluye Smart Inspector Panel, Pero menos funciones Hay muchos editores de texto ligeros y fáciles de usar para los usuarios de Mac, pero para los proyectos que requieren funciones de autoedición, las páginas recientemente revisadas de Apple siguen siendo una buena solución. Leer más o el editor de rebajas IA Writer iA Writer para Mac y iOS: el mejor procesador de textos que nunca usaste iA Writer para Mac e iOS: el mejor procesador de palabras que nunca has usado Ya sea un periódico escolar o una publicación de blog, todos nosotros en algún momento nos encontramos en la posición de tener que volcar un grupo de caracteres en un archivo de texto. Mientras que el teléfono celular ... Leer más.
Pero esas son dos molestias menores, Google Voice Typing es tan bueno como se pone. Por el contrario, escribí esta sección del artículo utilizando el reconocimiento de voz incorporado de OS X, y no era tan preciso ni rápido.
Si esto no convence a las personas para que cambien a Google Drive, no sé qué sucederá.
Ahora a ti! ¿Te ha tentado el reconocimiento de voz de Google Drive? ¿Lo has probado ya? Cuéntame todo al respecto en los comentarios a continuación.