Servicios de transcripción basados ​​en AI no superan a precisión humana

A pesar de que los servicios de transcripción basados ​​en AI experimentan serias mejoras en los últimos años, su vocabulario programado limitado y su falta de socialización hacen que no puedan igualar las tasas de precisión del 99 al 100% que ofrece el oído humano.

En la última década, la industria de la transcripción se ha vuelto prácticamente irreconocible. Si bien el concepto de transcripción, o la producción de un registro escrito de algo hablado, sigue siendo el mismo, la industria ha cambiado drásticamente debido a los avances en la tecnología, que posteriormente han llevado a la aparición de aplicaciones de transcripción impulsadas por la inteligencia artificial como Trint. Nutria, y de verdad.

Esto se debe a su facilidad de uso, ya que el usuario simplemente tiene que descargar la aplicación en su dispositivo móvil, presionar Grabar y el proceso comienza. Además, un estudio realizado en 2017 encontró que la IA ahora tiene un índice de error del 5,1% en términos de reconocimiento del habla, que es casi lo mismo que un humano.

Sin embargo, los expertos en transcripción creen que a pesar de los avances realizados en los campos de los servicios de transcripción impulsados ​​por bots, los proveedores que utilizan transcriptores humanos todavía tienen una ventaja significativa debido a las mejores tasas de precisión que ofrece el oído humano, que se ubican entre el 99 y el 100%. .

Además, mientras que los servicios controlados por la inteligencia artificial son teóricamente más rápidos dado que producen transcripciones en tiempo real, la tasa de error de los robots sigue siendo del 12%, lo que significa que el cliente tendrá que leer la transcripción completa y corregir los errores. Al utilizar un servicio de transcripción dirigido por el ser humano, como GoTranscript, el proceso de transcripción funciona de manera diferente.

El cliente cargará su archivo de audio o video a través de la aplicación móvil o sitio web de GoTranscript, que luego será trabajado por un equipo de transcriptores humanos que comenzarán el proceso de transcripción dividiendo la carga en partes más pequeñas. Luego, se trabajará en la transcripción y, dependiendo de su tamaño, se devolverá al cliente sin errores, dentro de las seis a 24 horas.

Además del rápido cambio de rumbo dado a los clientes por los servicios de transcripción impulsados ​​por humanos, también está la cuestión de cómo el oído humano es más preciso que un bot. Si bien la mayoría del software de Reconocimiento de voz automatizado (ASR) funciona bien en términos de uso diario en dispositivos móviles, aún tiene varios inconvenientes.

Para empezar, el cerebro humano es muy hábil para filtrar el ruido de fondo, lo que significa que es menos probable que salte o malinterprete las palabras. Además, la educación social del ser humano significa que es capaz de comprender otros factores externos, como la jerga, la entonación e incluso las bromas en función de su contexto cultural. Sin embargo, un robot está preprogramado con un vocabulario limitado, que posiblemente sea su mayor problema.

El vocabulario limitado de un robot significa que también es incapaz de distinguir entre varios oradores, o “voz interbloqueada”, que es la principal razón por la que actualmente tienen una tasa de precisión no superior al 95%.

“Es fantástico ver los avances que AI ha hecho en términos de transcripción en los últimos años”, comentó el CEO de GoTranscript, Peter Trebek. “Con estas mejoras continuas, también nos han impulsado a continuar elevando la calidad de nuestro producto, que esperamos que nos mantenga en la cima del mercado de transcripción en términos de tasas de precisión entre 99 y 100%”.

A medida que los márgenes entre la inteligencia artificial y la realidad se vuelven cada vez más estrechos, queda por ver qué medidas y otros servicios de transcripción impulsados ​​por el hombre tomarán para mantener sus índices de precisión en los servicios de transcripción automatizados.