Si bien los streamers y los creadores de contenido han descubierto formas asequibles y prácticas de añadir subtítulos y doblajes para el contenido de vídeo bajo demanda (VOD), hacerlo para la transmisión en directo ha supuesto un gran desafío, principalmente porque los flujos de trabajo de transmisión en directo son complejos y los métodos tradicionales antiguos, incluidos los codificadores de hardware, son caros e inasequibles.
Entre en los desarrollos de SyncWords e IA, dispondrá de una tecnología avanzada y patentada de vanguardia para generar subtítulos, doblajes de voz precisos en tiempo real e incorporarlos a las transmisiones en directo con una latencia muy baja de unos segundos. Además, con los modernos protocolos de streaming HLS (transmisión en directo mediante HTTP), se admiten idiomas en todos los idiomas disponibles. Esto supone un punto de inflexión para la transmisión en directo, que incluye deportes y noticias en directo, así como eventos corporativos y gubernamentales en directo, que se pueden transmitir a audiencias de todo el mundo en los idiomas que elijan.
Tras recaudar 2 millones de dólares en financiación inicial, Ash tiene como objetivo hacer que la tecnología de SyncWords sea omnipresente para que una parte importante de la transmisión en directo contenga subtítulos y traducciones en directo, democratizando el contenido de vídeo en directo para el público de todo el mundo.
P: ¿Puede describir la oportunidad de mercado que busca SyncWords? ¿Cuáles son los puntos débiles que está solucionando para sus clientes?
A: Hay más de 200 mil millones de horas de transmisión en vivo cada año, y solo un pequeño porcentaje tiene subtítulos en vivo o traducciones de voz (doblajes). Estamos hablando de la transmisión en directo de deportes, noticias, juegos y eventos. Más del 10% de la población mundial es sorda o tiene problemas de audición, y más del 80% de la población mundial entiende muy bien el inglés, por lo que tenemos un problema. Además, los Estados Unidos, Canadá, Australia, la Unión Europea y un número creciente de países exigen la accesibilidad de los vídeos. Por lo tanto, este ha sido un problema sin resolver desde el inicio de la transmisión de vídeo. Estimamos que la traducción de vídeos puede multiplicar por 5 el tamaño de la audiencia. Por lo tanto, las empresas de streaming de vídeo se están tomando muy en serio la localización de vídeos.
El contenido en directo debe subtitularse y traducirse en tiempo real, con subtítulos y doblajes insertados en el vídeo en directo. A diferencia del contenido VOD, que se basa en archivos, la transmisión en directo presenta desafíos de flujo de trabajo mucho mayores, lo que dificulta la solución del problema. Las soluciones actuales para la subtitulación en directo incluyen codificadores de hardware y subtituladores humanos, los cuales son caros y difíciles de gestionar. Ninguna empresa pudo descifrar el código hasta que SyncWords resolvió el problema con su innovadora plataforma.
P: Su empresa ya ha realizado un par de pivotes anteriormente, ¿qué tiene de especial este pivote?
A: En la era de la IA, las empresas tienen que cambiar para sobrevivir y, si lo hacen con la suficiente rapidez, esto puede suponer una enorme ventaja técnica para su empresa. El peligro radica en utilizar la IA para convertirla en otro producto para mí también. Y esto puede suceder si una empresa entra en un mercado competitivo en el que ya hay muchos productos similares disponibles.
Cuando creamos SyncWords, nuestro producto en aquel entonces eran los subtítulos para vídeo bajo demanda, que era un mercado competitivo y, aunque contábamos con tecnología innovadora para automatizar el proceso, era un mercado competitivo. También desarrollamos un producto para transcribir eventos en directo y en tiempo real en forma de subtítulos y traducciones de widgets. En ese momento no había doblajes en directo, solo texto. Y durante el COVID, todo parecía venderse, incluso los subtítulos de los widgets. Puedes ver que adquirimos algunos logotipos de clientes geniales durante la pandemia de COVID.
Sin embargo, por supuesto, el 99% de nuestros clientes prefería ver los subtítulos y doblajes de audio dentro de un reproductor de vídeo y no fuera de un widget. Mis colegas cofundadores, Alex Dubinsky y Sam Cartsos, también se dieron cuenta de esto y, en 2022, decidimos crear una plataforma que ofreciera subtítulos en directo y doblajes integrados en el reproductor para la transmisión de vídeo. Lanzamos la plataforma en diciembre de 2023 y, desde entonces, hemos contratado a numerosos clientes nuevos. Sorprendentemente, pusimos en marcha nuestra empresa para la mayor parte del desarrollo del producto utilizando los ingresos de nuestro producto heredado. Hasta la fecha, hemos conseguido 2 millones de dólares en financiación inicial y estamos pensando en abrir una nueva ronda una vez que hayamos alcanzado ciertos hitos, que estamos seguros de poder cumplir, dada la demanda y el nuevo negocio que ofrece la nueva plataforma.
P: ¿Cuáles fueron los principales factores que contribuyeron a resolver con éxito un problema tecnológico desafiante?
A: Claramente, es un gran avance desarrollar software para resolver un problema difícil, especialmente uno que otras empresas han intentado sin éxito. Teníamos muy claro que la industria necesitaba una solución de este tipo. Permítanme explicarles qué hace que el problema sea tan difícil. En primer lugar, se trata de protocolos de transmisión en directo, muy diferentes del formato basado en archivos para vídeo bajo demanda, lo que hace que sea mucho más difícil trabajar con ellos. No hay código fuente abierto disponible para Live, por lo que tuvimos que crear todo internamente en SyncWords.
El aspecto clave de nuestro enfoque era nuestra arquitectura. Era esencial adoptar una arquitectura de Kubernetes escalable basada en la nube. También nos preocupaba la experiencia de usuario y la precisión de nuestros resultados de subtitulación y doblaje, que son generados por la IA y producen una precisión del 94% en nuestras combinaciones lingüísticas principales de alto nivel de recursos. La precisión de las traducciones con IA sigue aumentando, y esperamos que más combinaciones de idiomas lleguen a la zona de alta precisión en 2024. Tampoco reinventamos las modalidades de inteligencia artificial y utilizamos los mejores proveedores de inteligencia artificial de traducción y reconocimiento de voz para generar una solución altamente precisa para nuestros clientes.
Y, por último, el equipo de SyncWords está compuesto por personas con diversos antecedentes tecnológicos: transmisión en vivo, vídeo, inteligencia artificial, subtítulos y voz, lo que fue clave para resolver el problema. Las principales contribuciones de Alex al producto nos han permitido crear una oferta única centrada en los subtítulos y doblajes de baja latencia y en la escalabilidad con Kubernetes. La mayoría del equipo son nuestros ingenieros, y estamos incorporando más personas a las áreas de ventas y marketing.
P: ¿Cuáles son los aspectos más destacados de su tecnología?
A: SyncWords no solo se mantiene al día; estamos a la vanguardia de los subtítulos en directo y las traducciones para transmisiones y eventos.
Protocolos de streaming preparados para el futuro: Si bien RTMP (S) ha sido un elemento básico, el futuro gira en torno a los protocolos HLS y SRT. SyncWords es compatible con todos ellos, lo que hace que su transmisión en directo sea más ágil y escalable. El SRT (Secure Reliable Transport) es un protocolo de transmisión más nuevo que está ganando popularidad rápidamente entre las emisoras y las plataformas OTT.
Magia y variedad de voces en varios idiomas: Imagina subtitular en más de 50 idiomas y traducirlo a más de 100 idiomas en cuestión de minutos, incluso durante transmisiones en directo simultáneas. Además, puedes elegir entre 900 voces diferentes, incluidos los acentos regionales, para un doblaje automático en directo que es realmente inclusivo. SyncWords supera las barreras lingüísticas y hace que la comunicación global sea fluida e instantánea.
Integración perfecta: SyncWords se adapta perfectamente a su flujo de trabajo actual de transmisión en vivo sin necesidad de ningún cambio de software. La solución también es totalmente compatible con AWS Elemental MediaPackage, MediaLive y MediaConnect, y somos los únicos del mercado que lo ofrecen.
Especificaciones técnicas de primer nivel: Hemos seleccionado los elementos esenciales para la transmisión en directo: compatibilidad con códecs UHD y HAVC, baja latencia, PID, canales de audio y capacidades de API. Por lo tanto, nuestra solución basada en la nube garantiza que tengas todo preparado para una programación en directo ininterrumpida e inclusiva desde el punto de vista operativo.
P: ¿Seguirá creciendo la demanda de subtítulos y traducciones en directo?
A: Por supuesto, y he aquí por qué. En primer lugar, la cantidad de contenido de vídeo en directo se está disparando. Más transmisiones en directo significan una mayor necesidad de subtítulos y traducciones. En segundo lugar, las nuevas normas de accesibilidad e inclusión están obligando a los proveedores de streaming en directo a mejorar sus habilidades. Deben cumplir con estos estándares o enfrentarse a fuertes multas. Y, por último, es lo que quieren los espectadores. La gente anhela una experiencia de visualización más atractiva e inclusiva.
Además, no se puede ignorar la influencia de plataformas como Netflix, Amazon Prime y Hulu. Han puesto el listón muy alto con su amplia gama de opciones de idioma para los subtítulos y el doblaje de audio. Ahora, los televidentes esperan la misma flexibilidad para la programación en directo. Así que sí, no cabe duda de que la demanda va a seguir creciendo y SyncWords se va a beneficiar enormemente de este rápido crecimiento.