Alors que les streamers et les créateurs de contenu ont trouvé des moyens abordables et pratiques d'ajouter des sous-titres et des doublages aux contenus de vidéo à la demande (VOD), le faire pour la diffusion en direct s'est révélé un défi de taille, principalement parce que les flux de diffusion en direct sont complexes et que les anciennes méthodes traditionnelles, notamment les encodeurs matériels, sont coûteuses et inabordables.
Entrez dans les développements de SyncWords et de l'IA, et vous disposez d'une technologie de pointe brevetée avancée pour générer des sous-titres, des doublages vocaux et des sous-titres précis en temps réel et les injecter dans des diffusions en direct avec une latence très faible de quelques secondes. De plus, grâce aux protocoles de diffusion modernes de HLS (diffusion en direct HTTP), toutes les langues disponibles sont prises en charge. Cela change la donne pour la diffusion en direct, y compris les sports en direct, les actualités ainsi que les événements corporatifs et gouvernementaux en direct, qui peuvent être diffusés à un public mondial dans la langue de son choix.
Après avoir levé 2 millions de dollars en financement de démarrage, Ash vise à rendre la technologie de SyncWords omniprésente afin qu'une grande partie de la diffusion en direct contienne des sous-titres et des traductions en direct, démocratisant ainsi le contenu vidéo en direct pour un public mondial.
Q : Pouvez-vous décrire l'opportunité de marché que SyncWords recherche ? Quels sont les problèmes que vous êtes en train de résoudre pour vos clients ?
UNE : Plus de 200 milliards d'heures de diffusion en direct ont lieu chaque année, et seul un infime pour cent d'entre elles sont sous-titrées en direct ou traduites par des doublages. Nous parlons de diffusion en direct de sports, d'actualités, de jeux et d'événements. Plus de 10 % de la population mondiale est sourde ou malentendante, et plus de 80 % de la population mondiale comprend très bien l'anglais, d'où notre problème. En outre, les États-Unis, le Canada, l'Australie, l'Union européenne et un nombre croissant de pays imposent l'accessibilité vidéo. Ce problème n'est donc pas résolu depuis le début du streaming vidéo. Nous estimons que la traduction de vidéos peut multiplier par 5 la taille de l'audience. Par conséquent, les sociétés de streaming vidéo prennent la localisation vidéo très au sérieux.
Le contenu en direct doit être sous-titré et traduit en temps réel, avec des sous-titres et des doublages insérés dans la vidéo en direct. Contrairement au contenu VOD qui est basé sur des fichiers, la diffusion en direct présente des défis de flux de travail bien plus importants, ce qui rend le problème difficile à résoudre. Les solutions actuelles pour le sous-titrage en direct incluent des encodeurs matériels et des sous-titreurs humains, qui sont tous deux coûteux et difficiles à gérer. Aucune entreprise n'a réussi à déchiffrer le code, jusqu'à ce que SyncWords résolve le problème grâce à sa plateforme innovante.
Q : Votre entreprise a déjà effectué quelques pivots. Quelle est la particularité de ce pivot ?
UNE : À l'ère de l'IA, les entreprises doivent s'adapter pour survivre, et si vous changez de cap assez rapidement, cela peut se traduire par un avantage technique considérable pour votre entreprise. Le danger réside dans l'utilisation de l'IA pour devenir un autre produit « moi aussi ». Et cela peut se produire si une entreprise se lance sur un marché concurrentiel où de nombreux produits similaires sont déjà disponibles.
Lorsque nous avons créé SyncWords, notre produit proposait à l'époque des sous-titres et des sous-titres pour la vidéo à la demande, un marché concurrentiel. Bien que nous disposions d'une technologie innovante pour automatiser le processus, il s'agissait d'un marché concurrentiel. Nous avons également développé un produit permettant de transcrire en direct des événements en temps réel sous la forme de légendes et de traductions de widgets. Pas de doublage en direct à ce moment-là, juste du texto. Et pendant la COVID, tout semblait se vendre, même ces légendes de widgets. Vous pouvez voir que nous avons acquis de superbes logos de clients pendant la COVID.
Bien entendu, 99 % de nos clients ont préféré visionner les sous-titres et les doublages audio dans un lecteur vidéo, et non à l'extérieur dans un widget. Mes collègues cofondateurs, Alex Dubinsky et Sam Cartsos, s'en sont également rendu compte et, en 2022, nous avons décidé de créer une plateforme pour les sous-titres et doublages en direct en direct pour le streaming vidéo. Nous avons lancé la plateforme en décembre 2023 et avons depuis recruté de nombreux nouveaux clients. Fait remarquable, nous avons financé la majeure partie du développement de nos produits grâce aux revenus générés par notre ancien produit. À ce jour, nous avons obtenu 2 millions de dollars de financement de démarrage et nous cherchons à lever une nouvelle levée de fonds après avoir atteint certains objectifs, que nous sommes convaincus de pouvoir atteindre compte tenu de la demande et des nouvelles activités liées à la nouvelle plateforme.
Q : Quels ont été les principaux facteurs qui ont contribué à résoudre avec succès un problème technologique complexe ?
UNE : De toute évidence, développer un logiciel pour résoudre un problème difficile, en particulier un problème qui a été tenté sans succès par d'autres entreprises, représente un énorme avantage. Il était très clair pour nous que l'industrie avait besoin d'une telle solution. Permettez-moi de vous dire en quoi ce problème est si difficile. Tout d'abord, vous avez affaire à des protocoles de diffusion en direct, très différents du format basé sur des fichiers pour la vidéo à la demande, ce qui rend leur utilisation beaucoup plus difficile. Aucun code open source n'est disponible pour Live, nous avons donc dû tout créer en interne chez SyncWords.
L'aspect clé de notre approche était notre architecture. L'adoption d'une architecture Kubernetes évolutive basée sur le cloud était essentielle. Nous étions également maniaques en ce qui concerne l'expérience utilisateur et la précision de nos sorties de sous-titres et de doublage, qui sont générées par l'IA et produisent une précision de 94 % sur nos principales paires de langues à ressources élevées. La précision des traductions basées sur l'IA continue d'augmenter, et nous prévoyons que davantage de paires de langues entreront dans la zone de haute précision en 2024. Nous n'avons pas non plus réinventé les modalités de l'IA et avons fait appel aux meilleurs fournisseurs d'IA de reconnaissance vocale et de traduction pour proposer une solution extrêmement précise à nos clients.
Enfin, l'équipe de SyncWords est composée de personnes ayant des connaissances technologiques diverses : diffusion en direct, vidéo, IA, sous-titrage et voix, ce qui a joué un rôle clé dans la résolution du problème. Les principales contributions d'Alex au produit nous ont permis de créer une offre unique axée sur les sous-titres et les doublages à faible latence, ainsi que sur l'évolutivité grâce à Kubernetes. La majorité de l'équipe est composée d'ingénieurs, et nous ajoutons du personnel aux ventes et au marketing.
Q : Quels sont les points forts uniques de votre technologie ?
UNE : SyncWords ne se contente pas de suivre le rythme ; nous sommes à la pointe en matière de sous-titrage en direct et de traduction pour les streams et les événements.
Protocoles de streaming prêts pour l'avenir : Bien que le protocole RTMP (S) ait toujours joué un rôle de base, l'avenir tournera autour des protocoles HLS et SRT. SyncWords les prend tous en charge, ce qui rend votre diffusion en direct plus agile et évolutive. SRT (Secure Reliable Transport) est un nouveau protocole de streaming qui gagne rapidement en popularité auprès des diffuseurs et des plateformes OTT.
Magie multilingue et variété de voix : Imaginez sous-titrer dans plus de 50 langues et traduire dans plus de 100 langues en quelques minutes, même lors de diffusions en direct simultanées. De plus, vous pouvez choisir parmi 900 voix différentes, y compris des accents régionaux, pour un doublage automatique en direct véritablement inclusif. SyncWords élimine les barrières linguistiques, rendant la communication mondiale fluide et instantanée.
Intégration fluide : SyncWords s'intègre parfaitement à votre flux de diffusion en direct actuel sans nécessiter de modifications logicielles. La solution est également entièrement compatible avec AWS Elemental MediaPackage, MediaLive et MediaConnect, et nous sommes les seuls sur le marché à les proposer.
Spécifications techniques de premier plan : Nous avons défini les éléments essentiels de la diffusion en direct : prise en charge des codecs UHD et HAVC, faible latence, PID, canaux audio et fonctionnalités d'API. Ainsi, notre solution basée sur le cloud garantit que vous êtes prêt pour une programmation en direct 24 heures sur 24, 7 jours sur 7, qui est inclusive et fluide sur le plan opérationnel.
Q : La demande de sous-titres et de traductions en direct va-t-elle continuer à augmenter ?
UNE : Absolument, et voici pourquoi. Tout d'abord, la quantité de contenu vidéo en direct monte en flèche. L'augmentation du nombre de diffusions en direct implique un besoin accru de sous-titres et de traductions. Deuxièmement, les nouvelles règles d'accessibilité et d'inclusivité poussent les fournisseurs de diffusion en direct à améliorer leur jeu. Ils doivent respecter ces normes sous peine de lourdes amendes. Enfin, c'est ce que veulent les spectateurs. Les gens recherchent une expérience de visionnage plus engageante et inclusive.
De plus, l'influence de plateformes telles que Netflix, Amazon Prime et Hulu ne peut être ignorée. Ils ont placé la barre très haut grâce à leur large éventail d'options linguistiques pour les sous-titres, les sous-titres et le doublage audio. Désormais, les téléspectateurs s'attendent à la même flexibilité pour la programmation en direct. Donc, oui, la demande va certainement continuer de croître, et SyncWords sera un grand bénéficiaire de cette croissance rapide.