
Automatisch ondertitelen door cockpitplatform
In 2015 en 2016 bracht het consortium verschillende technologische modules samen die een workflow van ondertiteling kunnen ondersteunen. Elke module namen ze afzonderlijk onder de loep voor verbetering. Belangrijk in het project was het cockpitplatform die alle modules tot een efficiënte workflow verbindt en de gebruiker voorziet van een eenvoudige gebruikersinterface. Zo kunnen ondertitelaars in het prototype fragmenten en eventueel een script opladen, het platform de automatische verwerking laten doen en het ondertitelde resultaat bekijken en, indien nodig, verbeteren. Omdat een aantal modules een lerende functie bezitten, zullen de resultaten ook verbeteren naarmate het platform vaker gebruikt wordt.
Tijdswinst bij programma's
Ondanks dat elke module moet inboeten aan kwaliteit in het eindresultaat, levert STON volgens testgebruikers wel een aanzienlijke tijdswinst op voor documentaires. Terwijl er normaal gezien minstens drie uur nodig is om ondertitels voor een natuurdocumentaire van ongeveer één uur uitzendklaar te krijgen, was dit via STON gemiddeld slechts één uur werk. Voor programma’s met veel achtergrondgeluid, snelle dialogen, zeer spontane spraak (waarin typisch geen grammaticaal correcte zinnen worden gevormd) of dialecten en regiolecten brengt STON momenteel weinig meerwaarde. In het algemeen zijn programma’s met duidelijke en rustig sprekende stemmen, zoals documentaires met voice-overs en het weerbericht, ideaal voor de STON modules. Mits nog wat kleine aanpassingen aan de huidige STON workflow, kan je dan ook een tijdswinst van minstens 50% verwachten.
Kortom, dat spraak- en taaltechnologie het werk voor de ondertitelaar kan verlichten is duidelijk. Ook de inzetbaarheid is bewezen voor testcases zoals natuurdocumentaires. Daarnaast blijft er zeker nog ruimte voor verbetering, zowel voor testcases die momenteel nog te hoog gegrepen zijn als voor diegene die nu al winstgevend zijn. Een case per case aanpak is dan ook het motto bij de toekomst van automatische ondertiteling.