Generative KI: ein unverzichtbarer Verbündeter in der Videoproduktion
Haben Sie schon mal versucht, ein Video in einer anderen Sprache zu untertiteln als der, die im Video selbst gesprochen wird? Dieser Prozess kann langwierig und nervaufreibend sein. Es gibt aber einfach anzuwendende KI-Tools, die diesen Prozess drastisch beschleunigen. Wir haben einige Tools getestet und berichten in diesem Blog darüber.
Wagen Sie es, KI für Ihre digitale Kommunikation zu nutzen!
Nous encourageons une culture de l’autonomie et de la responsabilité individuelle.
Machen Sie sich keine Sorgen: Die Sprache Ihres Browsers ist tatsächlich Deutsch!
Beim Lesen dieses Satzes war Ihr erster Gedanke sicherlich, die Sprache Ihres Webbrowsers zu überprüfen, nicht wahr? Oder gar ein Übersetzungstool zu verwenden, um dessen Sinn zu verstehen!
Seit nunmehr mehreren Jahren erleichtern diese Tools den Alltag der Kommunikationsprofis. Kein Herausholen eines Wörterbuchs mehr nötig, keine Nutzung eines Übersetzungsdienstes, keine endlosen Recherchen… So ist es! Diese Zeiten sind nun vorbei und haben den Werkzeugen der künstlichen Intelligenz Raum gelassen.
Generative KI: ein unverzichtbarer Verbündeter in der Videoproduktion
Haben Sie schon mal versucht, ein Video in einer anderen Sprache zu untertiteln als der, die im Video selbst gesprochen wird?
Dieser Prozess ist ja langwierig und schon etwas langweilig, da Folgendes erforderlich ist:
- Transkribieren des Audioinhalts des Videos;
- Übersetzen des erhaltenen Textes;
- Generieren der Untertitel.
Mit den üblichen Werkzeugen ist daher mit bis zu einem Tag oder sogar länger zu rechnen, um die Untertitel für ein 10-minütiges Video zu erstellen.
In diesem Kontext spielt die künstliche Intelligenz eine entscheidende Rolle bei der Produktion von mehrsprachigen Inhalten, indem sie den Prozess beschleunigt. Insbesondere sind KI-basierte automatische Übersetzungs- und Untertitelgenerierungstools unerlässlich geworden, um die Produktivität zu steigern und den Anforderungen an die Übersetzung und Untertitelung von Videos gerecht zu werden.
Wir haben unterschiedliche Tools zur Videountertitelung in verschiedenen Sprachen getestet und verglichen. Die Ergebnisse werden hier unten dargestellt.
Kriterien |
SONIX |
VEED.IO |
GET CAPTE |
Azure AI Indexer |
Transkription |
Audio- und Videodatei online |
Audio- und Videodatei online |
Audio- und Videodatei online |
Audio- und Videodatei online |
Übersetzung |
38 Sprachen |
> 100 Sprachen |
10 Sprachen |
> 40 Sprachen |
Untertitelgenerierung |
automatische Transkription online |
automatische Transkription online |
automatische Transkription online |
automatische Transkription online |
Tool-Integration |
ja |
nein (online) |
nein (online) |
ja |
Skalierbarkeit |
ja |
ja |
ja |
ja |
Benutzerfreundlichkeit |
ja (Eingewöhnungszeit) |
ja |
ja |
nein |
Hosting |
N/C |
online |
N/C |
online |
Server |
AWS (US) |
N/C |
N/C |
Microsoft |
Implementierung |
unmittelbar |
unmittelbar |
unmittelbar |
unmittelbar |
Tarife (kostenpflichtige Version) |
10 $/Stunde |
13-58 €/Monat |
18-45 €/ Monat |
«Pay as you go» bis zu 15 ct/min Video, je nach gewünschter Qualität |
All diese Tools liefern Ergebnisse, die wir als zufriedenstellend erachtet haben, wobei die Qualität der Untertitel stark von der Tonqualität des Videos, der Sprachverständlichkeit der Sprechenden, den verwendeten Dialekten usw. abhängt.
Zu beachten ist: Der Azure AI Indexer bietet den Vorteil, für jedes Unternehmen, das bereits die mit der Microsoft-Cloud verbundenen Tools nutzt, leicht zugänglich zu sein. Die Konfiguration der erforderlichen Ressourcen bleibt jedoch den IT-Teams vorbehalten.
Im Folgenden ist ein Beispiel für ein Video in deutscher Sprache – und sogar in Schweizerdeutsch – zu finden, dessen französische Untertitelung mit Azure AI Indexer erstellt wurde. Es waren nur kleine Korrekturen an der Transkription (Abkürzungen, Dialekt usw.) erforderlich, damit diese die Tonspur korrekt widerspiegelt.
Aber was steckt wirklich hinter diesen Tools?
Um solche Leistungen zu erzielen, nutzen einige Tools eine auf künstlichen neuronalen Netzen basierte Technologie: die Neural Machine Translation, auch NMT genannt. Die neuronale maschinelle Übersetzung ist ein Ansatz zur automatischen Übersetzung, bei dem ein künstliches neuronales Netz (ein Schema, das der Funktionsweise biologischer Neuronen nachempfunden ist) verwendet wird, um die Wahrscheinlichkeit einer Wortfolge vorherzusagen.
Neuronale Netze werden in der Regel durch probabilistische Lernmethoden – insbesondere Bayes’sche Methoden zur Berechnung von Wahrscheinlichkeiten aus der Beobachtung bekannter Ereignisse – optimiert, die es ermöglichen, Text in wenigen Sekunden mit erhöhter Genauigkeit zu verarbeiten.