Kopie2
zurück zur Übersicht

Generative KI: ein unverzichtbarer Verbündeter in der Videoproduktion

KI Montag, 4. November 2024

Haben Sie schon mal versucht, ein Video in einer anderen Sprache zu untertiteln als der, die im Video selbst gesprochen wird? Dieser Prozess kann langwierig und nervaufreibend sein. Es gibt aber einfach anzuwendende KI-Tools, die diesen Prozess drastisch beschleunigen. Wir haben einige Tools getestet und berichten in diesem Blog darüber.

Wagen Sie es, KI für Ihre digitale Kommunikation zu nutzen!

Nous encourageons une culture de l’autonomie et de la responsabilité individuelle.

Machen Sie sich keine Sorgen: Die Sprache Ihres Browsers ist tatsächlich Deutsch!

Beim Lesen dieses Satzes war Ihr erster Gedanke sicherlich, die Sprache Ihres Webbrowsers zu überprüfen, nicht wahr? Oder gar ein Übersetzungstool zu verwenden, um dessen Sinn zu verstehen!

Seit nunmehr mehreren Jahren erleichtern diese Tools den Alltag der Kommunikationsprofis. Kein Herausholen eines Wörterbuchs mehr nötig, keine Nutzung eines Übersetzungsdienstes, keine endlosen Recherchen… So ist es! Diese Zeiten sind nun vorbei und haben den Werkzeugen der künstlichen Intelligenz Raum gelassen.

Generative KI: ein unverzichtbarer Verbündeter in der Videoproduktion

Haben Sie schon mal versucht, ein Video in einer anderen Sprache zu untertiteln als der, die im Video selbst gesprochen wird?

Dieser Prozess ist ja langwierig und schon etwas langweilig, da Folgendes erforderlich ist:

  • Transkribieren des Audioinhalts des Videos;
  • Übersetzen des erhaltenen Textes;
  • Generieren der Untertitel.

Mit den üblichen Werkzeugen ist daher mit bis zu einem Tag oder sogar länger zu rechnen, um die Untertitel für ein 10-minütiges Video zu erstellen.

In diesem Kontext spielt die künstliche Intelligenz eine entscheidende Rolle bei der Produktion von mehrsprachigen Inhalten, indem sie den Prozess beschleunigt. Insbesondere sind KI-basierte automatische Übersetzungs- und Untertitelgenerierungstools unerlässlich geworden, um die Produktivität zu steigern und den Anforderungen an die Übersetzung und Untertitelung von Videos gerecht zu werden.

Wir haben unterschiedliche Tools zur Videountertitelung in verschiedenen Sprachen getestet und verglichen. Die Ergebnisse werden hier unten dargestellt.

Kriterien

SONIX

VEED.IO

GET CAPTE

Azure AI Indexer

Transkription

Audio- und Videodatei online

Audio- und Videodatei online

Audio- und Videodatei online

Audio- und Videodatei online

Übersetzung

38 Sprachen

> 100 Sprachen

10 Sprachen

> 40 Sprachen

Untertitelgenerierung

automatische Transkription online

automatische Transkription online

automatische Transkription online

automatische Transkription online

Tool-Integration

ja

nein (online)

nein (online)

ja

Skalierbarkeit

ja

ja

ja

ja

Benutzerfreundlichkeit

ja (Eingewöhnungszeit)

ja

ja

nein

Hosting

N/C

online

N/C

online

Server

AWS (US)

N/C

N/C

Microsoft

Implementierung

unmittelbar

unmittelbar

unmittelbar

unmittelbar

Tarife (kostenpflichtige Version)

10 $/Stunde

13-58 €/Monat

18-45 €/ Monat

«Pay as you go»

bis zu 15 ct/min Video, je nach gewünschter Qualität


All diese Tools liefern Ergebnisse, die wir als zufriedenstellend erachtet haben, wobei die Qualität der Untertitel stark von der Tonqualität des Videos, der Sprachverständlichkeit der Sprechenden, den verwendeten Dialekten usw. abhängt.

Zu beachten ist: Der Azure AI Indexer bietet den Vorteil, für jedes Unternehmen, das bereits die mit der Microsoft-Cloud verbundenen Tools nutzt, leicht zugänglich zu sein. Die Konfiguration der erforderlichen Ressourcen bleibt jedoch den IT-Teams vorbehalten.

Im Folgenden ist ein Beispiel für ein Video in deutscher Sprache – und sogar in Schweizerdeutsch – zu finden, dessen französische Untertitelung mit Azure AI Indexer erstellt wurde. Es waren nur kleine Korrekturen an der Transkription (Abkürzungen, Dialekt usw.) erforderlich, damit diese die Tonspur korrekt widerspiegelt.

Link zum Video

Aber was steckt wirklich hinter diesen Tools?

Um solche Leistungen zu erzielen, nutzen einige Tools eine auf künstlichen neuronalen Netzen basierte Technologie: die Neural Machine Translation, auch NMT genannt. Die neuronale maschinelle Übersetzung ist ein Ansatz zur automatischen Übersetzung, bei dem ein künstliches neuronales Netz (ein Schema, das der Funktionsweise biologischer Neuronen nachempfunden ist) verwendet wird, um die Wahrscheinlichkeit einer Wortfolge vorherzusagen.

Neuronale Netze werden in der Regel durch probabilistische Lernmethoden – insbesondere Bayes’sche Methoden zur Berechnung von Wahrscheinlichkeiten aus der Beobachtung bekannter Ereignisse – optimiert, die es ermöglichen, Text in wenigen Sekunden mit erhöhter Genauigkeit zu verarbeiten.


Durch die Nutzung von www.suisse.ing akzeptieren Sie die Verwendung von Cookies. Datenschutz.