Ob Student, Schüler, Forscher oder Journalist – wer sich mit der Transkription von Sprachaufnahmen befasst, weiß um die Mühen, die diese Arbeit bereiten kann. Wenn sich ein Interviewpartner vom Mikrofon wegdreht, dieser sehr schnell spricht oder der Dialekt eine klare Satzaussage nicht mehr zulässt, kann der Prozess der Verschriftlichung von Worten zu einer Sisyphos-Arbeit werden. Wenn man Stunden damit verbringt, Audiodateien abzuhören, vor- und zurückklickt, dabei versucht, jedes Wort korrekt zu verstehen und die Grammatikregeln vergessen muss, die man in jedem Deutschunterricht gelernt hat, weil der Interviewte Gedankensprüngen nachjagt, wie ein Fuchs einem Hasen, dann kann man sich die Verlockung vorstellen, die von einer guten (automatisierten) Transkriptionssoftware ausgeht.

Als erstes Tool für die gelungene Verschriftlichung sei hier das Aufnahmegerät erwähnt. Je besser die Aufnahmequalität, desto besser die anschließende Ausgabequalität. Bei einfachen 1:1-Interviewsituationen kann durchaus das Smartphone zur Aufnahme reichen. Schwieriger wird es, wenn man Gruppendiskussionen oder Pressekonferenzen mit nur einem Gerät aufnehmen möchte. Die räumlich unterschiedliche Distanz der Sprecher sollte ein gutes Gerät ausbalancieren können. Zumindest in einem solchen Umfang, dass der Benutzer anschließend alle Stimmen zuordnen und das Gesprochene verstehen kann. Eine Audioqualität für die Verwendung für Radiobeiträge wird hierbei nicht vorausgesetzt.

Ganz allgemein gibt es beim Thema „Software fürs Transkribieren“ zwei Wege – den automatischen und den nicht-automatischen. Beide bergen Vorteile, beide haben auch Nachteile. Letztlich kommt es bei der Wahl zwischen diesen beiden Wegen auch auf das Vertrauen auf die Fähigkeiten der „Maschine“ an sowie auf das eigene Zeitmanagement.

Transkriptionsregeln

Durch transkribieren werden qualitative Daten gewonnen. Anders als bei quantitativen, bei welchen zählbare Dinge erhoben werden, werden qualitative Daten aus im besten Fall gut strukturierten Gesprächen gewonnen. Die Gespräche müssen im wissenschaftlichen Sinne für späterer Arbeiten und für deren Nachvollziehbarkeit schriftlich dargestellt werden. Ob nun in der Forschung, der universitären Lehre oder der journalistischen Arbeit, man wird bei der Transkription immer wieder auf unterschiedliche Transkriptionsregeln stoßen. Neben verschiedenen Regeln bietet der Markt auch divergierende Transkriptionssoftware. Wie schon gesagt, muss man hier die Vertrauensfrage stellen – mache ich alles selbst, oder überlasse ich die meiste Arbeit vertrauensvoll einer Software?

Die Regeln für das Übertragen des gesprochenen Wortes in die schriftliche Form können von Lehrinstitut zu Lehrinstitut verschieden sein. Während es an Universitäten wichtig ist, das tatsächlich gesprochene Wort niederzuschreiben, um dessen Aussage in Reinform zu erhalten, legen andere Lehreinrichtungen auch Wert darauf, das Umfeld des Gesagten in dem Transkript wiederzufinden. Dort müssen dann auch emotionale Regungen wie Seufzer oder zum Beispiel auch das Räuspern oder die beliebten „Ähm“ dargestellt werden.

Ein Beispiel für die Regeln zur korrekten Transkription von Interviews stellt die Pädagogische Hochschule Freiburg vor. Diese findet man unter folgendem Link:

https://www.ph-freiburg.de/fileadmin/dateien/fakultaet1/psychologie/Uploads/wirtz/Henning-Kahmann/TU_Chemnitz_Transkriptionsregeln.pdf

Wer solch nachvollziehbaren und wiederholbaren Regeln folgt, kann im Grunde genommen nichts falsch beim Transkribieren machen. Da nun die Regelfrage geklärt ist, kann man sich der technischen Seite zuwenden. Nun gilt es zu entscheiden, ob man Audiodateien oder Videodateien transkribieren will.

Audio-Dateien transkribieren

Als Print- oder Onlinejournalist ist es wichtig, detailliert belegen zu können, was die Quelle, also die interviewte Person, genau gesagt hat. Dies dient nicht nur im Falle eines gerichtlichen Prozesses als Beweis, sondern steht auch im Dienst der Leser. Diese haben ein Recht darauf, exakt und unverfälscht darüber Auskunft zu bekommen, was gesagt wurde.

Schriftliche Notizen sollte man sich immer machen, allein, um sich für Zwischenfragen zu wappnen. Aber für eine spätere Auswertung der Daten in journalistischer Form sind digitale Aufnahmen sprichwörtlich Gold wert. Dabei kann die Kombination von Audioaufnahmen und handschriftlichen Notizen für den späteren Artikel auch dadurch von Vorteil sein, weil man durch die Notiz des Zeitindex schneller gesuchte Passagen wiederfindet. Dazu kommt, dass man an gleicher Stelle auch augenscheinliche Gefühlsregungen wie zum Beispiel Augenverdrehen oder Kopfschütteln festhalten kann, und so bestimmte Transkriptionsregeln genau einhalten kann.

Video-Dateien transkribieren

Wer glaubt, bei Video-Interviews bestünde keine Notwendigkeit einer Verschriftlichung, liegt falsch. Speziell für eine Indexierung und für Einträge in eine übersichtliche, schriftliche Suchmaske im Rahmen eines Video-Archivs, können die Transkriptionen von Videoaufnahmen wichtig sein.

Hinzu kommt, dass die Reduktion auf die alleinige Aussage der Wörter ohne den visuellen Kontext oder andere Ablenkungen, neue Perspektiven auf vieles des Gesagten zulässt. Darüber hinaus ist eine Verschriftlichung von Videoaufnahmen leichter und schneller zu kopieren. Hinzu kommt, dass das transkribierte Wort auch einfacher automatisch zu übersetzen ist, als das gesprochene. Textdateien benötigen in digitalen Archiven auch bedeutend weniger Speicherplatz als massiv große Video-Files.

Auch die veränderte Quellenlage heutiger Medien macht eine Transkription von Videofiles durchaus nötig. Las man als Journalist früher in Büchern nach und rezipierte selbst das gedruckte Wort anderer Standeskollegen, so hat sich heute mit Video-Portalen wie YouTube und den dortigen Content-Produzenten vieles in diesem Bereich gewandelt. Nicht selten kommt es mittlerweile auch bei Politikern vor, dass diese den „einfachen“ Weg gehen und sich nur über Video-Plattformen an die Öffentlichkeit wenden. Neben der Sicherung solcher visueller Dokumente auf einer Festplatte, kann man diese auch einfach verschriftlichen.

Mit der Transkription wird zudem ein weiterer Distributionsweg für Medieninhalte abseits des audio-visuellen geschaffen. So wird der Content gleichzeitig einer großen Personenzahl zugänglich gemacht.

Automatische VS nicht-automatische Transkriptionssoftware

Jeder Journalist und jede Journalistin können sich entscheiden, welche Art des Zugangs sie sich für ihre Transkriptionen vorstellen. Die einen legen Wert auf schnelle Arbeit, die anderen auf höchstmögliche Genauigkeit. Für den ersten Zugang bieten sich automatische, für den zweiten nicht-automatische Transkriptionsprogramme an.

Nicht-automatisierte Transkriptionssoftware

Sowohl an Universitäten, Lehranstalten und in vielen Redaktionen werden die sogenannten nicht-automatisierten Transkriptionsprogramme verwendet. Dabei spielt man die Audiodatei, also das Gesagte, einfach ab und überträgt via Tastatur durch Tippen den Inhalt in die Schriftform. Die meisten aktuellen Programme dieses Typs bieten einige hilfreiche Dinge, die den Schreiber bei der Arbeit des Transkribierens unterstützen. Anhand dieser Features kann man auch die Qualität der Programme eruieren.

Eine der wichtigsten Features von Transkriptionsprogrammen, auch für Schnelltipper, ist die verlangsamte Geschwindigkeit beim Abspielen. Durch diese Funktion kann man die Abspielgeschwindigkeit dem eigenen Tipptempo präzise anpassen. Die Vorteile der Verlangsamung sind, dass man somit weniger sogenannte Flüchtigkeitsfehler begeht, und dass man anschließend auch weniger Aufwand damit hat, Korrekturen durchzuführen.

Zeitmarken sind ein wichtiger Bestandteil der Software. Damit kann man schnell zu wichtigen Stellen in der Aufzeichnung springen. Somit stellt man nicht nur sicher, dass man selbst schnell mit dieser Aufnahme arbeiten kann, auch anderen helfen die Zeitmarken dabei, mit der Datei rasch relevante Inhalte zu finden.

Nicht jedes Programm hat dies inkludiert, aber wer danach sucht, findet es – das USB-Fuß-Pedal. Damit kann man per Druck mit dem Fuß die Wiedergabe der Datei befehlen. Dieses Feature bietet dem Nutzer eine signifikante Zeitersparnis, da beide Hände unablässig auf der Tastatur schreiben können. Die Zeitersparnis klingt erstmal gering, da man so pro Tastendruck vielleicht nur 2 bis 5 Sekunden einspart, aber bei längeren Aufnahmen summiert sich dies durchaus in den Stundenbereich.

Der Mensch ist ein Gewohnheitstier, auch, was seine sprachlichen Phrasen betrifft. Mit „In der Regel“, „Wissen Sie“, oder „Ich weiß gar nicht, ob sie es wussten“ füllen wir Denkpausen und verschaffen uns während eines Gesprächs Zeit. Diese Phrasen können für jemanden, der diese transkribieren muss, zu einer Tortur werden. Viele Programme zur Verschriftlichung nutzen daher als wichtiges Feature zur Arbeitserleichterung das Hinterlegen von Textbausteinen oder sogar Kürzeln. Durch den Druck einer bestimmten Tastenkombination können die Programme die entsprechenden Satzfragmente einfach einfügen. Positiv dabei ist, dass man sich dadurch sowohl bei kurzen wie auch bei langen Transkriptionen viel Zeit ersparen kann.

Automatische Transkriptionssoftware

Wer vermutet, eine Software für die automatische Transkription sei lediglich eine wie für die Spracherkennung, der irrt. Eine Spracherkennungssoftware ist dafür ausgelegt, lediglich auf die Stimme einer einzigen Person abgestimmt zu sein. Hingegen können automatische Transkriptionsprogramme es leisten, mehrere Stimmen zu erkennen und separat voneinander zu notieren. Das Problem dabei ist, dass die Software auf diese speziellen Stimmen quasi trainiert sein muss.

Auch wenn nur eine Person spricht, passieren der automatischen Stimmerkennung und der anschließenden Verschriftlichung durchaus Fehler. Es kann also zu einer aufwändigen Korrektur durch den Menschen kommen.

Dafür erspart man sich den kompletten eigentlichen Prozess des Transkribierens. Zwar muss man kontrollieren, aber meist gewinnt man durch das Automatisieren des Transkriptionsprozesses im Vergleich zur nicht-automatisierten Variante Zeit.

Auch Videodateien können von vollautomatischen Transkriptionsprogrammen erfasst werden. Das Problem dabei ist, dass sich durch die Nebengeräusche vieler Aufnahmen im Freien eine genaue Niederschrift nicht bewerkstelligen lässt. Vielfach wird daher eine manuelle Nachbearbeitung fällig.

Kostenlose oder kostenpflichtige Transkriptionssoftware

Hinter jeder Software stecken Programmierer, die viel Zeit, Aufwand und Arbeit hineingesteckt haben. Daher verlangen die meisten auch selbstverständlich eine Entlohnung dafür. Aber neben diesen kostenpflichtigen Programmen bieten viele Hersteller durchaus auch kostenfreie Varianten an. Diese umfassen meist nicht alle Features (siehe oben) oder deren Lizenz läuft nach einer definierten Probezeit wieder aus. Eine Umwandlung in eine Bezahlvariante stellen alle in Aussicht.

In vielen Ausbildungsstätten, Unis und FHs stehen oftmals Transkriptionsplätze mit Fuß-Pedal zur Verfügung. Auch in größeren Redaktionen hat man diese Einrichtung durchaus auch schon gesehen.

Da ein „normales“ Interview selten Überlänge hat, genügen den Journalisten und Journalistinnen in der Regel kostenlose Programm-Varianten.