Interviews sind in den Sozialwissenschaften wie in zahlreichen anderen Disziplinen eine zentrale Methode, um an Forschungsdaten zu kommen. Hunderte Dialoge zu verschriftlichen, raubt wertvolle Zeit. Online verfügbare KI-gestützte Transkriptionsdienste nutzen allerdings weit entfernte Rechenzentren – ein No-Go in Bezug auf Datenschutz und Sicherheit. Armin Haberl und Jürgen Fleiß vom Business Analytics and Data Science Center der Universität Graz haben in Kooperation mit Dominik Kowald vom Know Center ein Programm entwickelt, das auf lokalen Computern installiert werden kann.
Die Basis bildet die Open-Source-Software „Whisper“ des US-Unternehmens OpenAI. „Diese wandelt 90 Sprachen in Text um und funktioniert gänzlich ohne Cloud“, betont Fleiß. Die Verwendung ist jedoch kompliziert. „Es gibt keine grafische Oberfläche, und man muss die Programmiersprache Python beherrschen. Das schreckt viele ab.“ So entstand die Idee, eine eigene, leicht bedienbare App zu entwerfen, mit einer einfachen grafischen Oberfläche.
Eigene Lösung
Das Ergebnis nennt sich „ATrain“ und steht im ➡ Microsoft Store zum Download bereit. Für Linux gibt es eine Installationsanleitung, an einer Version für Apple wird gerade gearbeitet. Das Paket umfasst rund zehn Gigabyte und ist daher verhältnismäßig groß. „Die sind aber nötig, wenn man alle 90 Sprachen nutzen will“, erklärt Fleiß. Der entscheidende Vorteil: Alle Daten können lokal verarbeitet werden, ohne Internetverbindung. Die Software generiert mehrere Dateien, welche auch die Integration in wissenschaftliche Analyse-Software ermöglichen.
„Unser nächstes Ziel ist, dass die App auch Pausen markiert. Das ist für wissenschaftliche Interviews essenziell“, sagt Armin Haberl. Andere Berufsgruppen, wie Journalist:innen, Ärzt:innen oder Anwält:innen, hätten möglicherweise weitere Bedürfnisse an das Programm, die auch interessant wären. Das Team hofft nun auf Unterstützung von Programmierer:innen aus der globalen Open-Source-Community, um die Transkriptions-Software weiterzuentwickeln.
von Roman Vilgut
Dieser Beitrag ist in der UNIZEIT 2/2024 erschienen >> https://uni-graz.e-publikation.de/de/2-2024/atrain