Über Aiconix
Aiconix ist ein 2018 in Hamburg gegründetes Startup und versteht sich als “One-stop shop for AI in media”. Mit der eigenen Plattform “aingine” bündelt das Unternehmen KI-Tools für die Verarbeitung audiovisueller Inhalte — von Live-Transkription über automatische Untertitelung bis hin zur Analyse von Medieninhalten. Zu den Kunden zählen namhafte Medienhäuser wie die Tagesschau, die dpa und die NOZ Gruppe.
Überblick
Ziele
- Entwicklung eines Echtzeit-Spracherkennungssystems
- Transkription und Übersetzung in verschiedene Ausgabeformate
Ergebnisse
- Produktives System für Live-Transkription und -Übersetzung
- Einsatz bei großen deutschen Medienhäusern
Das Projekt
- Dienstleistung
Softwareentwicklung - Rolle
Technical Lead - Technologien
Go, FFmpeg, RTS, Nginx, Kubernetes - Branche
Media / Broadcasting - Leistungen
Konzeption, Projektleitung, Architektur, Entwicklung, DevOps
Herausforderung
Aiconix benötigte ein robustes System zur Verarbeitung von Audio- und Videodaten in Echtzeit. Die Anforderungen waren anspruchsvoll: Das System musste beliebige Medienformate verarbeiten, gesprochene Sprache zuverlässig erkennen und die Ergebnisse ohne spürbare Verzögerung in verschiedenen Ausgabeformaten bereitstellen. Gleichzeitig sollte die Lösung skalierbar sein, um den Anforderungen großer Medienhäuser gerecht zu werden.
Vorgehen
Das gemeinsame Ziel: Ein zuverlässiges Echtzeit-System schaffen, das barrierefreie Medieninhalte und mehrsprachige Übersetzungen ermöglicht.
Wie sind wir in das Projekt gestartet?
In enger Abstimmung mit der Geschäftsführung von Aiconix haben wir zunächst die technischen Anforderungen analysiert und eine geeignete Systemarchitektur entworfen. Der Fokus lag auf einer performanten Verarbeitung der Mediendaten bei gleichzeitig hoher Zuverlässigkeit. Neben der reinen Entwicklungsarbeit übernahmen wir auch das Projektmanagement und koordinierten die verschiedenen Projektphasen.
Die Zusammenarbeit war geprägt von regelmäßigem Austausch und gemeinsamer Lösungsfindung.
Durch die umfangreiche Erfahrung von Dr. Thomas Jansen im Bereich des Video Streaming konnten wir mit der Crissy Field GmbH und dem aiconix Team in kürzester Zeit ein skalierbares Live-Transkriptionssystem entwickeln, das neue Maßstäbe gesetzt hat und zur schnellen Markteinführung des Produkts geführt hat. Wir danken für die gute Zusammenarbeit.
Strategie & Maßnahmen
Unsere Strategie bestand aus drei konkreten Bereichen.
1) Systemarchitektur: Wir haben eine modulare Architektur in Go entwickelt, die eine effiziente Verarbeitung von Audio- und Videostreams ermöglicht. Das System wurde für hohe Durchsatzraten und geringe Latenz optimiert.
2) Sprachverarbeitung: Die Integration verschiedener Spracherkennungs- und Übersetzungskomponenten ermöglicht die Transkription und Übersetzung in rund 30 Sprachen. Die Ergebnisse werden in verschiedenen Formaten wie Untertiteln oder Transkripten ausgegeben.
3) Produktionsreife: Das System wurde für den Einsatz in Live-Umgebungen konzipiert und erfüllt die hohen Anforderungen des Broadcast-Bereichs an Stabilität und Performance.
Fazit
Das entwickelte Spracherkennungssystem ermöglicht Aiconix, barrierefreie Sendungen und mehrsprachige Livestreams anzubieten. Die Lösung wird erfolgreich bei großen deutschen Medienhäusern eingesetzt und unterstützt die Erreichbarkeit von Medieninhalten für ein breites Publikum.
Die enge Zusammenarbeit zwischen Entwicklung und Geschäftsführung hat maßgeblich zum Projekterfolg beigetragen.
Sprechen Sie mit einem Experten
Melden Sie sich bei uns für ein erstes informelles Gespräch. Wir analysieren den Status Quo und entwickeln gemeinsam Lösungen.
Experte anfragen