"Ein blinder Umgang mit KI bringt nichts"

Interview

5 Minuten

19.04.2023

Portrait von Nick Sohnemann

Die künstliche Erzeugung menschlicher Stimmen, personalisierte Musikempfehlungen und virtuelle Moderator:nnen – Künstliche Intelligenz schickt sich an, auch die Audiobranche massiv zu verändern. Nick Sohnemann (Foto) ist Chef der Innovationsagentur Future Candy und Keynote Speaker auf dem Radio Advertising Summit. Ein Gespräch über Trends im Audiobereich, die Zukunft von Live-Events und die Frage, ob der "Babelfisch" bald Wirklichkeit wird.

Nick, wenn Du einen Blick in die Zukunft von Audio wirfst: Welche Trends zeichnen sich gerade ab. Ist das die „Screen Fatigue“?

Nick Sohnemann:  Das Thema Screen Fatigue trägt in der Tat dazu bei, dass sich Audio in den letzten Jahren zu einem immer beliebteren Medium entwickelt hat. Die Menschen haben mit TikTok, Instagram und Co. ein Video-Überangebot, sodass sich wieder mehr zu Audio hinwenden. Das sieht man zum Beispiel an der steigenden Beliebtheit von Podcasts. Immer mehr Menschen hören sich Podcasts an, sei es auf dem Weg zur Arbeit, beim Sport oder einfach nur zu Hause. Das liegt zum einen daran, weil es eine große Bandbreite an Themen gibt, die durch Podcasts abgedeckt werden und zum anderen daran, weil es sehr einfach geworden ist, Podcasts zu produzieren und zu verbreiten.

Ihr habt ja auch einen, nennt sich „Future Candy“…

Sohnemann: Genau, der Innovations-Podcast befasst sich mit den heißesten Innovationstrends. Dabei treffe ich spannende Persönlichkeiten aus der Tech-Branche und unterhalte mich über deren Leidenschaft zur Innovation.

Aber nochmal zurück zu den Audiotrends…

Sohnemann: Ein weiterer Trend im Audiobereich ist die Verbreitung von Sprachassistenten wie zum Beispiel Amazon Echo oder Google Home. Diese Geräte ermöglichen es den Nutzern, ganz einfach Musik zu hören, Hörbücher abzuspielen oder sich Nachrichten und Wettervorhersagen anzuhören, ohne dabei einen Bildschirm nutzen zu müssen. Livestreaming-Plattformen wie zum Beispiel Clubhouse oder Twitter Spaces – auch wenn diese aktuell an „Hype“ verlieren – stehen für den Wunsch des Publikums nach Live-Interaction. Diese Plattformen ermöglichen es den Nutzern, in Echtzeit an Diskussionen, Vorträgen oder Gesprächen teilzunehmen, sich nur auf den Inhalt und die Stimmen zu konzentrieren, ohne visuell abgelenkt zu werden.

Ein großes Thema ist derzeit KI. Dass Software in der Lage ist, annehmbare Songs zu schreiben, ist schon länger bekannt. Wo aber hat KI das Potenzial, die Audio-Branche kräftig durcheinander zu wirbeln?

Sohnemann: Es gibt noch deutlich mehr Anwendungsbereiche, in denen KI in der Audiobranche eingesetzt werden kann. Ein Anwendungsgebiet von KI im Audiobereich ist die automatische Erstellung von Sprachsynthese. Hierbei wird eine Software eingesetzt, um menschenähnliche Stimmen und Sprachmuster zu erzeugen. Diese Technologie wird bereits heute von Unternehmen genutzt, um automatisierte Telefonanrufe oder Sprachassistenten mit einer natürlicheren Sprachausgabe auszustatten. Dabei spreche ich nicht nur von Alexa und Siri. Unternehmen wie IBM benutzen solche Speech-Bots in ihrem Kundenservice.

Wie steht es mit der Personalisierung?

Sohnemann: Auch ein riesiges Thema. Eine Streaming-Plattform kann KI-gestützte Algorithmen einsetzen, um personalisierte Musikempfehlungen auf Basis des bisherigen Hörverhaltens des Nutzers zu generieren. KI wird zudem schon lange in der Produktion von Audioinhalten angewendet und wird auch immer weiter ausgebaut: So kann KI die Audioqualität verbessern, indem Algorithmen eingesetzt werden, um Störgeräusche zu reduzieren oder um die Klangqualität von Sprachaufnahmen zu verbessern. KI wird auch genutzt, um Audioinhalte zu transkribieren und zu übersetzen. So können Unternehmen ihre Audioinhalte auf einfache und vor allem schnelle Weise in verschiedene Sprachen übersetzen und somit ein internationales Publikum erreichen.

Mit welchen weiteren Entwicklungen rechnest Du? 

Sohnemann: Ich kann vorstellen, dass unsere Audiowahrnehmung zukünftig noch eine viel stärkere Rolle bei der Thematik Augmented Reality spielen wird. Wir sprechen gerne von der Zukunft des Metaversums und virtuellen Realität. Durch die fortschreitende Entwicklung von VR-Technologien werden virtuelle Konzerte und Live-Events immer realistischer und interaktiver. Nutzer werden Nutzer in der Lage sein, Musik auf eine völlig neue Art und Weise zu erleben. Aber stell Dir auch eine reale Welt vor, in der Du dich mit jedem – egal welche Sprache gesprochen wird – unterhalten kannst. Stell Dir vor, Du trägst In-Ear Kopfhörer und die gesprochene Sprache deines Gegenübers wird in Echtzeit für Dich übersetzt und andersrum. 

Gewissermaßen der Babelfisch aus „Der Anhalter durch die Galaxis“...

Sohnemann: So ungefähr (lacht). Oder stell Dir vor, Du bist in einem lauten Restaurant und hast Schwierigkeiten, Dein Gegenüber zu verstehen. Mit einem Tipp auf Deine Kopfhörer könntest Du die Umgebungsgeräusche minimieren, damit Du Dich nur auf die Stimme Deines Gesprächspartners fokussieren kannst. Vorhin habe ich ja auch vom Bedarf an Live-Interaktionen des Publikums gesprochen. In Zukunft sehe ich deshalb interaktive Audioinhalte. So können beispielsweise Hörer in Podcasts direkt mit den Moderatoren interagieren oder in Hörspielen eigene Entscheidungen treffen und somit die Handlung beeinflussen.

Wird es bald virtuelle Moderator:innen geben?

Sohnemann: Die gibt es jetzt schon. Zwar noch nicht im großen Stil. Aber die Hessische/Niedersächsische Allgemeine (HNA) macht zum Beispiel einen Nachrichtenüberblick als Podcast, dessen Sprecher und Sprecherinnen durch KI-Stimmen eingesprochen werden. Wenn wir uns TV Moderator:innen anschauen, gibt es sogar aktuelle Use Cases: Der chinesische Nachrichtensender Xinhua hat 2018 einen virtuellen Nachrichtensprecher namens "AI Anchor" präsentiert. Der AI Anchor ist ein virtueller Moderator, der mithilfe von Künstlicher Intelligenz und Motion-Capture-Technologie erstellt wurde. Er kann Nachrichten in Echtzeit präsentieren und in verschiedenen Sprachen sprechen. Die japanische Firma Gatebox entwickelt lebensgroße „Holographic Communication Robots“, das sind Alexa-ähnliche Sprach-Assistents jedoch als Hologram. Zukünftig können solche holografischen Roboter als virtuelle Moderator:innen bei Events und Veranstaltungen eingesetzt werden.

Werden virtuelle Moderatoren die menschlichen bald ersetzen?

Sohnemann: Das ist fraglich. Viele Zuschauer bevorzugen menschliche Moderatoren, die Emotionen und Empathie zeigen und eine persönliche Verbindung zu ihrem Publikum aufbauen können. Virtuelle Moderatoren könnten aber in bestimmten Situationen nützlich sein, beispielsweise bei der Präsentation von komplexen Daten und Informationen.

Welche Reaktionen stellst Du bei Vertretern der Radiobranche fest: Wird KI als willkommenes Innovationsthema gesehen?

Sohnemann: Ich denke, dass die Resonanz für KI in der Radiobranche insgesamt recht positiv ist. Viele Vertreter der Radiobranche sehen KI als willkommenes Innovationsthema und erkennen die Vorteile, die sich durch den Einsatz von KI ergeben können. Die unendlichen Anwendungsbereiche in der Produktion, in der Veröffentlichung und auch in der Vermarktung von Audioinhalten wird gesehen und angenommen. Letztlich nimmt KI vielen Produzenten Arbeit ab oder erleichtert sie. Natürlich gibt es aber auch einige Bedenken und Herausforderungen, beispielsweise in Bezug auf Datenschutz und Ethik. Nicht alles, was eine KI produziert, ist richtig. Die Zuverlässigkeit und Integrität von KI im Einsatz muss durch kritische Datenanalyse durch Menschen überprüft werden.

Was ist Dein Tipp an die großen Sender?

Sohnemann: Ich habe das Gefühl, dass gerade große Institutionen sich schwer damit tun, Innovationen bei sich einzubinden. KI gehört da genauso dazu wie Augmented Reality oder Metaverse.  Es braucht mehr Anreize, dass gerade die großen Unternehmen und Sender offen dafür sind, ihre Strategien und Geschäftsmodelle den aktuellen Entwicklungen anzupassen und sie zu erweitern, um mit der sich schnell verändernden Technologie und dem veränderten Nutzerverhalten Schritt zu halten. Natürlich sollten sie aber auch die Auswirkungen und Herausforderungen durch KI berücksichtigen. Blind KI einfügen, weil es gerade Trend ist, bringt nichts. KI-Systeme ersetzen keine Menschen!

Ganz kurz noch: Wo ist der Mensch der im im Radio überlegen?

Sohnemann: Ich denke, dass wichtige Faktoren im Radio die Wärme und Emotionalität einer menschlichen Stimme sind. Radiosender sollten sich bewusst sein, dass das persönliche und emotionale Element in der Radiobranche eine wichtige Rolle spielt und von vielen Hörern geschätzt wird. Der Einsatz von KI sollte daher nicht dazu führen, dass die Menschlichkeit in der Radiobranche verloren geht.

Das Interview führte Helmut van Rinsum

Nick Sohnemann ist Gründer und Managing Director der Hamburger Innovationsagentur Future Candy und einer der führenden Experten Europas im Bereich Trend- und Innovationsforschung. Zudem ist er ein gefragter Keynote Speaker.

Weitere Interviews: 
Patrick Bunk: Corporate Intelligence – Frühwarnsystem mit KI
Andrea Anders: Verlage sollten sich mit Robotic Journalism auseinandersetzen
Alexander Siebert: KI wird die Contenterstellung verändern

"Ein blinder Umgang mit KI bringt nichts"

Interview

5 Minuten

19.04.2023

Portrait von Nick Sohnemann

Die künstliche Erzeugung menschlicher Stimmen, personalisierte Musikempfehlungen und virtuelle Moderator:nnen – Künstliche Intelligenz schickt sich an, auch die Audiobranche massiv zu verändern. Nick Sohnemann (Foto) ist Chef der Innovationsagentur Future Candy und Keynote Speaker auf dem Radio Advertising Summit. Ein Gespräch über Trends im Audiobereich, die Zukunft von Live-Events und die Frage, ob der "Babelfisch" bald Wirklichkeit wird.

Nick, wenn Du einen Blick in die Zukunft von Audio wirfst: Welche Trends zeichnen sich gerade ab. Ist das die „Screen Fatigue“?

Nick Sohnemann:  Das Thema Screen Fatigue trägt in der Tat dazu bei, dass sich Audio in den letzten Jahren zu einem immer beliebteren Medium entwickelt hat. Die Menschen haben mit TikTok, Instagram und Co. ein Video-Überangebot, sodass sich wieder mehr zu Audio hinwenden. Das sieht man zum Beispiel an der steigenden Beliebtheit von Podcasts. Immer mehr Menschen hören sich Podcasts an, sei es auf dem Weg zur Arbeit, beim Sport oder einfach nur zu Hause. Das liegt zum einen daran, weil es eine große Bandbreite an Themen gibt, die durch Podcasts abgedeckt werden und zum anderen daran, weil es sehr einfach geworden ist, Podcasts zu produzieren und zu verbreiten.

Ihr habt ja auch einen, nennt sich „Future Candy“…

Sohnemann: Genau, der Innovations-Podcast befasst sich mit den heißesten Innovationstrends. Dabei treffe ich spannende Persönlichkeiten aus der Tech-Branche und unterhalte mich über deren Leidenschaft zur Innovation.

Aber nochmal zurück zu den Audiotrends…

Sohnemann: Ein weiterer Trend im Audiobereich ist die Verbreitung von Sprachassistenten wie zum Beispiel Amazon Echo oder Google Home. Diese Geräte ermöglichen es den Nutzern, ganz einfach Musik zu hören, Hörbücher abzuspielen oder sich Nachrichten und Wettervorhersagen anzuhören, ohne dabei einen Bildschirm nutzen zu müssen. Livestreaming-Plattformen wie zum Beispiel Clubhouse oder Twitter Spaces – auch wenn diese aktuell an „Hype“ verlieren – stehen für den Wunsch des Publikums nach Live-Interaction. Diese Plattformen ermöglichen es den Nutzern, in Echtzeit an Diskussionen, Vorträgen oder Gesprächen teilzunehmen, sich nur auf den Inhalt und die Stimmen zu konzentrieren, ohne visuell abgelenkt zu werden.

Ein großes Thema ist derzeit KI. Dass Software in der Lage ist, annehmbare Songs zu schreiben, ist schon länger bekannt. Wo aber hat KI das Potenzial, die Audio-Branche kräftig durcheinander zu wirbeln?

Sohnemann: Es gibt noch deutlich mehr Anwendungsbereiche, in denen KI in der Audiobranche eingesetzt werden kann. Ein Anwendungsgebiet von KI im Audiobereich ist die automatische Erstellung von Sprachsynthese. Hierbei wird eine Software eingesetzt, um menschenähnliche Stimmen und Sprachmuster zu erzeugen. Diese Technologie wird bereits heute von Unternehmen genutzt, um automatisierte Telefonanrufe oder Sprachassistenten mit einer natürlicheren Sprachausgabe auszustatten. Dabei spreche ich nicht nur von Alexa und Siri. Unternehmen wie IBM benutzen solche Speech-Bots in ihrem Kundenservice.

Wie steht es mit der Personalisierung?

Sohnemann: Auch ein riesiges Thema. Eine Streaming-Plattform kann KI-gestützte Algorithmen einsetzen, um personalisierte Musikempfehlungen auf Basis des bisherigen Hörverhaltens des Nutzers zu generieren. KI wird zudem schon lange in der Produktion von Audioinhalten angewendet und wird auch immer weiter ausgebaut: So kann KI die Audioqualität verbessern, indem Algorithmen eingesetzt werden, um Störgeräusche zu reduzieren oder um die Klangqualität von Sprachaufnahmen zu verbessern. KI wird auch genutzt, um Audioinhalte zu transkribieren und zu übersetzen. So können Unternehmen ihre Audioinhalte auf einfache und vor allem schnelle Weise in verschiedene Sprachen übersetzen und somit ein internationales Publikum erreichen.

Mit welchen weiteren Entwicklungen rechnest Du? 

Sohnemann: Ich kann vorstellen, dass unsere Audiowahrnehmung zukünftig noch eine viel stärkere Rolle bei der Thematik Augmented Reality spielen wird. Wir sprechen gerne von der Zukunft des Metaversums und virtuellen Realität. Durch die fortschreitende Entwicklung von VR-Technologien werden virtuelle Konzerte und Live-Events immer realistischer und interaktiver. Nutzer werden Nutzer in der Lage sein, Musik auf eine völlig neue Art und Weise zu erleben. Aber stell Dir auch eine reale Welt vor, in der Du dich mit jedem – egal welche Sprache gesprochen wird – unterhalten kannst. Stell Dir vor, Du trägst In-Ear Kopfhörer und die gesprochene Sprache deines Gegenübers wird in Echtzeit für Dich übersetzt und andersrum. 

Gewissermaßen der Babelfisch aus „Der Anhalter durch die Galaxis“...

Sohnemann: So ungefähr (lacht). Oder stell Dir vor, Du bist in einem lauten Restaurant und hast Schwierigkeiten, Dein Gegenüber zu verstehen. Mit einem Tipp auf Deine Kopfhörer könntest Du die Umgebungsgeräusche minimieren, damit Du Dich nur auf die Stimme Deines Gesprächspartners fokussieren kannst. Vorhin habe ich ja auch vom Bedarf an Live-Interaktionen des Publikums gesprochen. In Zukunft sehe ich deshalb interaktive Audioinhalte. So können beispielsweise Hörer in Podcasts direkt mit den Moderatoren interagieren oder in Hörspielen eigene Entscheidungen treffen und somit die Handlung beeinflussen.

Wird es bald virtuelle Moderator:innen geben?

Sohnemann: Die gibt es jetzt schon. Zwar noch nicht im großen Stil. Aber die Hessische/Niedersächsische Allgemeine (HNA) macht zum Beispiel einen Nachrichtenüberblick als Podcast, dessen Sprecher und Sprecherinnen durch KI-Stimmen eingesprochen werden. Wenn wir uns TV Moderator:innen anschauen, gibt es sogar aktuelle Use Cases: Der chinesische Nachrichtensender Xinhua hat 2018 einen virtuellen Nachrichtensprecher namens "AI Anchor" präsentiert. Der AI Anchor ist ein virtueller Moderator, der mithilfe von Künstlicher Intelligenz und Motion-Capture-Technologie erstellt wurde. Er kann Nachrichten in Echtzeit präsentieren und in verschiedenen Sprachen sprechen. Die japanische Firma Gatebox entwickelt lebensgroße „Holographic Communication Robots“, das sind Alexa-ähnliche Sprach-Assistents jedoch als Hologram. Zukünftig können solche holografischen Roboter als virtuelle Moderator:innen bei Events und Veranstaltungen eingesetzt werden.

Werden virtuelle Moderatoren die menschlichen bald ersetzen?

Sohnemann: Das ist fraglich. Viele Zuschauer bevorzugen menschliche Moderatoren, die Emotionen und Empathie zeigen und eine persönliche Verbindung zu ihrem Publikum aufbauen können. Virtuelle Moderatoren könnten aber in bestimmten Situationen nützlich sein, beispielsweise bei der Präsentation von komplexen Daten und Informationen.

Welche Reaktionen stellst Du bei Vertretern der Radiobranche fest: Wird KI als willkommenes Innovationsthema gesehen?

Sohnemann: Ich denke, dass die Resonanz für KI in der Radiobranche insgesamt recht positiv ist. Viele Vertreter der Radiobranche sehen KI als willkommenes Innovationsthema und erkennen die Vorteile, die sich durch den Einsatz von KI ergeben können. Die unendlichen Anwendungsbereiche in der Produktion, in der Veröffentlichung und auch in der Vermarktung von Audioinhalten wird gesehen und angenommen. Letztlich nimmt KI vielen Produzenten Arbeit ab oder erleichtert sie. Natürlich gibt es aber auch einige Bedenken und Herausforderungen, beispielsweise in Bezug auf Datenschutz und Ethik. Nicht alles, was eine KI produziert, ist richtig. Die Zuverlässigkeit und Integrität von KI im Einsatz muss durch kritische Datenanalyse durch Menschen überprüft werden.

Was ist Dein Tipp an die großen Sender?

Sohnemann: Ich habe das Gefühl, dass gerade große Institutionen sich schwer damit tun, Innovationen bei sich einzubinden. KI gehört da genauso dazu wie Augmented Reality oder Metaverse.  Es braucht mehr Anreize, dass gerade die großen Unternehmen und Sender offen dafür sind, ihre Strategien und Geschäftsmodelle den aktuellen Entwicklungen anzupassen und sie zu erweitern, um mit der sich schnell verändernden Technologie und dem veränderten Nutzerverhalten Schritt zu halten. Natürlich sollten sie aber auch die Auswirkungen und Herausforderungen durch KI berücksichtigen. Blind KI einfügen, weil es gerade Trend ist, bringt nichts. KI-Systeme ersetzen keine Menschen!

Ganz kurz noch: Wo ist der Mensch der im im Radio überlegen?

Sohnemann: Ich denke, dass wichtige Faktoren im Radio die Wärme und Emotionalität einer menschlichen Stimme sind. Radiosender sollten sich bewusst sein, dass das persönliche und emotionale Element in der Radiobranche eine wichtige Rolle spielt und von vielen Hörern geschätzt wird. Der Einsatz von KI sollte daher nicht dazu führen, dass die Menschlichkeit in der Radiobranche verloren geht.

Das Interview führte Helmut van Rinsum

Nick Sohnemann ist Gründer und Managing Director der Hamburger Innovationsagentur Future Candy und einer der führenden Experten Europas im Bereich Trend- und Innovationsforschung. Zudem ist er ein gefragter Keynote Speaker.

Weitere Interviews: 
Patrick Bunk: Corporate Intelligence – Frühwarnsystem mit KI
Andrea Anders: Verlage sollten sich mit Robotic Journalism auseinandersetzen
Alexander Siebert: KI wird die Contenterstellung verändern

"Ein blinder Umgang mit KI bringt nichts"

Interview

5 Minuten

19.04.2023

Portrait von Nick Sohnemann

Die künstliche Erzeugung menschlicher Stimmen, personalisierte Musikempfehlungen und virtuelle Moderator:nnen – Künstliche Intelligenz schickt sich an, auch die Audiobranche massiv zu verändern. Nick Sohnemann (Foto) ist Chef der Innovationsagentur Future Candy und Keynote Speaker auf dem Radio Advertising Summit. Ein Gespräch über Trends im Audiobereich, die Zukunft von Live-Events und die Frage, ob der "Babelfisch" bald Wirklichkeit wird.

Nick, wenn Du einen Blick in die Zukunft von Audio wirfst: Welche Trends zeichnen sich gerade ab. Ist das die „Screen Fatigue“?

Nick Sohnemann:  Das Thema Screen Fatigue trägt in der Tat dazu bei, dass sich Audio in den letzten Jahren zu einem immer beliebteren Medium entwickelt hat. Die Menschen haben mit TikTok, Instagram und Co. ein Video-Überangebot, sodass sich wieder mehr zu Audio hinwenden. Das sieht man zum Beispiel an der steigenden Beliebtheit von Podcasts. Immer mehr Menschen hören sich Podcasts an, sei es auf dem Weg zur Arbeit, beim Sport oder einfach nur zu Hause. Das liegt zum einen daran, weil es eine große Bandbreite an Themen gibt, die durch Podcasts abgedeckt werden und zum anderen daran, weil es sehr einfach geworden ist, Podcasts zu produzieren und zu verbreiten.

Ihr habt ja auch einen, nennt sich „Future Candy“…

Sohnemann: Genau, der Innovations-Podcast befasst sich mit den heißesten Innovationstrends. Dabei treffe ich spannende Persönlichkeiten aus der Tech-Branche und unterhalte mich über deren Leidenschaft zur Innovation.

Aber nochmal zurück zu den Audiotrends…

Sohnemann: Ein weiterer Trend im Audiobereich ist die Verbreitung von Sprachassistenten wie zum Beispiel Amazon Echo oder Google Home. Diese Geräte ermöglichen es den Nutzern, ganz einfach Musik zu hören, Hörbücher abzuspielen oder sich Nachrichten und Wettervorhersagen anzuhören, ohne dabei einen Bildschirm nutzen zu müssen. Livestreaming-Plattformen wie zum Beispiel Clubhouse oder Twitter Spaces – auch wenn diese aktuell an „Hype“ verlieren – stehen für den Wunsch des Publikums nach Live-Interaction. Diese Plattformen ermöglichen es den Nutzern, in Echtzeit an Diskussionen, Vorträgen oder Gesprächen teilzunehmen, sich nur auf den Inhalt und die Stimmen zu konzentrieren, ohne visuell abgelenkt zu werden.

Ein großes Thema ist derzeit KI. Dass Software in der Lage ist, annehmbare Songs zu schreiben, ist schon länger bekannt. Wo aber hat KI das Potenzial, die Audio-Branche kräftig durcheinander zu wirbeln?

Sohnemann: Es gibt noch deutlich mehr Anwendungsbereiche, in denen KI in der Audiobranche eingesetzt werden kann. Ein Anwendungsgebiet von KI im Audiobereich ist die automatische Erstellung von Sprachsynthese. Hierbei wird eine Software eingesetzt, um menschenähnliche Stimmen und Sprachmuster zu erzeugen. Diese Technologie wird bereits heute von Unternehmen genutzt, um automatisierte Telefonanrufe oder Sprachassistenten mit einer natürlicheren Sprachausgabe auszustatten. Dabei spreche ich nicht nur von Alexa und Siri. Unternehmen wie IBM benutzen solche Speech-Bots in ihrem Kundenservice.

Wie steht es mit der Personalisierung?

Sohnemann: Auch ein riesiges Thema. Eine Streaming-Plattform kann KI-gestützte Algorithmen einsetzen, um personalisierte Musikempfehlungen auf Basis des bisherigen Hörverhaltens des Nutzers zu generieren. KI wird zudem schon lange in der Produktion von Audioinhalten angewendet und wird auch immer weiter ausgebaut: So kann KI die Audioqualität verbessern, indem Algorithmen eingesetzt werden, um Störgeräusche zu reduzieren oder um die Klangqualität von Sprachaufnahmen zu verbessern. KI wird auch genutzt, um Audioinhalte zu transkribieren und zu übersetzen. So können Unternehmen ihre Audioinhalte auf einfache und vor allem schnelle Weise in verschiedene Sprachen übersetzen und somit ein internationales Publikum erreichen.

Mit welchen weiteren Entwicklungen rechnest Du? 

Sohnemann: Ich kann vorstellen, dass unsere Audiowahrnehmung zukünftig noch eine viel stärkere Rolle bei der Thematik Augmented Reality spielen wird. Wir sprechen gerne von der Zukunft des Metaversums und virtuellen Realität. Durch die fortschreitende Entwicklung von VR-Technologien werden virtuelle Konzerte und Live-Events immer realistischer und interaktiver. Nutzer werden Nutzer in der Lage sein, Musik auf eine völlig neue Art und Weise zu erleben. Aber stell Dir auch eine reale Welt vor, in der Du dich mit jedem – egal welche Sprache gesprochen wird – unterhalten kannst. Stell Dir vor, Du trägst In-Ear Kopfhörer und die gesprochene Sprache deines Gegenübers wird in Echtzeit für Dich übersetzt und andersrum. 

Gewissermaßen der Babelfisch aus „Der Anhalter durch die Galaxis“...

Sohnemann: So ungefähr (lacht). Oder stell Dir vor, Du bist in einem lauten Restaurant und hast Schwierigkeiten, Dein Gegenüber zu verstehen. Mit einem Tipp auf Deine Kopfhörer könntest Du die Umgebungsgeräusche minimieren, damit Du Dich nur auf die Stimme Deines Gesprächspartners fokussieren kannst. Vorhin habe ich ja auch vom Bedarf an Live-Interaktionen des Publikums gesprochen. In Zukunft sehe ich deshalb interaktive Audioinhalte. So können beispielsweise Hörer in Podcasts direkt mit den Moderatoren interagieren oder in Hörspielen eigene Entscheidungen treffen und somit die Handlung beeinflussen.

Wird es bald virtuelle Moderator:innen geben?

Sohnemann: Die gibt es jetzt schon. Zwar noch nicht im großen Stil. Aber die Hessische/Niedersächsische Allgemeine (HNA) macht zum Beispiel einen Nachrichtenüberblick als Podcast, dessen Sprecher und Sprecherinnen durch KI-Stimmen eingesprochen werden. Wenn wir uns TV Moderator:innen anschauen, gibt es sogar aktuelle Use Cases: Der chinesische Nachrichtensender Xinhua hat 2018 einen virtuellen Nachrichtensprecher namens "AI Anchor" präsentiert. Der AI Anchor ist ein virtueller Moderator, der mithilfe von Künstlicher Intelligenz und Motion-Capture-Technologie erstellt wurde. Er kann Nachrichten in Echtzeit präsentieren und in verschiedenen Sprachen sprechen. Die japanische Firma Gatebox entwickelt lebensgroße „Holographic Communication Robots“, das sind Alexa-ähnliche Sprach-Assistents jedoch als Hologram. Zukünftig können solche holografischen Roboter als virtuelle Moderator:innen bei Events und Veranstaltungen eingesetzt werden.

Werden virtuelle Moderatoren die menschlichen bald ersetzen?

Sohnemann: Das ist fraglich. Viele Zuschauer bevorzugen menschliche Moderatoren, die Emotionen und Empathie zeigen und eine persönliche Verbindung zu ihrem Publikum aufbauen können. Virtuelle Moderatoren könnten aber in bestimmten Situationen nützlich sein, beispielsweise bei der Präsentation von komplexen Daten und Informationen.

Welche Reaktionen stellst Du bei Vertretern der Radiobranche fest: Wird KI als willkommenes Innovationsthema gesehen?

Sohnemann: Ich denke, dass die Resonanz für KI in der Radiobranche insgesamt recht positiv ist. Viele Vertreter der Radiobranche sehen KI als willkommenes Innovationsthema und erkennen die Vorteile, die sich durch den Einsatz von KI ergeben können. Die unendlichen Anwendungsbereiche in der Produktion, in der Veröffentlichung und auch in der Vermarktung von Audioinhalten wird gesehen und angenommen. Letztlich nimmt KI vielen Produzenten Arbeit ab oder erleichtert sie. Natürlich gibt es aber auch einige Bedenken und Herausforderungen, beispielsweise in Bezug auf Datenschutz und Ethik. Nicht alles, was eine KI produziert, ist richtig. Die Zuverlässigkeit und Integrität von KI im Einsatz muss durch kritische Datenanalyse durch Menschen überprüft werden.

Was ist Dein Tipp an die großen Sender?

Sohnemann: Ich habe das Gefühl, dass gerade große Institutionen sich schwer damit tun, Innovationen bei sich einzubinden. KI gehört da genauso dazu wie Augmented Reality oder Metaverse.  Es braucht mehr Anreize, dass gerade die großen Unternehmen und Sender offen dafür sind, ihre Strategien und Geschäftsmodelle den aktuellen Entwicklungen anzupassen und sie zu erweitern, um mit der sich schnell verändernden Technologie und dem veränderten Nutzerverhalten Schritt zu halten. Natürlich sollten sie aber auch die Auswirkungen und Herausforderungen durch KI berücksichtigen. Blind KI einfügen, weil es gerade Trend ist, bringt nichts. KI-Systeme ersetzen keine Menschen!

Ganz kurz noch: Wo ist der Mensch der im im Radio überlegen?

Sohnemann: Ich denke, dass wichtige Faktoren im Radio die Wärme und Emotionalität einer menschlichen Stimme sind. Radiosender sollten sich bewusst sein, dass das persönliche und emotionale Element in der Radiobranche eine wichtige Rolle spielt und von vielen Hörern geschätzt wird. Der Einsatz von KI sollte daher nicht dazu führen, dass die Menschlichkeit in der Radiobranche verloren geht.

Das Interview führte Helmut van Rinsum

Nick Sohnemann ist Gründer und Managing Director der Hamburger Innovationsagentur Future Candy und einer der führenden Experten Europas im Bereich Trend- und Innovationsforschung. Zudem ist er ein gefragter Keynote Speaker.

Weitere Interviews: 
Patrick Bunk: Corporate Intelligence – Frühwarnsystem mit KI
Andrea Anders: Verlage sollten sich mit Robotic Journalism auseinandersetzen
Alexander Siebert: KI wird die Contenterstellung verändern

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.