"Bald haben alle ihre eigenen Sprachassistenten"

Interview

5 Minuten

31.05.2021

Helmut van Rinsum

Portrait von Raphael Schaad

Der Voice-Markt entwickelt sich rasant. Raphael Schaad, Gründer des International Voice Technology Institute, glaubt, dass wir schon bald mit Dutzenden, unterschiedlichen Sprachassistenten kommunizieren werden. Ein Gespräch über "Eyes-Free-Momente", Voice-Angebote in der Nische und die Frage, warum Unternehmen in diesem boomenden Markt so zögerlich agieren.

Raphael, Du bist Smartspeaker-Pionier der ersten Stunde: Kurz vorneweg – Alexa oder besser Google Assistant?

Raphael Schaad: Wenn ich mich entscheiden müsste, dann Google Assistant. Vor allem, weil die Antworten auf konkrete Fragen besser sind und ich den Sprachassistenten parallel in Deutsch, Englisch und Schwedisch nutzen kann.

Du begleitest den Markt schon seit einigen Jahren. Welche Entwicklung haben Smartspeaker inzwischen vollzogen?

Schaad: Seit meinem ersten Echo Dot im Dezember 2016 ist der Markt erst rasant gewachsen. Das Wachstum scheint sich nun zu verlangsamen. Es scheint so, als seien die Fronten etwas verhärtet. Jeder hat sich eine Meinung gebildet. Entweder man versteht den Nutzen der Bequemlichkeit ohne Gerät in der Hand sowie der Geschwindigkeit oder man schwenkt die Datenschutzfahne, weil man den Nutzen eben aktuell nicht sieht. Das ist aber normal bei der Adaption von neuen Technologien. Dennoch bin ich nicht primär wegen Smartspeakern äußerst optimistisch für die Zukunft von Sprachassistenten, sondern wegen Kopfhörern, Autos, Smart-TVs, Smartphones, Receivern und Wearables. Smartspeaker werden eine gewisse Relevanz behalten, aber nur noch einen Bruchteil der Nutzung abkriegen. Schon jetzt nutzen mehr Menschen Sprachassistenten in Smartphones und Autos als in Smartspeakern.

Wie viel KI steckt inzwischen in den Geräten?

Schaad: In der Spracherkennung viel, in den Voice Apps von Drittanbietern wenig. Oft erleben wir bei unseren Auszubildenden eine gewisse Enttäuschung, wie wenig von sich aus schon funktioniert, da viele denken, KI klappt ohne Zutun.

Die Menschen nutzen Sprach-Assistenz-Systeme sehr eifrig. Man hat aber den Eindruck, dass Unternehmen bei dieser Entwicklung ein wenig hinterherhinken.

Schaad: Diese Einschätzung teile ich zu 100 Prozent. Ich denke, das liegt an verschiedenen Gründen. Zum einen ist der Druck nicht da, weil die Konkurrenz ja auch noch nichts gemacht hat. Das heißt, man macht lieber die Hausaufgaben in etablierteren digitalen Kanälen. Auf der anderen Seite sehen die Unternehmen oft nicht den Nutzen. Am ehesten erlebe ich das in Gesprächen mit Managern, die selbst keine Sprachassistenten nutzen. Sie wollen dann wissen, was diese Geräte können, was man nicht auch am Smartphone machen kann. Ich bin dann kein Missionar und nutze meine Energie lieber für die, die schon eine konkretere Vorstellung haben, anstatt das Unmögliche zu versuchen. Sie sind aktuell eben auf der anderen Seite der oben schon erwähnten verhärteten Front. Dennoch gibt es viele Entscheidungsträger, die auch offen sind für Voice und die man anstecken kann. Das macht dann umso mehr Freude.

Wo sind denn Deiner Meinung nach die sinnvollsten Einsatzfelder?

Schaad: Puh, darüber könnte ich ein Buch schreiben. Ich denke aber, die wichtigsten Konzepte sind Repetition, spielerische Inspiration, Hands-free-, Eyes-free-Momente und Personalisierung.

Konntest Du diese Konzepte genauer erläutern?

Schaad: Zu Repetition: Ein Gerät finden, es in die Hand nehmen, es entsperren, den Ablenkungen widerstehen, die richtige App öffnen, etwas eintippen, auf das Ergebnis warten und dann bestätigen, beziehungsweise lesen, dauert wesentlich länger als von überall einfach einen kurzen Sprachbefehl zu äußern. Das heißt alles, was man täglich oder sogar mehrfach täglich macht ist prädestiniert für Sprachassistenten.

Zu spielerischer Inspiration: Momentan hat Sprachsteuerung den Vorteil, dass alle Beteiligten noch lernen dürfen. Wenn mal ein Service nicht klappt, ist das schlecht, aber in den meisten Fällen nicht kritisch für das Geschäft. Die Nutzer sind es daher noch nicht gewohnt, alle Momente der Customer Journey per Sprache zu erledigen. Wenn ich zum Beispiel mein Geld zurück haben will oder ein Ticket umbuchen will, dann erwarte ich dies noch nicht per Sprache zu tun. Was wir aber regelmäßig schon tun, ist uns Informationen einzuholen, etwas zu spielen oder uns unterhalten zu lassen. Diese Aktivitäten passen sehr gut zu einer Content-Marketing-Strategie, die spielerisch inspiriert, die begeistert und recht weit oben im Marketing Funnel angesiedelt ist. Etwas Neues entdecken und ausprobieren. Beispielsweise ein Sample eines neuen Softdrinks per Sprache anfordern, wie es Fanta bereits gemacht hat, oder Winzer über ihren Wein der Woche berichten lassen mit der anschließenden Frage, wie viele Flaschen man bestellen will. Da ist viel im Entstehen aktuell.

Zu Hands-free-, Eyes-free-Momenten: Wir gewöhnen uns inzwischen daran, jederzeit mit der digitalen Welt verbunden zu sein. Mit den Augen auf der Straße oder der Hand am Küchenmesser ist das schwierig. In diesen Momenten ist Sprachsteuerung kein Add-On, sondern der aktuell einzige Wege, um parallel zu der Haupttätigkeit noch etwas nachzubestellen, einen Call-to-Action in einem Podcast auszuführen oder sich Informationen einzuholen.

Und zu Personalisierung: Wenn wir auf eine Website gehen, sind wir in der Regel nicht eingeloggt. Selbst Cookies können nicht mehr wirklich eingesetzt werden. Egal, wer auf die Website kommt, das Erlebnis, die Informationen sind identisch. In einer Voice Experience ist dies anders. Da ist klar, was derjenige das letzte Mal gewollt hat, und man kann vermuten, was er dieses Mal will. Man kann dem Nutzer somit viel schnell verhelfen, an sein Ziel zu kommen und ihm auch viel gezielter Angebote unterbreiten. Dieser Vorteil ist immens für Unternehmen und noch nicht annähernd ausgeschöpft.

Auch die Werbungtreibenden sind sehr zurückhaltend. Es macht den Eindruck, als wüssten sie nicht so recht, wie sie Smartspeaker in ihrer Marketingkonzepte einbinden könnten.

Schaad: Dabei fallen die Kosten für Werbung auf Smartspeakern durch den steigenden Audio-Konsum ständig. Der CPM oder, wie es in der Audio-Welt meistens heißt, TKP ist inzwischen im einstelligen Bereich. Früher musste man für Radio-Werbung noch das Dreifache zahlen. Und man hat die Gelegenheit, den Nutzer innerhalb von nicht-überspringbaren 30 Sekunden zu überzeugen. Versuch mal Nutzer im Schnitt 30 Sekunden auf einer Facebook Werbung zu halten…!

Du bildest über das International Voice Technology Insitute Interessierte zu Voice Consultants aus. Welche Aufgaben übernehmen sie anschließend in ihren Unternehmen? Wo besteht der größte Bedarf?

Schaad: Die größten Chancen stecken aktuell darin, selbstständig oder unternehmerisch tätig zu sein beziehungsweise werden. Es gibt Stellen in Voice-Agenturen und einige wenige in größeren Unternehmen. Meistens haben Voice-Projekte noch ein festes Enddatum und benötigen daher keine internen Mitarbeiter. Wir legen den Schwerpunkt in der Ausbildung daher auf Selbstständige und Wantrepreneurs, die sich auf ein Themenfeld spezialisieren und es bald danach dominieren können, da einfach bei weitem noch nicht alle Nischen besetzt sind. Viele lernen aber auch zukünftige Geschäftspartner kennen, schließen sich zusammen und nutzen ihre unterschiedlichen Fähigkeiten synergetisch.

Nimmt die Nachfrage nach dieser Ausbildung eigentlich zu?

Schaad: Da kann ich wenig zu sagen, da wir unseren Schwerpunkt nicht auf organischem Traffic haben. Die Teilnehmerzahlen haben sich im letzten halben Jahr zumindest fast verdoppelt, aber das hängt vor allem an dem gestiegenen Werbebudget.

Kurzer Blick in die Zukunft: Wird es für uns eines Tages selbstverständlich, dass wir nicht nur mit Alexa oder unserem Smartphone sprechen, sondern auch mit unserer Wohnungstür, unserem Auto und dem Kühlschrank?

Schaad: Vielleicht nicht alle und in jedem Fall nicht alle sofort, aber für manche ist dies schon heute Realität. Ich habe letztes Jahr in den USA mal mit dem Senior Developer Evangelist von Samsung Bixby gesprochen, der mit verraten hat, dass Kühlschränke ein zentraler Teil ihrer Voice-Strategie sind ­– neben Smartphones und Smart-TVs, wo Samsung schon eine immense Marktdurchdringung hat.

Auf welche Entwicklung im Bereich der Smartspeaker bist Du am meisten gespannt?

Schaad: Weniger im Bereich der Smartspeaker, diese sind für mich einer der uninteressantesten Teile des Voice-Marktes. Ich finde die Tatsache viel spannender, dass immer mehr Nischen-Sprachassistenten entwickelt werden. Es zeichnet sich ab, dass nicht ein Sprachassistent alle dominieren wird, sondern dass sie interoperabel sind. Dazu gibt es bereits diverse Think Tanks und erste Ergebnisse. Genauso wie aktuell der deutsche Sprachassistent Magenta der Telekom auch Amazon Alexa unterstützt werden wir irgendwann regelmäßig mit Dutzenden verschiedenen Sprachassistenten sprechen. Kein Wunder, dass Microsoft sich Nuance fast 20 Milliarden Dollar hat kosten lassen.

Auch Spotify wurde hier aktiv.

Schaad: Spotify hat gerade einen eigenen Sprachassistenten veröffentlicht. Der Sprachassistent der Bank of America geht durch die Decke und auch Hey Mercedes hat eine geniale User Experience. Der Vorteil für die Unternehmen ist, dass sie selbst mehr Daten erhalten und die Nutzer erleben eine viel bessere Spracherkennung, weil sich die Anfragen auf wenige Anwendungsfälle beschränken. Man verwendet eben Alexa zum Kauf von Windeln, aber den Google Assistant für allgemeine Fragen. Den Sprachassistenten des Autos für die Temperatursteuerung und „Hey Spotify“ für die Musik. So wie man von einem Gerät aus auf amazon.de etwas kaufen und auf google.de etwas suchen kann, so wird man von einer Hardware aus über die unterschiedlichen Sprachassistenten irgendwann unterschiedliche Dinge erledigen oder Informationen abfragen. Daher würde mich nicht wundern wenn AirBnB, booking.com, Uber und ähnliche Plattformen bald alle ihre eigenen Sprachassistenten haben. Das wird sehr aufregend.

Das Interview führte Helmut van Rinsum

Raphael Schaad ist Smartspeaker-Pionier der ersten Stunde und seit 2017 als Consultant für Sprachassistenten tätig. Er ist Gründer des International Voice Technology Institute, wo er Voice Consultants ausbildet, die Unternehmen in Bezug auf Voice Marketing, Voice SEO und Voice Commerce dann beraten können. Schaad ist Gastdozent am MCI in Innsbruck und Autor des Buchs "amazon alexa: Mehr als nur Wetter & Musik".

Weitere Interviews:
Gero Reiniger: KI im Kundenservice
Peter Kabel: Kreativberufe werden sich stark verändern
Andreas Stiegler: KI Übernimmt Aufgaben des Designers

"Bald haben alle ihre eigenen Sprachassistenten"

Interview

5 Minuten

31.05.2021

Helmut van Rinsum

Portrait von Raphael Schaad

Der Voice-Markt entwickelt sich rasant. Raphael Schaad, Gründer des International Voice Technology Institute, glaubt, dass wir schon bald mit Dutzenden, unterschiedlichen Sprachassistenten kommunizieren werden. Ein Gespräch über "Eyes-Free-Momente", Voice-Angebote in der Nische und die Frage, warum Unternehmen in diesem boomenden Markt so zögerlich agieren.

Raphael, Du bist Smartspeaker-Pionier der ersten Stunde: Kurz vorneweg – Alexa oder besser Google Assistant?

Raphael Schaad: Wenn ich mich entscheiden müsste, dann Google Assistant. Vor allem, weil die Antworten auf konkrete Fragen besser sind und ich den Sprachassistenten parallel in Deutsch, Englisch und Schwedisch nutzen kann.

Du begleitest den Markt schon seit einigen Jahren. Welche Entwicklung haben Smartspeaker inzwischen vollzogen?

Schaad: Seit meinem ersten Echo Dot im Dezember 2016 ist der Markt erst rasant gewachsen. Das Wachstum scheint sich nun zu verlangsamen. Es scheint so, als seien die Fronten etwas verhärtet. Jeder hat sich eine Meinung gebildet. Entweder man versteht den Nutzen der Bequemlichkeit ohne Gerät in der Hand sowie der Geschwindigkeit oder man schwenkt die Datenschutzfahne, weil man den Nutzen eben aktuell nicht sieht. Das ist aber normal bei der Adaption von neuen Technologien. Dennoch bin ich nicht primär wegen Smartspeakern äußerst optimistisch für die Zukunft von Sprachassistenten, sondern wegen Kopfhörern, Autos, Smart-TVs, Smartphones, Receivern und Wearables. Smartspeaker werden eine gewisse Relevanz behalten, aber nur noch einen Bruchteil der Nutzung abkriegen. Schon jetzt nutzen mehr Menschen Sprachassistenten in Smartphones und Autos als in Smartspeakern.

Wie viel KI steckt inzwischen in den Geräten?

Schaad: In der Spracherkennung viel, in den Voice Apps von Drittanbietern wenig. Oft erleben wir bei unseren Auszubildenden eine gewisse Enttäuschung, wie wenig von sich aus schon funktioniert, da viele denken, KI klappt ohne Zutun.

Die Menschen nutzen Sprach-Assistenz-Systeme sehr eifrig. Man hat aber den Eindruck, dass Unternehmen bei dieser Entwicklung ein wenig hinterherhinken.

Schaad: Diese Einschätzung teile ich zu 100 Prozent. Ich denke, das liegt an verschiedenen Gründen. Zum einen ist der Druck nicht da, weil die Konkurrenz ja auch noch nichts gemacht hat. Das heißt, man macht lieber die Hausaufgaben in etablierteren digitalen Kanälen. Auf der anderen Seite sehen die Unternehmen oft nicht den Nutzen. Am ehesten erlebe ich das in Gesprächen mit Managern, die selbst keine Sprachassistenten nutzen. Sie wollen dann wissen, was diese Geräte können, was man nicht auch am Smartphone machen kann. Ich bin dann kein Missionar und nutze meine Energie lieber für die, die schon eine konkretere Vorstellung haben, anstatt das Unmögliche zu versuchen. Sie sind aktuell eben auf der anderen Seite der oben schon erwähnten verhärteten Front. Dennoch gibt es viele Entscheidungsträger, die auch offen sind für Voice und die man anstecken kann. Das macht dann umso mehr Freude.

Wo sind denn Deiner Meinung nach die sinnvollsten Einsatzfelder?

Schaad: Puh, darüber könnte ich ein Buch schreiben. Ich denke aber, die wichtigsten Konzepte sind Repetition, spielerische Inspiration, Hands-free-, Eyes-free-Momente und Personalisierung.

Konntest Du diese Konzepte genauer erläutern?

Schaad: Zu Repetition: Ein Gerät finden, es in die Hand nehmen, es entsperren, den Ablenkungen widerstehen, die richtige App öffnen, etwas eintippen, auf das Ergebnis warten und dann bestätigen, beziehungsweise lesen, dauert wesentlich länger als von überall einfach einen kurzen Sprachbefehl zu äußern. Das heißt alles, was man täglich oder sogar mehrfach täglich macht ist prädestiniert für Sprachassistenten.

Zu spielerischer Inspiration: Momentan hat Sprachsteuerung den Vorteil, dass alle Beteiligten noch lernen dürfen. Wenn mal ein Service nicht klappt, ist das schlecht, aber in den meisten Fällen nicht kritisch für das Geschäft. Die Nutzer sind es daher noch nicht gewohnt, alle Momente der Customer Journey per Sprache zu erledigen. Wenn ich zum Beispiel mein Geld zurück haben will oder ein Ticket umbuchen will, dann erwarte ich dies noch nicht per Sprache zu tun. Was wir aber regelmäßig schon tun, ist uns Informationen einzuholen, etwas zu spielen oder uns unterhalten zu lassen. Diese Aktivitäten passen sehr gut zu einer Content-Marketing-Strategie, die spielerisch inspiriert, die begeistert und recht weit oben im Marketing Funnel angesiedelt ist. Etwas Neues entdecken und ausprobieren. Beispielsweise ein Sample eines neuen Softdrinks per Sprache anfordern, wie es Fanta bereits gemacht hat, oder Winzer über ihren Wein der Woche berichten lassen mit der anschließenden Frage, wie viele Flaschen man bestellen will. Da ist viel im Entstehen aktuell.

Zu Hands-free-, Eyes-free-Momenten: Wir gewöhnen uns inzwischen daran, jederzeit mit der digitalen Welt verbunden zu sein. Mit den Augen auf der Straße oder der Hand am Küchenmesser ist das schwierig. In diesen Momenten ist Sprachsteuerung kein Add-On, sondern der aktuell einzige Wege, um parallel zu der Haupttätigkeit noch etwas nachzubestellen, einen Call-to-Action in einem Podcast auszuführen oder sich Informationen einzuholen.

Und zu Personalisierung: Wenn wir auf eine Website gehen, sind wir in der Regel nicht eingeloggt. Selbst Cookies können nicht mehr wirklich eingesetzt werden. Egal, wer auf die Website kommt, das Erlebnis, die Informationen sind identisch. In einer Voice Experience ist dies anders. Da ist klar, was derjenige das letzte Mal gewollt hat, und man kann vermuten, was er dieses Mal will. Man kann dem Nutzer somit viel schnell verhelfen, an sein Ziel zu kommen und ihm auch viel gezielter Angebote unterbreiten. Dieser Vorteil ist immens für Unternehmen und noch nicht annähernd ausgeschöpft.

Auch die Werbungtreibenden sind sehr zurückhaltend. Es macht den Eindruck, als wüssten sie nicht so recht, wie sie Smartspeaker in ihrer Marketingkonzepte einbinden könnten.

Schaad: Dabei fallen die Kosten für Werbung auf Smartspeakern durch den steigenden Audio-Konsum ständig. Der CPM oder, wie es in der Audio-Welt meistens heißt, TKP ist inzwischen im einstelligen Bereich. Früher musste man für Radio-Werbung noch das Dreifache zahlen. Und man hat die Gelegenheit, den Nutzer innerhalb von nicht-überspringbaren 30 Sekunden zu überzeugen. Versuch mal Nutzer im Schnitt 30 Sekunden auf einer Facebook Werbung zu halten…!

Du bildest über das International Voice Technology Insitute Interessierte zu Voice Consultants aus. Welche Aufgaben übernehmen sie anschließend in ihren Unternehmen? Wo besteht der größte Bedarf?

Schaad: Die größten Chancen stecken aktuell darin, selbstständig oder unternehmerisch tätig zu sein beziehungsweise werden. Es gibt Stellen in Voice-Agenturen und einige wenige in größeren Unternehmen. Meistens haben Voice-Projekte noch ein festes Enddatum und benötigen daher keine internen Mitarbeiter. Wir legen den Schwerpunkt in der Ausbildung daher auf Selbstständige und Wantrepreneurs, die sich auf ein Themenfeld spezialisieren und es bald danach dominieren können, da einfach bei weitem noch nicht alle Nischen besetzt sind. Viele lernen aber auch zukünftige Geschäftspartner kennen, schließen sich zusammen und nutzen ihre unterschiedlichen Fähigkeiten synergetisch.

Nimmt die Nachfrage nach dieser Ausbildung eigentlich zu?

Schaad: Da kann ich wenig zu sagen, da wir unseren Schwerpunkt nicht auf organischem Traffic haben. Die Teilnehmerzahlen haben sich im letzten halben Jahr zumindest fast verdoppelt, aber das hängt vor allem an dem gestiegenen Werbebudget.

Kurzer Blick in die Zukunft: Wird es für uns eines Tages selbstverständlich, dass wir nicht nur mit Alexa oder unserem Smartphone sprechen, sondern auch mit unserer Wohnungstür, unserem Auto und dem Kühlschrank?

Schaad: Vielleicht nicht alle und in jedem Fall nicht alle sofort, aber für manche ist dies schon heute Realität. Ich habe letztes Jahr in den USA mal mit dem Senior Developer Evangelist von Samsung Bixby gesprochen, der mit verraten hat, dass Kühlschränke ein zentraler Teil ihrer Voice-Strategie sind ­– neben Smartphones und Smart-TVs, wo Samsung schon eine immense Marktdurchdringung hat.

Auf welche Entwicklung im Bereich der Smartspeaker bist Du am meisten gespannt?

Schaad: Weniger im Bereich der Smartspeaker, diese sind für mich einer der uninteressantesten Teile des Voice-Marktes. Ich finde die Tatsache viel spannender, dass immer mehr Nischen-Sprachassistenten entwickelt werden. Es zeichnet sich ab, dass nicht ein Sprachassistent alle dominieren wird, sondern dass sie interoperabel sind. Dazu gibt es bereits diverse Think Tanks und erste Ergebnisse. Genauso wie aktuell der deutsche Sprachassistent Magenta der Telekom auch Amazon Alexa unterstützt werden wir irgendwann regelmäßig mit Dutzenden verschiedenen Sprachassistenten sprechen. Kein Wunder, dass Microsoft sich Nuance fast 20 Milliarden Dollar hat kosten lassen.

Auch Spotify wurde hier aktiv.

Schaad: Spotify hat gerade einen eigenen Sprachassistenten veröffentlicht. Der Sprachassistent der Bank of America geht durch die Decke und auch Hey Mercedes hat eine geniale User Experience. Der Vorteil für die Unternehmen ist, dass sie selbst mehr Daten erhalten und die Nutzer erleben eine viel bessere Spracherkennung, weil sich die Anfragen auf wenige Anwendungsfälle beschränken. Man verwendet eben Alexa zum Kauf von Windeln, aber den Google Assistant für allgemeine Fragen. Den Sprachassistenten des Autos für die Temperatursteuerung und „Hey Spotify“ für die Musik. So wie man von einem Gerät aus auf amazon.de etwas kaufen und auf google.de etwas suchen kann, so wird man von einer Hardware aus über die unterschiedlichen Sprachassistenten irgendwann unterschiedliche Dinge erledigen oder Informationen abfragen. Daher würde mich nicht wundern wenn AirBnB, booking.com, Uber und ähnliche Plattformen bald alle ihre eigenen Sprachassistenten haben. Das wird sehr aufregend.

Das Interview führte Helmut van Rinsum

Raphael Schaad ist Smartspeaker-Pionier der ersten Stunde und seit 2017 als Consultant für Sprachassistenten tätig. Er ist Gründer des International Voice Technology Institute, wo er Voice Consultants ausbildet, die Unternehmen in Bezug auf Voice Marketing, Voice SEO und Voice Commerce dann beraten können. Schaad ist Gastdozent am MCI in Innsbruck und Autor des Buchs "amazon alexa: Mehr als nur Wetter & Musik".

Weitere Interviews:
Gero Reiniger: KI im Kundenservice
Peter Kabel: Kreativberufe werden sich stark verändern
Andreas Stiegler: KI Übernimmt Aufgaben des Designers

"Bald haben alle ihre eigenen Sprachassistenten"

Interview

5 Minuten

31.05.2021

Helmut van Rinsum

Portrait von Raphael Schaad

Der Voice-Markt entwickelt sich rasant. Raphael Schaad, Gründer des International Voice Technology Institute, glaubt, dass wir schon bald mit Dutzenden, unterschiedlichen Sprachassistenten kommunizieren werden. Ein Gespräch über "Eyes-Free-Momente", Voice-Angebote in der Nische und die Frage, warum Unternehmen in diesem boomenden Markt so zögerlich agieren.

Raphael, Du bist Smartspeaker-Pionier der ersten Stunde: Kurz vorneweg – Alexa oder besser Google Assistant?

Raphael Schaad: Wenn ich mich entscheiden müsste, dann Google Assistant. Vor allem, weil die Antworten auf konkrete Fragen besser sind und ich den Sprachassistenten parallel in Deutsch, Englisch und Schwedisch nutzen kann.

Du begleitest den Markt schon seit einigen Jahren. Welche Entwicklung haben Smartspeaker inzwischen vollzogen?

Schaad: Seit meinem ersten Echo Dot im Dezember 2016 ist der Markt erst rasant gewachsen. Das Wachstum scheint sich nun zu verlangsamen. Es scheint so, als seien die Fronten etwas verhärtet. Jeder hat sich eine Meinung gebildet. Entweder man versteht den Nutzen der Bequemlichkeit ohne Gerät in der Hand sowie der Geschwindigkeit oder man schwenkt die Datenschutzfahne, weil man den Nutzen eben aktuell nicht sieht. Das ist aber normal bei der Adaption von neuen Technologien. Dennoch bin ich nicht primär wegen Smartspeakern äußerst optimistisch für die Zukunft von Sprachassistenten, sondern wegen Kopfhörern, Autos, Smart-TVs, Smartphones, Receivern und Wearables. Smartspeaker werden eine gewisse Relevanz behalten, aber nur noch einen Bruchteil der Nutzung abkriegen. Schon jetzt nutzen mehr Menschen Sprachassistenten in Smartphones und Autos als in Smartspeakern.

Wie viel KI steckt inzwischen in den Geräten?

Schaad: In der Spracherkennung viel, in den Voice Apps von Drittanbietern wenig. Oft erleben wir bei unseren Auszubildenden eine gewisse Enttäuschung, wie wenig von sich aus schon funktioniert, da viele denken, KI klappt ohne Zutun.

Die Menschen nutzen Sprach-Assistenz-Systeme sehr eifrig. Man hat aber den Eindruck, dass Unternehmen bei dieser Entwicklung ein wenig hinterherhinken.

Schaad: Diese Einschätzung teile ich zu 100 Prozent. Ich denke, das liegt an verschiedenen Gründen. Zum einen ist der Druck nicht da, weil die Konkurrenz ja auch noch nichts gemacht hat. Das heißt, man macht lieber die Hausaufgaben in etablierteren digitalen Kanälen. Auf der anderen Seite sehen die Unternehmen oft nicht den Nutzen. Am ehesten erlebe ich das in Gesprächen mit Managern, die selbst keine Sprachassistenten nutzen. Sie wollen dann wissen, was diese Geräte können, was man nicht auch am Smartphone machen kann. Ich bin dann kein Missionar und nutze meine Energie lieber für die, die schon eine konkretere Vorstellung haben, anstatt das Unmögliche zu versuchen. Sie sind aktuell eben auf der anderen Seite der oben schon erwähnten verhärteten Front. Dennoch gibt es viele Entscheidungsträger, die auch offen sind für Voice und die man anstecken kann. Das macht dann umso mehr Freude.

Wo sind denn Deiner Meinung nach die sinnvollsten Einsatzfelder?

Schaad: Puh, darüber könnte ich ein Buch schreiben. Ich denke aber, die wichtigsten Konzepte sind Repetition, spielerische Inspiration, Hands-free-, Eyes-free-Momente und Personalisierung.

Konntest Du diese Konzepte genauer erläutern?

Schaad: Zu Repetition: Ein Gerät finden, es in die Hand nehmen, es entsperren, den Ablenkungen widerstehen, die richtige App öffnen, etwas eintippen, auf das Ergebnis warten und dann bestätigen, beziehungsweise lesen, dauert wesentlich länger als von überall einfach einen kurzen Sprachbefehl zu äußern. Das heißt alles, was man täglich oder sogar mehrfach täglich macht ist prädestiniert für Sprachassistenten.

Zu spielerischer Inspiration: Momentan hat Sprachsteuerung den Vorteil, dass alle Beteiligten noch lernen dürfen. Wenn mal ein Service nicht klappt, ist das schlecht, aber in den meisten Fällen nicht kritisch für das Geschäft. Die Nutzer sind es daher noch nicht gewohnt, alle Momente der Customer Journey per Sprache zu erledigen. Wenn ich zum Beispiel mein Geld zurück haben will oder ein Ticket umbuchen will, dann erwarte ich dies noch nicht per Sprache zu tun. Was wir aber regelmäßig schon tun, ist uns Informationen einzuholen, etwas zu spielen oder uns unterhalten zu lassen. Diese Aktivitäten passen sehr gut zu einer Content-Marketing-Strategie, die spielerisch inspiriert, die begeistert und recht weit oben im Marketing Funnel angesiedelt ist. Etwas Neues entdecken und ausprobieren. Beispielsweise ein Sample eines neuen Softdrinks per Sprache anfordern, wie es Fanta bereits gemacht hat, oder Winzer über ihren Wein der Woche berichten lassen mit der anschließenden Frage, wie viele Flaschen man bestellen will. Da ist viel im Entstehen aktuell.

Zu Hands-free-, Eyes-free-Momenten: Wir gewöhnen uns inzwischen daran, jederzeit mit der digitalen Welt verbunden zu sein. Mit den Augen auf der Straße oder der Hand am Küchenmesser ist das schwierig. In diesen Momenten ist Sprachsteuerung kein Add-On, sondern der aktuell einzige Wege, um parallel zu der Haupttätigkeit noch etwas nachzubestellen, einen Call-to-Action in einem Podcast auszuführen oder sich Informationen einzuholen.

Und zu Personalisierung: Wenn wir auf eine Website gehen, sind wir in der Regel nicht eingeloggt. Selbst Cookies können nicht mehr wirklich eingesetzt werden. Egal, wer auf die Website kommt, das Erlebnis, die Informationen sind identisch. In einer Voice Experience ist dies anders. Da ist klar, was derjenige das letzte Mal gewollt hat, und man kann vermuten, was er dieses Mal will. Man kann dem Nutzer somit viel schnell verhelfen, an sein Ziel zu kommen und ihm auch viel gezielter Angebote unterbreiten. Dieser Vorteil ist immens für Unternehmen und noch nicht annähernd ausgeschöpft.

Auch die Werbungtreibenden sind sehr zurückhaltend. Es macht den Eindruck, als wüssten sie nicht so recht, wie sie Smartspeaker in ihrer Marketingkonzepte einbinden könnten.

Schaad: Dabei fallen die Kosten für Werbung auf Smartspeakern durch den steigenden Audio-Konsum ständig. Der CPM oder, wie es in der Audio-Welt meistens heißt, TKP ist inzwischen im einstelligen Bereich. Früher musste man für Radio-Werbung noch das Dreifache zahlen. Und man hat die Gelegenheit, den Nutzer innerhalb von nicht-überspringbaren 30 Sekunden zu überzeugen. Versuch mal Nutzer im Schnitt 30 Sekunden auf einer Facebook Werbung zu halten…!

Du bildest über das International Voice Technology Insitute Interessierte zu Voice Consultants aus. Welche Aufgaben übernehmen sie anschließend in ihren Unternehmen? Wo besteht der größte Bedarf?

Schaad: Die größten Chancen stecken aktuell darin, selbstständig oder unternehmerisch tätig zu sein beziehungsweise werden. Es gibt Stellen in Voice-Agenturen und einige wenige in größeren Unternehmen. Meistens haben Voice-Projekte noch ein festes Enddatum und benötigen daher keine internen Mitarbeiter. Wir legen den Schwerpunkt in der Ausbildung daher auf Selbstständige und Wantrepreneurs, die sich auf ein Themenfeld spezialisieren und es bald danach dominieren können, da einfach bei weitem noch nicht alle Nischen besetzt sind. Viele lernen aber auch zukünftige Geschäftspartner kennen, schließen sich zusammen und nutzen ihre unterschiedlichen Fähigkeiten synergetisch.

Nimmt die Nachfrage nach dieser Ausbildung eigentlich zu?

Schaad: Da kann ich wenig zu sagen, da wir unseren Schwerpunkt nicht auf organischem Traffic haben. Die Teilnehmerzahlen haben sich im letzten halben Jahr zumindest fast verdoppelt, aber das hängt vor allem an dem gestiegenen Werbebudget.

Kurzer Blick in die Zukunft: Wird es für uns eines Tages selbstverständlich, dass wir nicht nur mit Alexa oder unserem Smartphone sprechen, sondern auch mit unserer Wohnungstür, unserem Auto und dem Kühlschrank?

Schaad: Vielleicht nicht alle und in jedem Fall nicht alle sofort, aber für manche ist dies schon heute Realität. Ich habe letztes Jahr in den USA mal mit dem Senior Developer Evangelist von Samsung Bixby gesprochen, der mit verraten hat, dass Kühlschränke ein zentraler Teil ihrer Voice-Strategie sind ­– neben Smartphones und Smart-TVs, wo Samsung schon eine immense Marktdurchdringung hat.

Auf welche Entwicklung im Bereich der Smartspeaker bist Du am meisten gespannt?

Schaad: Weniger im Bereich der Smartspeaker, diese sind für mich einer der uninteressantesten Teile des Voice-Marktes. Ich finde die Tatsache viel spannender, dass immer mehr Nischen-Sprachassistenten entwickelt werden. Es zeichnet sich ab, dass nicht ein Sprachassistent alle dominieren wird, sondern dass sie interoperabel sind. Dazu gibt es bereits diverse Think Tanks und erste Ergebnisse. Genauso wie aktuell der deutsche Sprachassistent Magenta der Telekom auch Amazon Alexa unterstützt werden wir irgendwann regelmäßig mit Dutzenden verschiedenen Sprachassistenten sprechen. Kein Wunder, dass Microsoft sich Nuance fast 20 Milliarden Dollar hat kosten lassen.

Auch Spotify wurde hier aktiv.

Schaad: Spotify hat gerade einen eigenen Sprachassistenten veröffentlicht. Der Sprachassistent der Bank of America geht durch die Decke und auch Hey Mercedes hat eine geniale User Experience. Der Vorteil für die Unternehmen ist, dass sie selbst mehr Daten erhalten und die Nutzer erleben eine viel bessere Spracherkennung, weil sich die Anfragen auf wenige Anwendungsfälle beschränken. Man verwendet eben Alexa zum Kauf von Windeln, aber den Google Assistant für allgemeine Fragen. Den Sprachassistenten des Autos für die Temperatursteuerung und „Hey Spotify“ für die Musik. So wie man von einem Gerät aus auf amazon.de etwas kaufen und auf google.de etwas suchen kann, so wird man von einer Hardware aus über die unterschiedlichen Sprachassistenten irgendwann unterschiedliche Dinge erledigen oder Informationen abfragen. Daher würde mich nicht wundern wenn AirBnB, booking.com, Uber und ähnliche Plattformen bald alle ihre eigenen Sprachassistenten haben. Das wird sehr aufregend.

Das Interview führte Helmut van Rinsum

Raphael Schaad ist Smartspeaker-Pionier der ersten Stunde und seit 2017 als Consultant für Sprachassistenten tätig. Er ist Gründer des International Voice Technology Institute, wo er Voice Consultants ausbildet, die Unternehmen in Bezug auf Voice Marketing, Voice SEO und Voice Commerce dann beraten können. Schaad ist Gastdozent am MCI in Innsbruck und Autor des Buchs "amazon alexa: Mehr als nur Wetter & Musik".

Weitere Interviews:
Gero Reiniger: KI im Kundenservice
Peter Kabel: Kreativberufe werden sich stark verändern
Andreas Stiegler: KI Übernimmt Aufgaben des Designers

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.

© 2024 KI im Marketing.

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.

© 2024 KI im Marketing.

Newsletter

Hier erfährst Du einmal in der Woche, wo Künstliche Intelligenz in das Marketing eingreift, welche Trends sich abzeichnen und wie sie Kommunikation und Medien verändert. Informativ, unterhaltsam, nachdenklich.

Schließe Dich den 1.500+ Abonnenten an, kostenlos.

© 2024 KI im Marketing.