Die Macht der Stimme

MuK-Blog für Digital Marketing #16: Die Macht der Stimme
17. August 2018 Marketing Natives

Maus, Tastatur und Touchscreen adé. Denn alles was wir künftig noch brauchen, um unser Leben zu bedienen ist unsere Stimme, als Dolmetscher zwischen Mensch und Technik, schreibt die MuK*-Studentin Tina Montibeller in ihrem Blogbeitrag zum Thema „Die Macht der Stimme“.

*FH St. Pölten Studiengang Medien- und Kommunikationsberatung

Du sprichst – sie (ge)horchen

Ob Alexa, Bixby, Cortana oder Siri, es gibt da etwas mit dem man sie alle rumkriegt: ein bisschen Voice und schon gehorchen sie aufs Wort. Aber nicht nur die beliebten Sprachassistenten lassen sich mit der Stimme bedienen, sondern auch immer mehr Apps und Desktopanwendungen abseits der Big Player Amazon, Microsoft, Apple und Samsung. Denn Voice Search, zu Deutsch Sprachsuche, bezeichnet im Allgemeinen die Nutzung einer Suchmaschine mit Hilfe von Sprachsteuerung.

Eine Erfindung des 21. Jahrhunderts?

Nein, denn die sogenannten Spracherkennungs-Technologien lassen sich bis in die 1960er Jahre zurückverfolgen. Wenig später entstand, durch das amerikanische Verteidigungsministerium, in den 70er Jahren, das erste Spracherkennungssystem namens Harpy, das als erstes mit einer entsprechenden Suchfunktion ausgestattet war. Die wesentlichen Meilensteine wurden allerdings vor allem von den Unternehmen Google, Apple und Amazon gelegt. So hat Google bereits 2002 die erste Version des Voice Search entwickelt, wobei die Suchanfragen damals nur telefonisch über eine Hotline abgerufen werden konnten. Erst durch Apples Siri, im Jahr 2011, wurde die Sprachsteuerung massentauglich, denn bereits 2015 konnten damit mehr als 1 Milliarde Suchanfragen pro Woche verzeichnet werden. In den folgenden Jahren zogen nach und nach auch die Konkurrenten mit, wodurch Google Now im Jahr 2012 und Microsofts Cortana sowie Amazons Alexa im Jahr 2014 auf dem Markt erschienen sind. Mittlerweile haben Tablets, Laptops, Smartphones und Smart Watches jeglicher Art Sprachassistenten bereits serienmäßig installiert. Auch die Smarthome Lösungen finden immer mehr Anklang und bilden heute einen wesentlichen Teil der Spracherkennungstechnologien.

Grafik Nutzung von Sprachassistenten Deutschland

Abbildung 1: Brandt, Mathias (2016): Nutzung von Sprachassistenten in Deutschland, in: https://de.statista.com/infografik/4686/nutzung-von-sprachassistenten-in-deutschland, Stand 20.07.2018

Laut einer Statista Studie von 2016 verwenden fast die Hälfte aller NutzerInnen von Sprachassistenten in Deutschland Google Now, etwa ein Drittel nutzt Siri, ein Fünftel entfällt auf Cortana und Alexa kann nur einen Bruchteil für sich gewinnen. Neuesten Forschungen zufolge, hat sich das Blatt für Amazons Alexa allerdings gewendet, denn die smarte Sprachassistentin ist Schätzungen zufolge am weitesten verbreitet. Genaue Verkaufszahlen hält Amazon allerdings unter Verschluss.

Die Verbindung von Voice & Mobile

It´s a Match! Bereits im Jahr 2016 präsentierte Google im Rahmen einer durchgeführten Studie Ergebnisse, dass jede fünfte Suchanfrage von einem mobilen Endgerät per Spracheingabe durchgeführt wird – Tendenz steigend. Aber auch Sprachassistenten in Form von Smart Speakern sind auf dem Vormarsch, wie eine Studie von voicebot.ai vom Jänner 2018 darlegt. Demnach stieg die Nutzung der digitalen Sprachassistenten in den USA seit 2016 auf knappe 20 Prozent an. Im Vergleich eine rasante Entwicklung, denn das heute weitverbreitete Fernsehen benötigte fast die siebenfache Zeit und selbst das allmächtige Internet immerhin doppelt so lange, um eine derartige Menschenmasse zu erreichen. Edison Research veröffentlichte im Rahmen ihres Smart Audio Reports 2017 zudem, dass Smart Speaker die Mediennutzung verändern werden. Denn bei einer Umfrage in den USA gaben bereits 30 Prozent der RezipientInnen an, dass die Zeit, die sie mit ihren digitalen Sprachassistenten verbringen, die Fernseh-Nutzungszeit ersetzt.

Grafik Bekanntheit von Voice Search

Abbildung 2: Mindshare (2018): Bekanntheit von Voice Search, in: https://www.mindshareworld.com/austria/news/voice-search-starts-expand-austrians-audioversum, Stand 20.07.2018

Die digitalen Helfer müssen sich aber auch im deutschsprachigen Raum nicht verstecken, denn bereits mehr als ein Drittel der Deutschen sind laut einer repräsentativen Umfrage von Splendid Research, vom November 2017, im Besitz von Alexa, Siri & Co, während rund 40 Prozent der 15-59 Jährigen ÖsterreicherInnen, zufolge einer aktuellen Momentaufnahme des Instituts Mindshare, Voice Search nutzen. Über die Ländergrenzen hinweg weisen Onliner und insbesondere die jüngere Zielgruppe, zwischen 15-29 Jahren, dabei tendenziell eine höhere Affinität auf.

Immer mehr Menschen nutzen also Voice Search, doch wofür eigentlich? Genauso lässt sich auch diese Frage verallgemeinert beantworten: Neben generalisierbaren Fragen wird Voice Search hauptsächlich für Navigation verwendet. Gefolgt von Musik hören, Wetter checken, Personen kontaktieren und Wecker stellen. Und das alles genau dort, wo sich das tägliche Leben abspielt, auf dem Sofa im trauten Eigenheim, in der Pause im Büro oder in öffentlichen Verkehrsmitteln auf der Durchreise.

Komfort vor Privatsphäre?

Der Mensch ist ein Bequemlichkeitstier – neben intensiver Vermarktung und stetig wachsender Anwendungsmöglichkeiten, einer der Gründe weshalb Voice Search so erfolgreich ist und dies wahrscheinlich auch noch länger bleiben wird. In einer Zeit, wo ein Termin den nächsten jagt und die Grenzen zwischen Arbeit und Freizeit verschmelzen, liegen die schlagenden Vorteile von Sprachsteuerung eindeutig auf der Hand: Komfort, Geschwindigkeit und Effizienz. So können UserInnen im Durchschnitt in 60 Sekunden etwa 30-40 Wörter per Tastatur tippen, während die gesprochene Wortanzahl mehr als 110 beträgt.

Um einen vollen Service jederzeit zur Verfügung zu stellen, muss das Mikrofon der Sprachassistenten allerdings durchgehend eingeschalten sein. Damit ergibt sich für die Giganten Amazon, Google und Microsoft die Möglichkeit ihre bislang ohnehin überschaubare Datensammlung mit noch individuelleren und intimeren Informationen anzureichern. Zwar bestreiten sämtliche AnbieterInnen ein ständiges Abhören, trotzdem ist dies laut einer Umfrage von Bitkom mit 75 Prozent der häufigste Grund für eine bewusste Entscheidung gegen den Einzug der MitbewohnerInnen Alexa, Bixby & Co. Eine Aufzeichnung nach Tätigung des Aktivierungswortes, wie beispielsweise „Okay Google“ oder „Alexa“, und damit auch die Speicherung von persönlichen Daten, kann bislang allerdings nicht ausgeschlossen werden. Laut der im Mai 2018 in Kraft getretenen DSGVO, dürfen zwar keine personenbezogenen Daten mehr verarbeitet werden, was im Falle der Sprachassistenten für allgemeine Besänftigung sorgen könnte, wäre da nicht ein klitzekleiner Hacken mit großer Wirkung: die gesammelten Daten werden fast zur Gänze auf den Servern der Konzerne gespeichert, welche sich bekanntlich alle außerhalb der Europäischen Union befinden und somit dieses verschärfte Gesetz entkräften. Amazon und Microsoft räumen ihren KundInnen die Option ein, die aufgenommenen Tonspuren händisch über den Verlauf zu löschen, was aber, laut mehrfachen Rückfragen, nicht zwingend garantiere, dass die Daten auf den Servern entfernt werden und damit nicht weitergegeben werden können. Es lässt sich also annehmen, dass Alexa, Cortana, Siri, Bixby und Co., wie es sich für gute AssistentInnen gehört, nahezu alles über ihren Boss wissen.

Des einen Leid ist des anderen Freud – Chancen & Herausforderungen für Marken

Neben den AnbieterInnen selbst, können aber auch andere Marken von Voice Search künftig profitieren. Durch die Stimme als natürliche Schnittstelle zu verschiedenen Endgeräten sinkt die Hemmschwelle und Sprachassistenten werden mehr als zusätzliches Familienmitglied angesehen, weniger als elektronischen Fremdkörper. Somit eröffnet sich für Marken die Chance, sich noch mehr in den Alltag der Zielgruppe zu integrieren.

Egal ob in der U-Bahn, auf Social Media oder am stillen Örtchen sind wir täglich vielversprechenden Werbebotschaften ausgeliefert. Warum also nicht auch Sprachassistenten für Werbezwecke verwenden? Heiß diskutiert werden seit Beginn des Jahres nämlich die sogenannten Voice Ads. Wie der amerikanische Sender CNBC Ende Dezember 2017 bereits berichtete, ist im speziellen das Versandhaus Amazon in der Entwicklung von Werbeformaten für ihre Sprachassistentin Alexa und führte dazu bereits Gespräche mit Clorox sowie Procter & Gamble. Ob uns Alexa künftig eine bestimmte Marke vorschlägt, wenn wir ein Produkt auf die Einkaufsliste setzten, oder ihre mehr als 10.000 weltweit verfügbaren sprachbasierten Anwendungen, alias Skills, mit Werbeblöcken versehen werden, bleibt allerdings abzuwarten. So oder so ist das Ziel der Voice Ads die Kaufabsicht für ein bestimmtes Produkt zu steigern und im besten Fall zu einem direkten Kauf per Sprachfunktion zu animieren. Denn mit Alexa soll die oldschool Einkaufsliste schon bald Geschichte sein. Die Sprachassistentin von Amazon bietet, als derzeit einzige auf dem Markt, die Möglichkeit einen Einkauf per Sprache zu tätigen. Rund 22 Prozent der Smart Speaker BesitzerInnen in den USA haben diesen Service bereits einmal genutzt, berichtet das Institut Edison Research im Jahr 2017. Was bestellt wird, muss natürlich auch bezahlt werden, womit wir beim ersten Hindernis angelangt wären. Denn eine Bezahlung per Stimme gibt es aufgrund der hohen Manipulationsgefahr bislang noch nicht. Aktuell schafft Amazon mit einer zusätzlichen Abfrage des PINs auf der Website des Shop Betreibers Abhilfe.

Wie Shopping in Zukunft also aussehen kann, zeigt dieses Video vom Hersteller Amazon selbst:

Neben leuchtenden Chancen bringt die Sprachsteuerung aber auch einige Herausforderungen mit sich. Bislang konnten NutzerInnen bei einer Suchanfrage selbst die passende Antwort aus mehreren Suchergebnissen herausfiltern. Dahingegen werden den UserInnen bei Voice Search lediglich das erste, oder maximal die ersten zwei Ergebnisse durch den Sprachassistenten vorgelesen. Im Umkehrschluss bedeutet dies für Marken sowohl im Bereich des Content Marketings, als auch bei Suchmaschinenmarketing, dass ein Umdenken erforderlich ist, um auch in Zukunft wettbewerbsfähig zu bleiben.

Sowohl eine verstärkte SEO, als auch eine Zunahme von SEA wird erwartet, um sicher stellen zu können, zu den zwei Top-Ergebnissen zu gehören. Zudem verlagert sich die Optimierung durch Keywords immer mehr zu vollständigen Key-Sentences. Die Suche via Stimme unterscheidet sich insbesondere durch die hohe Dialogorientierung. Während bei einer herkömmlichen Suchabfrage mittels Tastatur lediglich Schlüsselbegriffe wie beispielsweise „Wetter Wien“ verwendet werden, wird bei Voice Search meist eine vollständige Frage gestellt „Wie ist das Wetter morgen in Wien?“. Für Marken bedeutet das, den Fokus insbesondere auf die typischen W-Fragen zu richten und diese möglichst präzise zu beantworten, um die Chancen zu erhöhen den UserInnen als passende Antwort auf ihre Frage vorgelesen zu werden.

Pizza, Hamburger oder Sushi? Nicht nur der Standort der Suchanfrage per Sprache, sondern auch die Uhrzeit sind ausschlaggebend für die Wahl des korrekten Ergebnisses. Sucht ein/e UserIn beispielsweise gegen Abend nach „Mc Donald´s“, wird er/ sie wahrscheinlich nicht an der Wikipedia Seite des Schnellrestaurants, sondern an der nächstgelegenen Filiale interessiert sein. Durch das Wissen über die Faktoren Zeit und Ort kann also eine positive User Experience und damit auch eine dementsprechende Beurteilung der Marke erlangt werden.

Ein Bild sagt mehr als tausend Worte – eine der wohl größten Herausforderungen der derzeit auf dem Markt vertretenen Geräte, ist das fehlende visuelle Element. Dies stellt insbesondere für die Vermittlung von emotionalen Botschaften, sowie für den Verkauf von Produkten eine Hürde dar. Denn laut der Shopperstudie 2011 in Deutschland entscheiden 63 Prozent aller KäuferInnen anhand visueller Merkmale, wie beispielsweise die Verpackung, über den Kauf oder Nicht-Kauf eines Produkts. Diesem Problem hat Alleskönner Amazon mit seiner Alexa Version á la „Big Brother is watching you“ mit inkludiertem 7-Zoll Display, aber bereits den Kampf angesagt.

Welche Veränderungen Voice Search speziell für den Bereich des Digital Marketings bereit hält, gibt es hier nochmals kurz zusammengefasst:

Viele Möglichkeiten, viele Hindernisse = viel Veränderung?

Es scheint, als wäre die Revolution der Sprachsteuerung unaufhaltsam. Amazon Gründer Jeff Bezos selbst ist davon überzeugt, dass Sprachassistenten in Zukunft durch Vernetzung mit Wearables wie Smartwatches oder Fitnessarmbänder, sowie Kopfhörer, Smart Glasses, sämtlichen Haushaltsgeräten und sogar Autos in Kommunikation mit jedem und allem stehen werden.  Klingt nach ferner Zukunftsmusik? Bei uns im europäischen Raum werden wir wahrscheinlich noch einige Zeit auf die neuen Features warten müssen und uns weiterhin mit Tippen, Wischen und Klicken begnügen. Ein kleiner Ausblick loht sich dennoch, man darf ja schließlich träumen oder?

Bislang basiert eine Konversation zwischen Mensch und Sprachassistenten hauptsächlich auf dem Frage-Antwort Spiel. Das soll sich aber schon bald ändern, denn die dahinterliegende Technologie soll dahingehend verbessert werden, dass aus reinen Suchanfragen Gespräche entstehen. Durch Rückfragen von Alexa, Siri & Co. können somit nicht nur die Suchergebnisse weiter präzisiert werden, sondern die BesitzerInnen haben auch die Möglichkeit Zusatzfragen zu einem Suchergebnis zu stellen, ohne dafür die Ausgangsfrage wiederholen zu müssen. Mehr als die Art der Frage, die BenutzerInnen stellen, sind in Zukunft die Emotionen und die Stimmung die in der Sprache mitschwingen entscheidend. In der Forschung wird bereits daran gearbeitet eine Spracherkennungssoftware zu entwickeln, die mithilfe der Tonalität und dem Ausdrucksstil der Stimme erkennt welcher Gemütszustand sich dahinter verbirgt und somit das Suchergebnis, von strikten Fakten bis hin zu lustigen Inhalten, dementsprechend anpassen kann.

A little bit of voice a day keeps the doctor away. Eine etwas realitätsfernere Entwicklung besagt, dass durch eine fortschrittliche Erkennungssoftware auch gesundheitliche Einschränkungen wie beispielsweise Heiserkeit und Husten von Sprachassistenten erkannt werden können. Im Zuge dessen werden dann Tipps und Problemlösungen präsentiert.

Das in diesem Bereich aber nichts unmöglich ist, zeigen Amazon und Google mit ihren neuesten Erfindungen: Das Amazon Haus, das die KundInnen im 360 Grad Modus mit Amazon komplett vernetzt, oder Google Duplex, der Sprachassistent 2.0, der mit verblüffend menschlicher Stimmfarbe Termine vereinbart oder Reservierungen vornimmt, wie dieses Video zeigt:

So oder so steht fest, dass die Entwicklung von Sprachsteuerung erst am Anfang ist und sich in welche Richtung auch immer weiterentwickeln wird. ExpertInnen gehen davon aus, dass in weniger als zwei Jahren, bis 2020, rund 30-50 Prozent aller Suchanfragen per Sprache getätigt werden. Ob nun aber die bestehenden Technologien lediglich optimiert werden oder wir in Zukunft nur noch mit unserer Stimme dirigieren werden, fragen wir am besten Alexa, Bixby, Cortana und Siri selbst, denn die wissen schließlich alles oder?

 

Tina Montibeller

 

Autorin: Tina Montibeller

Über Tina: Derzeit befindet sich Tina im fünften Semester des Bachelorstudiengangs Media- und Kommunikationsberatung. Durch ihren Nebenjob in einer Wiener Content Agentur kann sie Theorie & Praxis bestens vereinen und spannende Einblicke in die Branche erlangen.

 

Disclaimer: Namentlich gekennzeichnete Beiträge wie dieser hier geben die Meinung des jeweiligen Autors und nicht immer die Meinung des Anbieters wieder.

 

Quellenverzeichnis:

Bergmann, Thomas (2018): Smarte Assistenten und Voice-Search-Ads, in: https://www.adseed.de/blog/smarte-assistenten-und-voice-search-ads/, Stand 20.07.2018
Brandt, Mathias (2016): Nutzung  von Sprachassistenten in Deutschland, in: https://de.statista.com/infografik/4686/nutzung-von-sprachassistenten-in-deutschland/, Stand 20.07.2018
Brandt, Mathias (2018): Google und Amazon dominieren den Smart Speaker-Markt, in: https://de.statista.com/infografik/12369/weltweiten-absatz-von-smart-speakern/, Stand 20.07.2018
BVDW (2017): BVDW-Studie: Mehrheit nutzt digitale Sprachassistenten, in: https://www.bvdw.org/der-bvdw/news/detail/artikel/bvdw-studie-mehrheit-nutzt-digitale-sprachassistenten/, Stand 20.07.2018
Horizont (2018): Voice Search ist Treiber im „Audioversum“ der Österreicher, in: https://www.horizont.at/home/news/detail/?tx_news_pi1%5Bnews%5D=66568&no_cache=1, Stand 20.07.2018
Lewanczik, Niklas (2018): Voice Search: So geht SEO für die Sprachsuche, in: https://onlinemarketing.de/news/seo-voice-search-rankings-optimieren, Stand 20.07.2018
Mendez, Robert (2018): Digitale Sprachassistenten – Amazon Echo – Das nächste heiße Markeding im Marketing?, in: https://content-marketing.com/digitale-sprachassistenten-amazon-echo-das-naechste-heisse-markeding-im-marketing/, Stand 20.07.2018
Riaz, Nadia (2018): Im Redeschwall, in: https://www.lead-digital.de/im-redeschwall/, Stand 20.07.2018
RMS (2018): Sprachsteuerung: Wie Marken und Medien künftig gehört werden, Stand 27.07.2018
Scheucher, Jonathan (2018): Was Sprachassistenten wie Siri, Alexa & Co. dürfen, in: https://help.orf.at/stories/2894579/, Stand 20.07.2018
Splendid Research (2018): Eine repräsentative Umfrage unter 1.024 Deutschen zum Thema Digitale Sprachassistenten, in: https://www.splendid-research.com/de/studie-digitale-sprachassistenten, Stand 20.07.2018
Sputnika (2017): Sprachsteuerung und Voice Search – Gedanken zum Datenschutz, in: https://www.sputnika.de/dresden/news/sprachsteuerung-und-voice-search-gedanken-zum-datenschutz-gid-5766, Stand 20.07.2018
Weischer.Media (2018): Werbung via Voice Search, in: https://weischer.media/de/de/trends-und-innovationen/blickwinkel/werbung-via-voice-search/, Stand 20.07.2018
Weller, Robert (2017): Okay Google, wie wird Voice Search Suchmaschinen-Marketing (SEO&SEA) verändern?, in: https://www.toushenne.de/newsreader/voice-search-seo.html, Stand 20.07.2018

The Community for Young Marketers in Austria. Join us!