Tippt und wischt ihr noch oder sprecht ihr schon mit eurer Bank?

Voice Assistant

Der Artikel ist am 20. Oktober 2020 erstmals auf InTech.Swiss erschienen.

Die letzten Jahre waren geprägt von Tippen und Wischen auf Touchscreens von Smartphones und Tablets. Die Sprache als Interface gewinnt seit einigen Jahren weltweit immer mehr an Bedeutung, da die Hände frei sind und es sich natürlicher anfühlt. Birgt diese Entwicklung genügend Potential, um das nächste grosse Ding zu werden und sich auch in der Finanzindustrie durchzusetzen?

Bequemlichkeit und örtliche Unabhängigkeit bei der Erledigung von Aufgaben ist ein zentraler Treiber für die Nutzung von Sprachassistenten. Noch bequemer wäre es nur noch, wenn sich die Aufgaben von selbst erledigen würden. Die Sprachtechnologie hat heute bereits ein Reife- und Komfortniveau erreicht, welches die nächsten Jahre unaufhaltsam die Art und Weise verändern wird, wie Beziehungen zwischen Unternehmen und Verbrauchern zukünftig aufgebaut werden.

Die gängigsten Sprachassistenten stehen uns allen – ohne Investitionen in Smart Speakers zu tätigen – über unsere Smartphones breitflächig zur Verfügung, was aufgrund der hohen Verbreitung wie ein Brandbeschleuniger in der Nutzung wirkt. Alexa sowie die Google-Assistant-App ist für Android und iOS verfügbar. Siri (Sprachassistent von Apple) bildet die Ausnahme und steht lediglich auf iOS Geräten zur Verfügung.

Wie funktioniert ein Voice-Assistant?

Die nachfolgende Grafik und Beschreibung veranschaulicht sehr vereinfacht, wie ein heutiger Voice-Assistant funktioniert.

Voice Assistant

Quelle: Eigene Darstellung

  1. Die Aufmerksamkeit des Voice-Assistant (Smart Speaker, Smartphone, Auto Boardcomputer, Fernbedienung usw.) wird via Wake Word (Alexa, OK Google, hey Siri usw.) oder mittels Knopfdruck (Fernbedienungen, Autos usw.) aktiviert und man teilt dem Voice-Assistant seinen Wunsch mit.
  2. Der Voice-Assistant wird gestartet und der Inhalt der Tonspur «Welche Uhrzeit ist es in Sydney?» wird mittels Natural Language Processing (NLP) von einer unstrukturierten Form (Tonspur) in eine strukturierte und maschinenlesbare Form (Text) übersetzt.
  3. Der Text wird durch den Voice-Assistant nach der gewünschten Fähigkeit (Uhrzeit) sowie dem Auftrag (jetzt) an die Fähigkeit untersucht. Dann werden diese Informationen (Uhrzeit; Jetzt; Sydney) an die API der aufgerufenen Fähigkeit (Uhrzeit) übergeben.
  4. Das entsprechende Uhrzeit API läuft mit den Parametern (Jetzt; Sydney) durch und sendet die Antwort wieder zurück an den Voice-Assistant.
  5. Dieser sendet die Antwort an das Gerät, über welches der Auftrag erfolgte.
  6. Und mittels Sprache wird die Antwort von diesem Gerät ausgegeben.

Alles Zukunftsmusik?

Sprachgesteuerte Technologie ist nicht ein Zukunftstraum. Sie ist heute bereits präsent und weit verbreitet, denn sprachfähige Geräte (Smartphones und Smart Speaker) sind allgegenwärtig und immer mehr Geräte lassen sich durch sie steuern. Alleine Amazon ist es in den letzten drei Jahren gelungen, dass Alexa über 100’000 unterschiedliche Geräte von mehr als 9.500 Herstellern mittels Sprache steuern kann.

Geraete unter Alexas Kontrolle

100.000 Geräte unter Alexas Kontrolle

Beachtlich sind ausserdem auch die weltweiten plattformübergreifenden Verkaufszahlen von Smart Speakern. Allein im Jahr 2019 wurden weltweit über 147 Millionen Smart Speakers verkauft. Hinzukommen noch über zwei Milliarden vorhandene Smartphones (weltweit), über welche ebenfalls Voice-Assistants genutzt werden können.

Global Smart Speaker Sales

Global Smart Speaker Sales Q3 2018 – Q1 2020

Wo stehend wir in der Schweiz?

Die Nutzung von Voice-Assistants ist auch in der Schweiz am Boomen. Gemäss dem Voice First Barometer Switzerland aus dem Jahr 2019 nutzen bereits über 51% der Schweizer Bevölkerung im Alltag Voice-Assistants. Das Voice First Barometer Switzerland(Farner ConsultingUniversität Luzern und Swisscom) ist eine repräsentative Studie zur Erfassung und Beobachtung der Verbreitung von Voice User Interfaces (VUI) in der Schweiz, welche seit dem Jahr 2018 jährlich erhoben wird – sowie zur Einstellung der Schweizer Bevölkerung gegenüber diesen neuen Technologien.

Die Nutzerzahl von 51% überrascht sehr, da die grossen Plattformen bis vor kurzem einen grossen Bogen um die Schweiz gemacht haben. Amazons Echo (Alexa) Smart Speaker kann in der Schweiz lediglich mit gewissen Limitierungen – bspw. kein offizieller Support, keine Alexa-App in den Schweizer App-Stores und gewisse Apps lassen sich nicht koppeln, weil die Schweiz als Land nicht supportet ist – genutzt werden. Der Google-Assistant, Siri und Bixby (Samsung) hingegen werden in der Schweiz offiziell supportet.

Die Erklärung, weshalb die Nutzerzahl dennoch so hoch ist findet sich ebenfalls in der Studie. Denn daraus geht hervor, dass 42% der befragten Personen die Sprachfunktionen auf dem Smartphone (Auto 16%, Desktop-Computer12%), und lediglich 2.63% Smart Speakers wie Echo (Alexa) oder Google Home nutzen.

Voice Map Switzerland

Einen sehr guten Überblick zur Voice User Interface Landschaft in der Schweiz verschafft die Voice Map Switzerland, welche durch das Voice Meetup Switzerland und das Institute für Digital Business der HWZ erstellt wurde. Das von ihnen definierte Ziel für die Voice Map ist es, Transparenz zu den Entwicklungen im Bereich der Voice User Interfaces in der Schweiz zu schaffen.

Voice Map Switzerland

Voice Map Switzerland

Banking

Im Schweizer Banken Umfeld gibt es derzeit zwei Vorreiter, welche sich bereits intensiv mit der Einbettung von Sprache und Sprachassistenten beschäftigt haben.

SGKB – der Finanzassistent der Schweizerdeutsch versteht

Seit Juni 2019 können die Kundinnen und Kunden der St.Galler Kantonalbank im Finanzassistenten neben dem klassischen Weg auch direkt per Sprache Abfragen auslösen. Die Spracherkennung basiert auf der Lösung von Spitch und versteht auch Schweizerdeutsch, was die Nutzung natürlicher und einfacher gestaltet. Es ist ein kleiner Schritt, aber es ermöglicht der Bank eine neue Form der Kundeinteraktion auszuprobieren, um damit Erfahrungen für die Zukunft zu sammeln.

Angela Finance – Deine Debit- und Kreditkarte per Stimme im Griff

Angela Finance ist ein Prototyp der Viseca, welcher die Möglichkeit bietet via eines Echo Devices (Amazon Alexa) seine Karte zu sperren, die verbleibende Limite oder die letzten Transaktionen per Stimme abzurufen. Beeindruckend ist auch die Sicherheitslösung, welche in Zusammenarbeit mit Futurae und ihrer Smart Speaker Authentication umgesetzt wurde und den Nutzern unter anderem eine Zero-Touch Methode (ohne Voice Fingerprinting) erlaubt, um sich gegenüber Angela zu authentisieren (2-Faktor-Authentifizierung).

Alexa Futurae MFA 2FA

Futurae

Wenn wir einen Blick zu unserem Nachbarn nach Deutschland werfen, dann finden sich im Banken Umfeld mit den Sparkassen und der Comdirect zwei Banken, welche sprachbasierte Dienstleistungen über den Google Assistant anbieten.

Die Google Action der Sparkassen bietet derzeit Abfragen des Kontostands für Einzel- und Gemeinschaftskonten, Abfragen des Gesamtfinanzstatus sowie Informationen über Eingänge und Abbuchungen auf dem Konto an. Die Comdirect Google Action hingegen richtet sich mit dem Leistungsumfang eher an Trading affine Kunden und bietet Realtime-Kurse, Börsennachrichten zu einzelnen Werten, Konto- und Depotstand Abfragen sowie die Vorbereitung von Überweisungen, welche man nachher in der Comdirect App freigeben kann, an.

Wir sind mitten in einer Revolution des User Interfaces und in der Entstehung eines neuen Milliarden Marktes (weltweit), denn in den nächsten Jahren wird die Steuerung von Geräten über unsere Stimme so selbstverständlich wie die Nutzung eines Smartphones werden.

Die Nutzung eines Sprachassistenten wird nicht zu einem alles entscheidenden Wettbewerbsvorteil führen. Doch im heutigen Umfeld, wo Technologieunternehmen zunehmend über Banklizenzen verfügen verschärft sich der Kampf um die Kundenschnittstelle. Wie alle anderen Online-Branchen müssen Banken und FinTechs evaluieren, wie sich die Kundenpräferenzen bei der Sprachsteuerung entwickelt, denn diese bietet ihnen eine gewaltige Chance Banking Services omnipräsent in den Kontext von Kundenbedürfnissen einzubetten.