Samhammer

Data Science im Service: Sagen Zahlen mehr als 1.000 Worte?

Heutzutage sind wir im Service grundsätzlich durch zwei Qualitätsmerkmale getrieben: Kundenzentrierung (Sind die Service-Empfänger nicht zufrieden, sind sie früher oder später weg.) und Effizienz (Es soll sich für uns ja lohnen – im wahrsten Sinne des Wortes.).

Kundenzentrierung steht für persönliche Ansprache und Individualisierung; Effizienz heißt im weitesten Sinn Standardisierung und Automatisierung. Schwierig zu vereinbaren, oder?

Beschäftigt man sich mit künstlicher Intelligenz und der eingangs skizzierten Herausforderung, landet man relativ schnell beim Konzept des thought vectors. Der Begriff selbst wurde von Geoffrey Hinton geprägt, einem der sogenannten godfathers of AI, also jemandem, der augenscheinlich weiß, wovon er spricht. Das Konzept besagt, dass eine KI in der Lage ist, den Sinn einer Wortsammlung – z.?B. eines Satzes oder Textabschnitts – zu erlernen, in unbekannten Texten wiederzuerkennen und sogar die wahrscheinlichsten folgenden Gedanken eines Nutzers vorherzusagen. Das Ganze ist zwar unter anderem mangels Rechenkapazität noch nicht ganz realisierbar, in gewissen Vorstufen werden die Prinzipien jedoch schon heute genutzt.

Aber wie funktioniert das? Aus menschlicher Sicht ist KI bekanntermaßen ja weder intelligent noch kognitiv. Die Lösung heißt Statistik und Mathematik oder grob gesagt die Umwandlung von Wörtern in Zahlen, damit man im übertragenen Sinn Ähnlichkeiten bewerten kann.

Nehmen wir der Einfachheit halber an, wir hätten im Umfeld der IT-Services einen fachspezifischen Wortschatz von 1.000 Wörtern. Diese Wörter werden in Nutzeranfragen unterschiedlich oft verwendet. Man würde also eine Auswahl an Kundenanfragen nutzen und zählen, wie oft welches der 1.000 Wörter darin vorkommt. Das Ergebnis ist dann eine Reihe von Vektoren mit je 1.000 Dimensionen und Werten zwischen Null und irgendeiner nicht allzu großen positiven ganzen Zahl. (Würde unser Wortschatz nur 3 relevante Wörter umfassen, würde der Vektor [4,0,3] aussagen, dass das erste Wort viermal und das dritte Wort dreimal in einer Anfrage vorkommt. Zur Veranschaulichung könnte man auch einen Pfeil in die Luft malen, der bei Ihnen beginnt sowie 4m vor und 3m über Ihnen endet).

Die Vektoren zu den Beispielanfragen zeigen dann sozusagen in die verschiedensten Himmelsrichtungen (auf einer Erde mit 1.000 Dimensionen statt der üblichen 3 ????). Ein mögliches KI-Modell gruppiert die Vektoren dann nach ihrer Nähe zueinander, also z.?B. nach der Richtung, in die sie zeigen und dem Abstand, den ein Teil der Vektoren zu einem anderen hat. Zusätzlich können die Vektoren auch manipuliert werden, indem ein Algorithmus beliebige Werte durch andere ersetzt. Dadurch muss das Modell neue, nicht offensichtliche Faktoren (also z.?B. eine Art von Thema oder Sinn) „entdecken", nach denen die Gruppierung erfolgen kann. Ein solches Vorgehen versetzt die KI in die Lage, eine Art Absicht in einer neuen Anfrage zu erkennen, selbst wenn der verwendete Wortschatz vom bisher bekannten abweicht. Dies kann bedeuten, dass eine automatische Einordnung der Anfrage in eine bekannte Kategorie erfolgt, oder auch, dass die KI das Anlegen einer völlig neuen Kategorie vorschlägt (nicht unbedingt namentlich, aber auf jeden Fall, dass es sich um ein bis hierhin unbekanntes Thema handelt).

Am Ende ermöglicht uns der Einsatz einer solchen KI also, die essenziellen Faktoren Kundenzentrierung und Effizienz in Einklang zu bringen, weil sie Standardisierung nach innen und Individualisierung nach außen verbindet.