Samhammer

Vorsicht technisch: Sprache und Mails mit KI klassifizieren

Nicht immer ist der Chatbot die geeignete Wahl für den Kundenkontakt. Insbesondere wenn es komplexer wird oder tieferes Wissen benötigt wird. Hier bietet sich alternativ ein „intelligentes Kontaktformular“. Das reagiert situativ auf die Kundenanfrage. Was allen Kontaktpunkten gleich ist, dass eine KI erkennen muss, was das Kundenanliegen ist. Klassische Muster versagen hier, deswegen hat Samhammer den Classifier entwickelt, der universell in den Kontaktprozess und existierenden Tools zwischengeschaltet wird. Egal ob Mail, Bot, Kontaktformular oder Telefon.

 

Datenklassifizierung durch Machine Learning Verfahren

Klassifizierung ist ein Prozess zur Vorhersage von Klassen, auf Basis gegebener/vorhandener Daten. Diese Klassen werden i.d.R. Labels oder Kategorien genannt. Mit Hilfe eines Classifiers werden also Objekte/Datensätze nach deren Merkmalen in vordefinierte Kategorien/Labels eingeteilt. Die Aufgabe eines Classifiers besteht darin, die passenden Regeln zur Einteilung von Daten in Klassen zu identifizieren. Klassifizierungen sind im Bereich des Supervised Learnings angesiedelt. Die Einsatzmöglichkeiten eines Classifiers sind vielseitig und reichen z.B. von Kreditgenehmigungen über Diagnostik bis hin zu Marketing, Einkauf und natürlich den Service und Helpdesk.

Ein einfaches Beispiel für einen Classifier ist die Erkennung von Spam-Emails. Hierbei handelt es sich um eine binäre Klassifizierung eingehender Emails mit nur zwei Klassen – Spam oder kein Spam. Ein Classifier benötigt hierzu einige Trainingsdatensätze (Spam und No-Spam) um die richtige Klasse erkennen zu können. Sobald der Klassifikator richtig trainiert wurde, kann dieser verwendet werden, um Spam-Mails selbstständig zu identifizieren.

Es gibt es verschiedene Machine-Learning-Algorithmen, mit welchen man Klassifikatoren aufbauen kann. Welcher Ansatz oder Algorithmus am besten geeignet ist, ist z.B. abhängig vom jeweiligen Business-Prozess, der zugrundeliegenden Applikation und natürlich von den vorhandenen Datensätzen.

Decision Trees

Ein Entscheidungsbaum (Decision Tree) baut Klassifikations- oder Regressionsmodelle in Form einer Baumstruktur auf. Basis ist ein Wenn-Dann-Regelsatz, der sich gegenseitig ausschließt. Die Regeln werden sequentiell gelernt, wobei Trainingsdaten nacheinander einzeln verwendet werden. Ausgangspunkt ist immer ein Wurzelknoten, von welchen Abwärts gegangen wird. Für jeden Knoten wird ein Attribut abgefragt, über welches dann auf den nachfolgenden Knoten geschlossen werden kann, bis am Ende die jeweilige Klassifizierung (Anwendungsfall) erreicht ist. Bei komplexeren Klassifizierungen werden mehrere Decision Trees zusammengesetzt. Hier kommen dann kompliziertere Modelle wie Boosted Trees, Gradient Boosted Trees oder Random Forest zum Einsatz.

Neuronale Netze

Natürlich ist es auch möglich mit neuronalen Netzen Objekte zu klassifizieren. Gegenüber anderen Verfahren kann man mit neuronalen Netzen sehr gute – häufig sogar bessere Ergebnisse erlangen. Die Basis hierzu sind allerdings eine deutlich größere Menge an vorhandenen Trainingsdaten, welche häufig nicht vorhanden sind. Einsatzgebiet von Klassifizierungen auf Basis neuronaler Netze ist heute daher häufig die Objekterkennung auf Bildern. Viele haben dieses Problem experimentell erkannt und arbeiten, mit der Hilfe von Samhammer, am strukturierten Aufbau von Data Lakes und der Anreicherung von Daten zu Informationen. Weitere Verfahren der Klassifizierung sind z.B. k-Nearest Neighbor (KNN) oder Support Vector Machine.

Fazit: Bereite Dich vor

Wie erwähnt, ist die Auswahl des richtigen Algorithmus und die Identifizierung der Klassen von vielen Faktoren abhängig. Wir in der Samhammer AG raten daher dringend den Weg einer Prozess- und Kontaktgrundanalyse vorneweg, gefolgt von einer Analyse der vorhandenen Daten, um eine hohe Genauigkeit der Klassifizierung(en) zu erreichen. 

Zudem ist es für den nachhaltigen Projekterfolg elementar wichtig, die Menschen, welche operativ mit den Modellen arbeiten, frühzeitig einzubinden und mitzunehmen. Diese sollten verstehen, wie eine Klassifizierung erfolgt und Ergebnisse liefert, und dadurch das Vertrauen in die Modelle gewinnen.

Unser Vorgehen ist technisch ein White-Box-Ansatz. Somit ist immer transparent, warum ein Classifier welche Entscheidung trifft.

Zudem nehmen operative Experten mit ihrem Domänenwissen beim Aufbau von Trainingsdatensätzen sowie bei der Bewertung von Ergebnissen zusammen mit den Data Engineers und Data Scientists eine elementar wichtige Rolle ein. 

Auch die Überwachung des Classifiers im operativen Tagesgeschäft ist ein wichtiger Faktor für einen nachhaltigen Erfolg und Nutzen. Hierzu empfiehlt sich die Etablierung eines Prozesses für das Training und die Überwachung des KI Modells im operativen Betrieb.

Beispiele Classifier-Anwendungsfälle im Service: