Autor Cognigy 1. März 2021

Dominik Seisser ist ein erfahrener KI-Fachmann und Experte für Natural Language Understanding (NLU). In seinem jüngsten Interview mit dem Turning Magazine spricht er über die Beziehung zwischen KI-Forschung und -Praxis sowie seine größten Herausforderungen als KI-Verantwortlicher. Außerdem erklärt er, wie Cognigy es schafft, Big Tech auf Augenhöhe zu begegnen.

 

Dominik, was macht ein Head of AI?

Dominik Seisser, Head of AI at Cognigy

Als Head of AI bei Cognigy leite ich ein Team aus Experten für maschinelles Lernen, KI-Entwicklern und Computerlinguisten. Mein Team ist für die von unserem Unternehmen selbst entwickelte NLU-Engine verantwortlich, die das Herzstück unseres Produkts, Cognigy.AI, darstellt. Zu meinen Aufgaben gehört es auch, über die neuesten technologischen Fortschritte im KI-Bereich auf dem Laufenden zu bleiben und neue Erkenntnisse aus der Spitzenforschung für unsere Anwendung zu nutzen.

 

Was genau entwickelt Cognigy?

Wir bieten eine kommerzielle Plattform für die Kundenservice-Automatisierung, die für große Unternehmen konzipiert ist. Unsere Kunden nutzen die Software, um intelligente Chat- und Telefon-Bots zu entwickeln, die die menschlichen Agenten von Contact Centern in Echtzeit unterstützen oder Verbrauchern über Messenger-Apps unmittelbare, intelligente Hilfe anbieten. Natural Language Processing ist das Herzstück unseres Angebots: Es ermöglicht der Software, Nutzer-Äußerungen in natürlicher Sprache zu verstehen und entsprechend mit den Nutzern zu kommunizieren. Kurz gesagt: Mein Team sorgt dafür, dass Maschinen Menschen verstehen können. Oder genauer gesagt: Wir bringen der Maschine bei, das zu verstehen, was wir wollen.

 

Gibt es unterschiedliche Teams für sprach- und textbasierte Bots?

Zurzeit wird gesprochene Sprache von Speech-to-Text-Engines vorverarbeitet, so dass die NLU eine Texteingabe erhält – genau wie dies in einem textbasierten Kanal der Fall wäre. Dies hat mehrere Vorteile, die den Nutzen eines End-to-End-Ansatzes bei der Verarbeitung von Sprache überwiegen. Selbst die Business-Logik eines Bots kann kanalübergreifend genutzt werden. Der Unterschied zwischen Text- und Sprachbots liegt im Conversation Design: Sprachbasierte Antworten müssen kürzer und prägnanter sein. Visuelle Elemente, Schaltflächen oder Links sind dort nicht verfügbar. Außerdem können die Nutzer nicht einfach wieder nach oben scrollen, weshalb ein Sprachbot den Endnutzern ganz klare Anweisungen geben muss.

Sehen Sie hier die sprach- und textbasierten Bots von Cognigy.AI in Aktion.

 

In welcher Beziehung stehen KI-Forschung und KI-Praxis im Business-Bereich?

Akademische Forschung bildet die Basis, auf der wir unsere Anwendung entwickelt haben. Ohne KI-Forschung gäbe es keine Cognigy NLU. Aber es ist auch wichtig zu wissen, dass sich die Forschung meist auf die Grundlagen von KI konzentriert. Die Entwicklung von Anwendungen mit KI eröffnet ein weites und spannendes Feld von Fragen, das weitestgehend noch unerforscht ist.

Interessanterweise gibt es erstaunlich wenig Forschung im Hinblick auf KI-Anwendungen in der Praxis. Ein Grund dafür ist, dass es nicht einfach ist, an reale Nutzungsdaten heranzukommen, um diese zum Gegenstand der Forschung zu machen. Das ist sicherlich einer der Vorteile, die wir bei unseren F&E-Bemühungen haben. Die Feedbackschleife zwischen der Entwicklung eines Features und seiner Beurteilung in der Praxis ist sehr kurz. Wir veröffentlichen etwa alle vier Wochen eine neue NLU-Version, d. h. die Zeitspanne zwischen Entwicklung, Bewertung und Optimierung ist bei uns viel kürzer als bei einem groß angelegten Forschungsprojekt.

 

Große Player wie IBM, Google und Microsoft investieren Milliarden in KI. Wie kann Cognigy da mithalten?

Wir fühlen uns tatsächlich manchmal ein wenig wie David gegen Goliath: Im Vergleich zu den Big-Tech-Anbietern sind wir zwar klein, aber dafür können wir schneller und flexibler agieren und einen extremen Fokus auf unsere spezifischen Anwendungsfälle für angewandte KI legen. Dadurch können wir die neuesten technologischen Entwicklungen sehr schnell übernehmen.

Einige KI-Aspekte, wie z. B. das Trainieren extrem umfangreicher Sprachmodelle mit Supercomputern oder der Aufbau von STT/TTS-Engines, erfordern extrem hohe Investitionen. Aber das ist nicht unser Schwerpunkt. In vielerlei Hinsicht profitieren wir und unsere Kunden von Dienstleistungen und Fortschritten, die ohne die Milliarden aus dem Silicon Valley nicht möglich wären. Letztendlich handelt es sich eher um ein Nebeneinander von smarten Dienstleistungen und Forschungserkenntnissen als um einen direkten Wettbewerb zwischen Technologien. Das ermöglicht es uns, unsere Forschungs- und Entwicklungsanstrengungen genau auf die Entwicklung des bestmöglichen Produkts für die spezifischen Anwendungsfälle unserer Kunden zu konzentrieren.

Es ist vergleichbar mit dem Markt für Supersportwagen. Sicher, Ferrari kann Toyota weder bei den Verkaufszahlen noch beim Umsatz schlagen. Und das Portfolio von Ferrari bietet auch weniger Auswahl als das von Toyota. Aber dennoch ist es möglich, mit einem kleinen, engagierten Team in einem bestimmten Markt ein äußerst wettbewerbsfähiges Auto zu bauen. Und auf der Rennstrecke wird jeder Profifahrer den F8 einem Corolla vorziehen.

Erfahren Sie mehr darüber, wie sich Cognigy im Vergleich mit anderen NLU-Engines schlägt.

 

Sie versprechen Spitzenleistung – aber wo sind die Beweise? Können Sie messen, wie gut Ihre NLU ist?

Das können wir, und wir tun dies auch fortlaufend auf Grundlage von mehr als 500 Millionen Mensch-Maschine-Interaktionen pro Jahr, die über unsere Plattform abgewickelt werden. Wir haben also eine Menge – vollständig anonymisierter – Daten über erfolgreich oder nicht erfolgreich abgeschlossene Interaktionen. Wir wissen, an welchen Stellen es in Konversationen zu Reibungsverlusten kommt oder welche Nutzeräußerungen von der Maschine weniger gut verstanden werden. Diese Daten fließen in die Entwicklung unserer NLU ein und ermöglichen es uns, die Leistung auf Basis realer Eingaben kontinuierlich zu messen und zu verbessern.

Wir gehen sogar noch einen Schritt weiter und bieten unseren Kunden eine Vorhersage der NLU-Leistung. Alle unsere Kunden nutzen eine ganz individuelle NLU-Variante, die auf ihren spezifischen Anwendungsfall zugeschnitten ist und auf individuellen Trainingsdaten basiert. Unsere Software analysiert, wie genau ein Modell bereits ist und in welchen Bereichen zusätzliches Training die größten Effekte hätte. Und sie kann sogar auf mehreren Ebenen vorhersagen, ob z. B. das Hinzufügen eines bestimmten Trainingssatzes die Genauigkeit der NLU verbessern würde oder nicht. All dies erfordert komplexe Datenwissenschaft in erheblichem Umfang – aber für die Business-Anwender wird diese Analyse in Form einer simplen Ampelanzeige visualisiert. Dies ist ein gutes Beispiel für ein Cognigy-Feature, das Sie bei keinem anderen großen Anbieter finden werden.

 

Wie bewerten Sie Ihre Lösung im Vergleich zu anderen NLU-Anbietern?

Mein Team führt regelmäßig Benchmark-Tests durch, um zu bewerten, wie sich unsere Lösung im Vergleich mit anderen schlägt. Da wir – wie auch die meisten anderen Anbieter – unsere Technologie ständig optimieren und erweitern, ist es sehr wichtig, einen standardisierten, hochautomatisierten Testprozess zu etablieren.

 

undefined

 

Noch wichtiger ist es, einen großen, neutralen Datensatz zu verwenden, um aussagekräftige Ergebnisse zu erhalten. Es wäre ein Leichtes, Testdatensätze so auszuwählen, dass die eigene NLU alle anderen um Längen übertrifft. Eine solche Schönfärberei würde jedoch unsere Bemühungen sabotieren, objektiv und nachweislich eine führende Position einzunehmen. Deshalb legen wir Wert auf eine Reihe unabhängiger Testdaten von akademischen Einrichtungen und Forschungsgruppen, die von uns oder anderen Anbietern völlig unabhängig sind. Mein Team ist stolz darauf, dass wir hinsichtlich der Genauigkeit und Zuverlässigkeit unserer NLU unter den führenden kommerziellen Anbietern zu Recht eine Spitzenposition beanspruchen können. Eine unserer besonderen Stärken ist das sogenannte „Few-Shot Learning“, das es unseren Kunden ermöglicht, mit vergleichsweise geringem Trainingsaufwand eine hohe Erkennungsgenauigkeit zu erreichen. Wichtig ist auch eine hohe Transparenz bezüglich der Testdaten und des Testablaufs. Deshalb stellen wir die Details unserer Tests als Open Source auf Github zur Verfügung, so dass unsere Ergebnisse von jedem überprüft werden können.

 

Was sind Ihre größten Herausforderungen – aus technischer Sicht und als Leiter eines KI-Teams?

Eine ständige Herausforderung ist die Skalierung der Anwendung auf die Anforderungen der realen Welt. Es ist eine Sache, eine Demoversion oder einen überzeugenden Proof-of-Concept für ein KI-Produkt zu erstellen. Aber sobald ein Tool in realer Anwendung ist, wird alles viel komplexer: Hunderte von Geschäftsanwendern trainieren die NLU zur gleichen Zeit. Batch-Uploads mit Millionen von Einheiten, die die NLU lernen muss. Sehr stark ausgeprägte und unerwartete Spitzen bei den Endnutzer-Anfragen. Und die zugrundeliegende Technologie muss zu jeder Zeit eine Top-Performance liefern – bei weltweiter Bereitstellung, mit minimalen Latenzzeiten und garantierter Verfügbarkeit. Und nicht zu vergessen: Als eine Komponente von Cognigy.AI ist die NLU Teil eines viel größeren Stacks. Sie ist mit Front- und Backend verwoben – und es gibt unzählige Abhängigkeiten, die in einer kontrollierten Testumgebung nicht auftreten würden. All das erfordert eine Menge solider Entwicklungsarbeit.

Was meine Rolle als Leiter eines KI-Teams angeht, ist eine meiner derzeit größten Herausforderungen die erfolgreiche Suche nach passenden Talenten. Es gibt zwar sehr viel Enthusiasmus und Begeisterung für KI, aber es ist eine enorme Herausforderung, die Erstellung von KI-Anwendungen auf einem Niveau zu erlernen und zu beherrschen, das für eine Führungsposition in einem schnelllebigen Unternehmen wie Cognigy erforderlich ist. Das berühmte Universalgenie zu finden, also einen KI-Spitzenforscher mit umfassender und erfolgreicher Erfahrung in der Entwicklung von KI-Anwendungen, ist nahezu unmöglich.

 

Was raten Sie Studierenden, die eine Karriere im KI-Bereich anstreben?

Für mich ist eine echte Leidenschaft für KI die beste Grundlage für eine Karriere in diesem Bereich. Es ist absolut faszinierend zu sehen, wie diese von Menschen geschaffenen Maschinen funktionieren, wozu sie fähig sind und welches Potenzial sie haben. Mein Ratschlag: Folgen Sie Ihrer Leidenschaft, um die Technologie im Detail zu verstehen und herauszufinden, wie Sie die enormen Möglichkeiten, die sie bietet, nutzen können. Experimentieren Sie. Kombinieren Sie den Geist des Lernenden, der „bei null anfängt“, mit einer gesunden Dosis praktischem Ehrgeiz und Ergebnisorientierung.

Ein Hochschulabschluss in einem technischen Bereich vereinfacht Ihnen sicherlich den Einstieg. Nehmen Sie zumindest an einigen Seminaren mit führenden KI-Forschern teil, um zu erleben, was der menschliche Verstand zu leisten vermag. All das wird Ihnen helfen zu erkennen, wie wenig Sie tatsächlich verstehen und wie tief der Kaninchenbau der KI-Forschung wirklich ist. Mein Tipp: Kombinieren Sie akademische und theoretische Ansätze mit praktischem Bauen und Realisieren eigener Prototypen, um wirklich zu erfahren, zu lernen und zu verstehen, was KI leisten kann. Und seien Sie sich immer darüber im Klaren, dass es nie eine bessere Zeit für eine Karriere im KI-Bereich gegeben hat.

image119-1
image119-1
image119-1