Unser großes Experiment mit GPT und generativer KI
Veröffentlicht: 2023-02-01ChatGPT hat die Welt im Sturm erobert und wir könnten nicht aufgeregter sein. Heute enthüllen wir die Kundendienstfunktionen, die wir mit dieser revolutionären KI entwickelt haben.
Im Dezember haben sich unser Director of Machine Learning, Fergal Reid, und ich zusammengesetzt, um über die Einführung von ChatGPT zu sprechen: das Gute, das Schlechte, das Versprechen, der Hype. Die Möglichkeiten, Prozesse für Support-Mitarbeiter zu automatisieren und zu rationalisieren, scheinen endlos, aber der Erfolg der generativen KI in diesem Bereich hängt letztendlich von ihrer Fähigkeit ab, einen echten Mehrwert für Kundendienstteams und Kunden gleichermaßen zu schaffen. Wenn nicht, nun, es ist nur ein Spielzeug – ein lustiges, aber nichtsdestotrotz ein Spielzeug.
Um dies zu testen, haben wir uns schnell an die Arbeit gemacht. Wir skizzierten ein paar KI-gestützte Funktionen, die wir für nützlich hielten, gingen in Produktion und stellten 160 Kunden eine Beta-Version vor. Sie können alles über diese neuen Funktionen hier lesen.
In der heutigen Folge teilen Fergal und ich mit, was wir in den letzten Wochen gelernt haben, wohin wir als nächstes gehen und wie es unsere Wahrnehmung dessen, was in diesem Bereich möglich ist, verändert hat.
☞ Klicken Sie hier , um sich der Beta-Warteliste für unsere KI-Funktionen anzuschließen oder KI-Neuigkeiten von Intercom zu erhalten.
Hier sind einige der wichtigsten Erkenntnisse:
- Die Fähigkeit von ChatGPT-Modellen, natürliche Sprache in Konversationen mit mehreren Sätzen zu verarbeiten, verbessert sich weiter und eröffnet neue Möglichkeiten.
- Bei der Produktentwicklung sind Kunden immer die ultimativen Entscheider – Sie bauen vielleicht erstaunliche Technologien, aber wenn sie ein Problem für sie nicht lösen, lohnt es sich nicht.
- Die Fähigkeit von GPT-3.5, Text zu bearbeiten und zu ändern, macht es sehr wertvoll für den Kundendienst, und es kann bereits Aufgaben wie das Zusammenfassen von Text und das Anpassen des Tons übernehmen.
- Mit den Fortschritten in ChatGPT können weitere Funktionen hinzugefügt werden, um die Effizienz zu maximieren und Agenten an vorderster Front zu befreien, damit sie sich auf die komplexeren Probleme konzentrieren können, die die Kundenzufriedenheit steigern.
- Während wir damit beginnen, potenziell bahnbrechende Anwendungen wie intelligente Antworten zu untersuchen, fehlt dem Modell noch das Verständnis des geschäftlichen Kontexts, damit es funktioniert.
Stellen Sie sicher, dass Sie keine Highlights verpassen, indem Sie Inside Intercom auf Apple Podcasts, Spotify, YouTube folgen oder den RSS-Feed in Ihrem bevorzugten Player herunterladen. Was folgt, ist eine leicht bearbeitete Abschrift der Episode.
Ein Durchbruch im Sprachverständnis
Des Traynor: Hallo noch einmal, Fergal. Wie geht es dir?
Fergal Reid: Gut, danke, Des. Ich war in den letzten sechs oder sieben Wochen hier bei Intercom sehr beschäftigt, daher freue ich mich sehr, heute darüber zu sprechen.
Des: Ja, erst vor sechs oder sieben Wochen haben wir uns zum Plaudern zusammengesetzt. Sie hatten, schätze ich, sechs oder sieben Wochen tatsächlicher Entwicklungszeit, um gegen die KI-Revolution anzukämpfen, die Ende November begann. Was hast du gelernt? Hat es Ihre Vorstellung davon verändert, was in der Welt des Kundenservice möglich sein wird?
Fergal: Ja, ich denke schon. Als wir uns das letzte Mal unterhalten haben, haben wir viel über ChatGPT gesprochen, und das war vielleicht eine Woche nach dem Start. Man kann sich darüber streiten, ob der große Unterschied hier ChatGPT ist oder die Modellfamilie, die OpenAI gebaut hat – wir haben hauptsächlich mit GPT-3.5 oder mit Text-Davinci-003 gearbeitet, um ganz genau zu sein.
Des: Sie sind Namen dieses bestimmten Moduls.
Fergal: Ja, das sind die Namen dieses speziellen Modells. Und tatsächlich gibt es eine Menge Verwirrung über diese Namen und was die verschiedenen Dinge sind. Aber im Grunde haben wir das Gefühl, dass die GPT-3.5-Serie von Modellen, Davinci-002, Davinci-003, diese Art von Dingen, die im letzten Jahr herauskamen, und dann Davinci-003, die genau zur gleichen Zeit herauskamen wie ChatGPT, waren Durchbrüche und haben es uns wirklich ermöglicht, mit dem Versuch zu beginnen, andere, qualitativ bessere Funktionen zu entwickeln.
„Das ist eine große Chance, denn es gibt so viele Aufgaben, die wir erledigen wollen, die am besten in natürlicher Sprache beschrieben werden.“
Des: Was glauben Sie, was jetzt möglich ist? Wohin steuern wir in der Welt des Kundenservice?
Fergal: Ich denke, im Kundenservice und sogar darüber hinaus ermöglichen uns diese Modelle einen besseren Umgang mit natürlicher Sprache als früher. Ich denke, ich könnte eine kleine Geschichte der Verarbeitung natürlicher Sprache erzählen. Lange Zeit waren es einfache Dinge wie reguläre Ausdrücke und so weiter. Dann hatten wir Text, der wirklich gut darin wurde, Keywords zu untersuchen, die häufig in Daten enthalten waren. Und dann, vielleicht vor drei, vier Jahren, begannen neuronale Netze wirklich gut zu verstehen: „Hey, was bedeutet dieser Satz?“ Aber jetzt, würde ich sagen, werden sie wirklich gut darin, „Hey, was bedeutet dieser Satz in einem tieferen Sinn …“, sie nähern sich viel mehr dem, was Menschen tun können, und verstehen, was in einem Gespräch mit mehreren Sätzen vor sich geht . Wovon spricht die Person? Den Inhalt von Satz eins mit dem Inhalt von Satz drei zusammenfügen, um herauszufinden, dass jemand gerade gesagt hat: „Oh, ich habe eine Frage zu Salesforce.“ Und der Teamkollege sagt: „Nun, was ist deine Frage? Womit kann ich Ihnen behilflich sein?" Und dann heißt es: „Ja, ich brauche wirklich Hilfe bei meiner Integration.“ Und die Systeme verstehen immer besser, dass es bei dieser Integration um die Salesforce-Integration geht, und haben eine Vorstellung davon, wohin das Gespräch als nächstes führen sollte.
„Plötzlich sind Maschinen in der Lage, sich diese anzusehen und daraus viel mehr Sinn zu machen.“
Unser Resolution Bot und die bereits eingesetzte maschinelle Lerntechnologie sind ziemlich gut darin, innerhalb eines bestimmten Satzes zu arbeiten. Aber jetzt wird die Technologie so weit verbessert, dass sie über mehrere Sätze hinweg gut und im Kontext viel besser ist. Als Menschen, die in natürlichen Sprachen kommunizieren und miteinander sprechen wollen, ist das für uns so selbstverständlich. Das ist eine große Erschließung, weil es so viele Aufgaben gibt, die wir erledigen wollen, die am besten in natürlicher Sprache beschrieben werden. Es gibt so viele Dokumente und Anleitungen und Artikel darüber, wie man etwas macht, die wir in natürlicher Sprache schreiben und miteinander kommunizieren. Und jetzt sind Maschinen plötzlich in der Lage, sich diese anzusehen und viel mehr Sinn daraus zu machen. Und jedes Mal, wenn diese Fähigkeit verbessert wird, schalten eine ganze Reihe von Produkten eine ganze Menge Dinge frei, die vorher nicht möglich waren. Und wir haben wirklich das Gefühl, dass das, was passiert ist, eine große Sache ist. Das ist unsere Meinung, bis wir Sachen bauen und sie unseren Kunden präsentieren und sehen, was unsere Kunden davon halten.
Des: Und das ist, was wir wollen.
Fergal: Ich meine, das haben wir versucht.
Des: Was ist Software, aber kodifizierte Meinungen, richtig?
Fergal: Richtig.
Es liegt an den Kunden
Des: Also, was haben wir gebaut? Woran hast du gearbeitet? Lassen Sie uns darüber sprechen.
Fergal: In der Produktentwicklung möchte man also immer seine Meinung überprüfen. Ihre Kunden sind immer der ultimative Schiedsrichter darüber, ob etwas gut ist oder nicht. Sie denken vielleicht, Sie hätten die erstaunlichste Technologie und das erstaunlichste Produkterlebnis, aber wenn sie ein Problem nicht löst und nicht verwendet wird, liegen Sie falsch. Und so wollten wir hier wirklich den Hype durchbrechen und uns selbst überzeugen: „Okay, was können wir schnell für Kunden bauen, was können wir ihnen vorlegen, um mit ihnen zusammenzuarbeiten, um zu sehen, was der Wert ist?“ Also gingen wir los und skizzierten Funktionen, die wir bauen und schnell in Produktion bringen konnten, die einen Teil dieser neuen Technologie nutzen und uns dabei helfen würden, herauszufinden, ob sie wertvoll oder ein Spielzeug ist.
„Sie könnten einfach eine Taste drücken oder eine Tastenkombination verwenden, um im Grunde zu sagen: ‚Hey, ich möchte eine Zusammenfassung dieser Funktion, legen Sie sie auf meinem Composer ab, damit ich sie leicht ergänzen kann.'“
Als erstes haben wir uns entschieden, ein Feature zu bauen, das im Wesentlichen eine Zusammenfassung durchführt. Und es gibt einen Grund, warum wir uns dafür entschieden haben. Mein Team, das Team für maschinelles Lernen hier bei Intercom, das Inbox-Team, hat herausgefunden, dass es zwei häufige Kundenjobs gibt, die wir häufig sehen. In vielen Unternehmen muss ein Supportmitarbeiter, bevor er das Gespräch übergibt, eine Zusammenfassung dieses Gesprächs schreiben. Wenn sie das nicht tun, muss der Endbenutzer sich wiederholen oder der empfangende Vertreter muss nach oben scrollen und eine Menge Zeug lesen. Der übergebende Support-Mitarbeiter muss also eine Zusammenfassung schreiben, und das ist eine echte Aufgabe.
Vor ungefähr anderthalb oder zwei Jahren versuchte mein Team, sich die damals besten neuronalen Netze anzusehen, T5 und all diese großen Netze, und herauszufinden, ob wir sie verwenden könnten, um eine angemessene Zusammenfassungsfunktion zu erstellen. Und leider sind wir zu dem Schluss gekommen, dass es einfach keinen Weg gibt. Gespräche sind einfach zu knorrig. Der Fluss eines Gesprächs bewegt sich zwischen diesen verschiedenen Teilen auf eine Weise, die für Menschen wirklich gut war – Menschen können es leicht nachschlagen und es ist schnell und sie können es scannen – aber selbst die ziemlich großen neuronalen Netzwerke, die wir im Resolution Bot haben, hatten zu kämpfen bei so einer Aufgabe. Und eines der ersten Dinge, die wir sahen, als wir mit dem jüngsten DaVinci-003-Modell GPT-3.5 spielten, war, dass es plötzlich großartig in der Zusammenfassung zu sein scheint. Und wir sagen: „Wow, das sieht toll aus.“
„Wir werden versuchen, wirklich ehrlich zu den Menschen zu sein. Wir werden unseren Kunden helfen, herauszufinden, welche Teile Spielzeug sind.“
Also haben wir eine Funktion erstellt und ein paar Iterationsrunden mit einer Zusammenfassungsfunktion im Posteingang durchgeführt. Sie könnten einfach eine Taste drücken oder eine Tastenkombination verwenden, um im Grunde zu sagen: „Hey, ich möchte eine Zusammenfassung dieser Funktion, legen Sie sie auf meinem Composer ab, damit ich sie leicht ergänzen kann.“ Es ist nicht perfekt. Möglicherweise müssen Sie ein wenig hinzufügen, aber es spart viel Zeit. Und wir hatten über 160 Kunden in unserer Beta-Version, die diese Funktionen nutzten, und sie hielten Zusammenfassungen für einen echten Gewinner. Es ändert das Spiel für einen Support-Mitarbeiter noch nicht vollständig; es übernimmt eine Kernaufgabe, aber es erfüllt diese eine Kernaufgabe.
Des: Und reduziert es. Was würden Sie sagen, ist die Reduzierung? Wenn das Schreiben normalerweise drei Minuten dauern würde – waren es nur 10 Sekunden, um die Zusammenfassung hinzuzufügen oder so?
Fergal: Ja.
Des: Es ist wie 90 % der Arbeit entfernt.
Fergal: Genau. Und wir haben einige Kunden, die sich sehr darüber freuen, weil sie möglicherweise einen wirklich langen E-Mail-Thread oder einen wirklich, wirklich langen Gesprächsverlauf haben, und es spart einfach eine Menge Zeit. Es ist ein bisschen so, als würdest du eine wissenschaftliche Arbeit oder so etwas lesen. Manchmal hilft Ihnen nur ein Überblick, die genauen Details zu finden, die Sie wollen. Ich denke, wir haben da etwas wirklich Gutes getroffen, und das ist eines der Features, an denen wir gearbeitet haben.
„Es ist einfach, mit der Hype-Maschine herauszukommen; Es ist einfach, Pressemitteilungen zu veröffentlichen: „Wir haben die Welt verändert.“ Und in der Praxis ist die Person, die darüber entscheidet, unsere Kunden.“
Wir werden versuchen, wirklich ehrlich zu den Menschen zu sein. Wir helfen unseren Kunden herauszufinden, welche Teile Spielzeug sind. Nicht alles, was wir gebaut und in die Beta-Version gesteckt haben, ist bahnbrechend, aber die Zusammenfassung ist eine der Aufgaben, die uns am meisten am Herzen liegt. Es ist wirklich fertig. Diese Technologie bewirkt etwas Transformatives – sie ist neu, sie ist aufregend und sie liefert echten Kundennutzen.
Des: Eine Sache, die wir immer versucht haben, in Bezug auf KI zu sein, ist nüchtern, weil wir versuchen, unseren Kunden einen Gefallen zu tun. Es ist einfach, mit der Hype-Maschine herauszukommen; Es ist einfach, Pressemitteilungen zu veröffentlichen: „Wir haben die Welt verändert.“ Und in der Praxis entscheiden das unsere Kunden. Wenn wir also eine Zusammenfassung veröffentlichen, nehmen wir ihr Wort dafür, dass es wirklich wertvoll ist. Das ist die Sache, die zählt, oder?
Fergal: Genau. Und schau, das ist etwas, worüber wir uns quälen. Manchmal verliert man gegen Leute, die bereit sind, einfach aufzudrehen. Wir haben uns sehr bemüht, das nicht zu tun, denn wenn man damit anfängt, glaubt man am Ende an seinen eigenen Hype.
Des: Die Erzählung geht der Software voraus. Das ist ein echtes Risiko.
Fergal: Und das versuchen Sie zu vermeiden. Wir waren uns dessen bei dieser Art von Technologie sehr bewusst, das heißt, dass sie fast sehr gut funktioniert und einer magischen und transformativen Wirkung sehr nahe kommt, aber manchmal fehlschlägt. Und so versuchen wir hier, uns ehrlich zu verhalten: „Okay, ist das wirklich schon gut genug?“ Wir wissen, dass es nicht perfekt ist, aber ist es schon gut genug? Und wofür ist es gut genug? Und Zusammenfassung ist etwas, was wir gut finden. Das ist eine Funktion, die unserer Meinung nach einen echten Mehrwert bietet.
Sie können verlieren, indem Sie etwas aufstellen, das gut aussieht, aber in der Produktion nicht wirklich funktioniert, und Sie können auch verlieren, wenn Sie zu konservativ sind. Und in der Vergangenheit hatten wir mit Resolution Bot Zeiten, in denen wir zu konservativ waren. Wir sagten: „Oh, wir wollen wirklich nicht, dass das nach hinten losgeht, es sei denn, wir sind uns ziemlich sicher, dass es die Antwort hat.“ Und dann sind einige Kunden zu uns gekommen und haben uns gesagt: „Oh, der Benutzer bekommt eine Weile keine Hilfe, geben Sie ihm etwas, auch wenn Sie sich irren.“ Und wir A/B-Tests und optimieren diesen Trash-Flow und so weiter. Es gab Zeiten, in denen man zu konservativ war. Deshalb verfolgen wir hier einen Ansatz, um unseren Kunden schnell neue Beta-Funktionen zur Verfügung zu stellen. Unsere Kunden sind von dieser Technologie sehr begeistert.
Mühelose Textbearbeitung
Des: Wie viele Features sind in der Beta? Fünf sechs?
Fergal: Das erste, was wir gemacht haben, war eine Zusammenfassung. Wir haben das getan, weil es einfach eine unkomplizierte, leicht zu integrierende und gut verständliche Aufgabe war. Danach haben wir uns den Komponisten angesehen. Da wir über Telemetrie und Metriken verfügen, wissen wir, dass ein Agent etwa die Hälfte der Zeit, die er in Intercom verbringt, im Composer verbringt, um Text zu schreiben oder ihn zu bearbeiten. Sie organisieren auch ihre Gedanken, aber sie verbringen viel Zeit damit, Texte zu schreiben und umzugestalten. Und als wir uns das ansahen, dachten wir: „Okay, das ist sehr gut zum Bearbeiten und Ändern von Text.“ Wir haben dort mit einigen kleinen Features begonnen, einige wie MVP-Features, um sie live zu bringen und zu sehen, wie das geht. Und so begannen wir mit Textbearbeitungs- und Textumformungsfunktionen. Am einfachsten zu erklären ist vielleicht die einfache Bearbeitung. Sagen Sie: „Hey, machen Sie diesen Text, den ich gerade geschrieben habe, freundlicher“ oder „förmlicher“, weil diese Technologie jetzt gut darin ist, den Ton anzupassen. Bisher gab es nicht wirklich etwas, womit man den Ton zuverlässig einstellen konnte. Wir haben viele Iterationen an der UX durchgeführt und sind zu einer UX gekommen, in der es eine Symbolleiste gibt und Sie einfach Text auswählen können. In unserer ersten Version konnten Sie den Text nicht auswählen und wir haben ihn iteriert. Der Kunde sagte uns, es sei nutzlos – er wollte nicht den Ton von allem im Komponisten ändern. Jetzt können Sie ein wenig auswählen.
„Es fällt mir auf zu wissen, dass wir vielleicht auf eine Welt blicken, in der das neue Kontextmenü wie ‚erweitern‘, ‚zusammenfassen‘, ‚glücklicher‘ und ‚formeller machen‘ aussieht.“
Es ist fast so, als würde man ein Bild bearbeiten. Und wir fingen an zu glauben, dass hier ein Paradigma entsteht. Ich erinnere mich, dass einst eine Textverarbeitung, in der man Text fett und kursiv schreiben konnte, wie „wow“ war. Und wir fragen uns, ob die Leute in Zukunft darüber in Bezug auf den Ton nachdenken werden. Es ist wie: „Oh, natürlich möchte ich schnell den Ton bearbeiten.“ Wenn Sie am Ende des Tages müde sind, einen Entwurf geschrieben haben und sagen: „Ich war nicht freundlich genug, das wirkt sich auf meine CSAT aus“, klicken Sie einfach auf eine Schaltfläche und bearbeiten Sie den Entwurf Ton und es wird freundlicher. Und es ist einfacher, diesen Knopf ein- oder zweimal zu drücken, als zu gehen und-
Des: Gehen Sie und schreiben Sie es um.
Fergal: Texte umschreiben ist Arbeit.
Des: Es fällt mir auf zu wissen, dass wir vielleicht auf eine Welt blicken, in der das neue Kontextmenü wie „erweitern“, „zusammenfassen“, „es glücklicher machen“ und „es formaler machen“ lautet. Das werden die Transformationen sein, die Sie zu tun versuchen. Es geht weniger um die Optik des Textes als vielmehr um den Ton.
Fergal: Absolut. Schauen Sie, wenn wir hier vor und zurück gehen, fragen wir uns: „Ist das ein Spielzeug? Haben wir ein cooles Spielzeug gebaut oder ist es etwas Erstaunliches?“ Und ich denke, es wird von Kunde zu Kunde unterschiedlich sein, aber der kühne Fall für diese spezielle Funktion ist: „Hey, ich bin am Ende des Tages müde und ich achte sehr auf den Ton, weil mein CSAT eine wichtige Metrik für mich ist und das ist ein Weg, es zu tun.“ Es ist eine Möglichkeit, ein angenehmeres Kundenerlebnis zu bieten.
Des: Nehmen Sie „Entschuldigung, hier ist Ihre Rückerstattung.“ Sie würden sagen: „Bitte lassen Sie das empathischer klingen“ oder was auch immer.
Fergal: Wir haben mit Empathie experimentiert. Wir haben uns tatsächlich darauf verlagert, „die Dinge formeller zu machen, die Dinge freundlicher zu machen“. Das ist die Art von Spektrum, die wirklich gut zu funktionieren scheint, also haben wir uns dafür entschieden. Und ich denke, es passt zu Intercom. Viele Leute versuchen, eine sehr persönliche, sehr freundliche Support-Erfahrung zu geben.
„Wenn man etwas aufschreibt, kommt es oft falsch rüber. Sie können also einfach sagen: ‚Hey, formulieren Sie das anders‘.“
Um ganz transparent zu sein, wir sind uns immer noch nicht sicher, wo genau es im Spektrum von Spielzeug bis wertvoll liegt. Einige Kunden sagen, dass es sehr wertvoll ist, und deshalb evaluieren wir das weiter. Aber wir haben das in der Beta. Wir möchten unseren Kunden sagen, dass dies die Art von Dingen sind, die wir bauen und untersuchen.
Das ist eine Funktion. Das nächste, was wir uns angeschaut haben, ist eine Umformulierungsfunktion. Und wiederum sind diese Sprachmodelle sehr gut darin, ein eingeschränktes Textstück zu nehmen und es zu bearbeiten oder zu ändern. Das sieht man erst bei der Zusammenfassung. Wenn Sie etwas aufschreiben, kommt es oft falsch rüber. Sie können also einfach sagen: „Hey, formulieren Sie das anders.“ Und wieder ist es diese Art von schneller UX, bei der Sie es einfach markieren und darauf klicken. Es ist nur ein bisschen einfacher, als es selbst umzuschreiben. Es gibt ein wenig Latenz, wenn Sie das tun. Wir evaluieren also noch. Aber einige Kunden wiederum mögen es wirklich, es funktioniert wirklich für sie in ihrem Geschäft und wir erwarten, dass die Latenz im Laufe der Zeit sinken wird, wenn diese Modelle immer besser werden. Das ist also Textumformulierung. Das sind sozusagen die ersten Features, die wir im Composer verfolgt haben.
Jetzt kommen die größeren Ticketsachen als nächstes, und wir fangen an, die Dinge zu untersuchen, die möglicherweise bahnbrechender sind. Eine Sache, die wir damit versuchen, ist das, was wir die Erweiterungsfunktion nennen. Wir wurden von Dingen wie Co-Pilot für Programmierer inspiriert. Im Co-Piloten können Sie einen Kommentar schreiben, der die volle Funktion ausfüllt und Ihnen nur eine Menge Zeit spart. Und wir sagten: „Oh, können wir etwas bauen, das ein bisschen so für den Kundensupport ist?“ Und die Idee ist, dass Sie vielleicht eine kurze Zusammenfassung dessen schreiben, was Sie wollen, und das dann hervorheben, sagen wir, erweitern, und Ihr Komponist füllt das aus. Wir haben es geschafft, wir haben es versandt, und die Kunden sehen deutlich, dass es sich um ein wertvolles Produkt handelt und nicht um ein Spielzeug – wenn es funktioniert. Aber es funktioniert in einigen Bereichen viel besser als in anderen. Wenn Sie Fragen beantworten, würden allgemeine Informationen aus dem Internet gute Arbeit leisten -
Des: Als ob Sie Ihr Telefon zurücksetzen müssten oder was auch immer.
Fergal: Ja, genau. Dafür funktioniert es sehr gut. Wenn Sie jedoch versuchen, etwas zu tun, bei dem Sie eine Kurzschrift schreiben, und es tatsächlich viel Kontext gibt, der für Ihr Unternehmen spezifisch ist, wie Sie diese Art von Frage beantworten, kann es halluzinieren und es wird etwas sagen, das Sie bearbeiten müssen aus. Trotzdem mögen es einige Kunden wirklich und es funktioniert wirklich gut für sie. Aber wir denken wirklich, dass das eine Art Version eins ist. Wenn Sie dies verwenden, müssen Sie es überprüfen und sehen, wie gut es für Sie und Ihr Unternehmen funktioniert. Wir haben jedoch ein Projekt, das ständig neue Dinge dafür auswertet, wo es heißt: „Hey, können wir die vorherigen Antworten nehmen, die Sie zu denselben Themen gegeben haben?“ Sie geben uns also Zusammenfassungen aus drei Wörtern, was Sie tun möchten, z. B. „Kundendanke zurückerstatten“, und wir suchen die letzten fünf Dinge, die Sie über Rückerstattungen gesagt haben. Wir werden auch nachsehen, ob Sie vielleicht ein Makro zu Rückerstattungen haben. Wir schauen uns auch vorher den Kontext des Gesprächs an.
„Womit wir experimentieren, ist: Können wir den Berg überwinden? Können wir anfangen, etwas wirklich Transformatives zu schaffen, indem wir diesen Kontext einbeziehen?“
Des: Wenn es irgendetwas in der Hilfe gibt, all diese Sachen.
Fergal: Wir sind noch nicht so weit gegangen, Artikel und Material aus dem Hilfezentrum einzuziehen. Wir haben uns nur angesehen, was Sie und der Benutzer vor zwei Runden gesagt haben, und alles in eine Eingabeaufforderung eingefügt, die dann sagt: „Okay, mit all diesen Informationen, gehen Sie bitte und nehmen Sie diese Drei-Wort-Kurzschrift und machen Sie eine Anti-Zusammenfassung Verwandle es in eine große Sache.“
Des: Ja, total. Aus „Entschuldigung, hier ist eine Rückerstattung, danke“ wird also „Wir entschuldigen uns wirklich für die Unannehmlichkeiten. Wir haben eine Rückerstattung veranlasst, die Sie in drei bis vier Tagen sehen sollten. Und wir bedauern …“
Fergal: In dem Stil, den Sie normalerweise verwenden – Sie persönlich, der einzelne Agent – und alle relevanten Makros, die Sie haben, mit einbeziehen. Da sind wir wirklich. Und das letzte Stück ist noch nicht in Produktion. Die V1 ist in Produktion. Die V1 wurde von Hunderten von Beta-Kunden verwendet. Aber womit wir experimentieren ist: Können wir den Berg überwinden? Können wir anfangen, etwas wirklich Transformatives zu schaffen, indem wir diesen Kontext einbeziehen? Und das dauert noch an. Ich würde sagen, wir sind optimistisch, aber noch nicht sicher. Das ändert sich Woche für Woche für uns, deshalb freuen wir uns sehr darüber. Und das ist im Moment die erweiterte Feature-Version eins. Aber wir können sehen, dass Version zwei und Version drei auf der Strecke bleiben.
Effizienz der Fahrunterstützung
Fergal: Die letzte Funktion, mit der wir in unserer Beta experimentiert haben, war, unseren Kunden direkten Zugriff auf GPT zu geben. Also keine Aufforderung, dem Model nichts sagen, nur sagen: „Hey, steck da rein, was du willst.“ Und das haben wir wirklich als schnelles Beta-Experiment gemacht. Wir haben unseren Kunden in der Beta-Version nicht viel Anleitung zur Verwendung gegeben. Wir haben einige von ihnen verwirrt und es lief nicht so gut, aber einige Kunden fanden neue Anwendungsfälle, einschließlich der Übersetzung, wo es ihnen einen echten Mehrwert brachte. Nun, diese Modelle sind nicht die besten in der Übersetzung, aber vielleicht ist das eine interessante KI-Produktentwicklungstaktik, die so lautet: „Hey, wenn Sie Beta-Kunden haben, geben Sie ihnen vielleicht ein bisschen mehr Leistung, als Sie vielleicht erwarten, und Sie werden dir sagen, was sie brauchen.“
Des: Sehen Sie, was auftaucht. Sehen Sie selbst, was erwartet wird.
Fergal: Genau. Und die Erwartungen, denke ich, werden sich dabei schnell ändern. Vielleicht sagt uns das, dass wir eine Übersetzung brauchen, weil es da draußen sehr gut verstandene Übersetzungsmodelle gibt.
„Vielleicht hat es eine Quelle daneben, und plötzlich werden diese fünf Minuten der Suche nach der Antwort augenblicklich. Und hier beginnt es wirklich bahnbrechend zu werden.“
Des: Es scheint also so, als ob all diese Funktionen Effizienzmaximierer für Support-Teams sind. Sie reduzieren viel Undifferenziertes, ob es nun die Intros und Outros sind oder ob es nur darum geht, etwas umzuschreiben, wozu sie vielleicht nicht die Energie haben, um es glücklicher oder formeller zu machen. All dies sind unterschiedliche Möglichkeiten, um den Support-Mitarbeitern an vorderster Front viel Zeit zu sparen. Letztendlich geben sie ihnen mehr Zeit, sich auf die schwierigeren Teile des Gesprächs zu konzentrieren, die die technische Suche oder die tiefen Tauchgänge sind. Wird es dort am besten eingesetzt? Ist das bisher unser bester Gedanke? Wenn Sie darüber nachdenken, wo wir diese Technologie im GPT-Stil sonst noch in die Support-Erfahrung einbringen können, woran denken Sie sonst noch?
Fergal: Unsere größeren Kunden haben viele Supportmitarbeiter, die Tag für Tag im Composer arbeiten. Wenn wir sie also schneller und effizienter machen können, ist ein Effizienzgewinn von 10 % oder 20 absolut enorm.
Des: Natürlich, ja. Wir haben Kunden mit Tausenden von Arbeitsplätzen, also ist es wirklich transformierend.
Fergal: Genau. Spielverändernd. Und das ist ein Bereich, der uns sehr angezogen hat. Und diese Technologie wird immer besser. Es ist nicht der einzige Ort, aber wir sind diesbezüglich wirklich optimistisch. Einige unserer Kunden werden sehr nett Videos von ihrem tatsächlichen Alltag mit uns teilen. Und Sie sehen diesen Workflow, in dem es so ist: „Hey, ich versuche, eine Frage zu beantworten, und ich weiß die Antwort nicht. Ich muss einen internen Helpdesk-Artikel nachschlagen oder eine ähnliche Konversation finden, und ich navigiere herum.“ Wenn wir das bis zu dem Punkt kurzschließen können, wo es heißt: „Hey, hier ist die KI. Vielleicht gibst du ein paar Worte dazu …“ Oder vielleicht kommen wir darüber hinaus. Wir haben andere Prototypen, über die ich in ein paar Minuten sprechen werde, wo vielleicht die Antwort einfach da ist und auf Sie wartet. Vielleicht hat es eine Quelle daneben, und plötzlich werden diese fünf Minuten der Suche nach der Antwort augenblicklich. Und hier beginnt es, wirklich bahnbrechend zu werden. Ich denke, da werden wir bald hingehen.
Des: Ja, das macht Sinn. Kleine Gewinne in großen Teams sind immer noch enorm, und große Gewinne in einem bestimmten Workflow, der Zusammenfassungssache, sind natürlich auch enorm. Ich denke, einige Leute haben diese seltsame binäre Welt, in der wir nichts getan haben, bis wir den gesamten Support automatisiert haben. Meine persönliche Meinung ist, ich glaube nicht, dass wir jemals wirklich den gesamten Support automatisieren werden. Ich denke, wir werden den undifferenzierten Teil des Supports buchstäblich ausmerzen, das „spitze, klickende“, „intro-y-outro-y“-Zeug, bei dem Sie jeden Tag dasselbe tun.
Fergal: Und hoffentlich wirst du ihre frustrierenden Teile los. Du navigierst herum, du versuchst zu suchen, und du weißt, dass die Antwort hier irgendwo drin ist. Sie wissen, dass Sie diese Frage letzten Monat fünf Mal beantwortet haben, aber Sie können sie nicht finden.
„Ehrlich gesagt überschreiten diese Funktionen die Schwelle der Nützlichkeit viel schneller, als ich erwartet hätte.“
Das letzte Feature, das in der Beta live war, ist ein artikelbasierter Expander. Wir sehen, dass dies sehr schnell fast zu einer Standardfunktion wird. Überall dort, wo Sie einen Textartikel schreiben, wird es zum Standard, dass Sie die Möglichkeit haben möchten, ein großes Sprachmodell anzurufen und zu sagen: „Hey, helfen Sie mir, das fertigzustellen, erweitern Sie das. Hier sind meine Stichpunkte.“ Und so liefern wir das in unserer Beta für das Produkt Intercom-Artikel aus. Wieder ist es noch früh. All diese Dinge sind früh – es sind sechs bis acht Wochen vergangen, aber manchmal ist es magisch. Manchmal können Sie vier oder fünf Aufzählungszeichen schreiben, um den Inhalt eines Artikels zu beschreiben, und dann geben wir ihm in der Eingabeaufforderung das Standardformat eines Intercom-Artikels, damit es weiß, wie es geht und diese in die Überschriften und einfügt bald. Es ist magisch, wenn es funktioniert und wie oft es funktioniert und wie gut es für die Menschen funktioniert. Sie müssen den Inhalt noch überprüfen. Es kann Dinge hineinstecken, aber wir denken, dass es Möglichkeiten gibt, das runterzukriegen. Und ehrlich gesagt überschreiten diese Funktionen die Schwelle der Nützlichkeit viel schneller, als ich erwartet hätte. Also ja, wir experimentieren damit.
Die letzte Grenze
Des: Also, weiter weg, wie sehen Sie die Flugbahn von all dem? Wohin von hier?
Fergal: Das sind die Dinge, die wir in der Beta hatten. Wir haben Hunderte von Kunden, die sie verwenden, und wir haben ein echtes Signal für den Kundenwert. Ich sage Ihnen genau, wo wir jetzt mit maschinellem Lernen in der Produktion stehen. In den letzten ein oder zwei Tagen hatten wir eine Funktion, die unser eigenes internes CS-Team verwendet: In der Vergangenheit hatten wir eine Funktion für intelligente Antworten, bei der Ihre gemeinsamen Grüße abgebaut werden. Das sind die Dinge, die keine Informationen haben, die die Frage des Benutzers nicht beantworten – sie ölen nur die Räder, machen es schnell und bissig und einfach zu sagen: „Oh, danke. Gern geschehen. Kann ich sonst noch etwas tun?“ Und diese Technologie ist wunderbar für so etwas. Linguisten nennen sie phatische Ausdrücke.
In den letzten Tagen haben wir eine Version davon an unser Intercom CS-Team gesendet, wo sie diesen ausgegrauten Text sehen, der im Composer vorab ausgefüllt ist, aber für das spezifische Gespräch relevant ist. Wenn sie also zuvor gesagt haben: „Hallo, kann ich Ihnen helfen?“ und der Benutzer sagte: „Oh ja, ich möchte etwas Hilfe mit dem Artikelprodukt“, würde er dann vorschlagen: „Oh ja, lassen Sie mich die Artikel nachschlagen Produkt für Sie.“ Es wird noch nicht für Sie nachgeschlagen, aber das erledigen wir. Vor drei oder vier Tagen dachten wir: „Okay, ich werde das intern versenden. Wir sind uns nicht sicher, ob es lästig wird und ob die Leute blind dafür werden, weil sie es oft sehen und es nur für eine Teilmenge hilft“, und wir sind immer sehr vorsichtig damit. Aber bisher war die interne Resonanz unseres CS-Teams großartig. Daran wollen wir also weiter arbeiten. Vielleicht müssen wir ein anderes System einsetzen, das begrenzt, wie oft es angezeigt wird. Das ist eine Sache, an der wir arbeiten.
Ich habe vorhin das Erweiterungsstück erwähnt, und jetzt arbeiten wir daran: „Hey, können wir das auch ohne die Kurzschrift machen?“ Können wir basierend auf dem, was die Benutzer gerade gesagt haben, herausfinden, was Sie als Nächstes eingeben werden? Und wir schauen in Ihre Wissensdatenbank, versuchen, einen relevanten Kontext zu finden, und geben diesen an das Modell weiter. Das Modell selbst ist dafür nicht gut genug. Es kennt Ihr Geschäft nicht, aber vielleicht können wir es erweitern. Vielleicht können wir eine Kombination aus traditionellerem Text für maschinelles Lernen mit dem Modell verwenden und etwas Gutes bekommen. Wir haben Prototypen und wir arbeiten daran, aber wir haben sie noch nicht an unsere Kunden ausgeliefert, nicht einmal in irgendeiner Beta-Form, weil wir noch evaluieren, ob das gut genug ist, um transformativ zu sein, oder ob es langweilig und nervig wird. Wo diese Schwelle liegt, ist nicht klar. Wir sind ein bisschen optimistischer in Bezug auf das Expanding-Stil-Ding, bei dem Sie es auffordern müssen, weil der Benutzer lernen kann, wann er es tun muss. Sie können lernen, wie man sie abfragt. Wir alle mussten lernen, wie man mit Google umgeht, und wir erwarten, dass die Nutzer auch mit diesen Systemen viel besser umgehen werden.
Da sind wir ungefähr. Wir bewegen uns schnell und versenden die Dinge schnell an die Kunden, um sie wirklich zu überprüfen und hier einen echten Mehrwert zu erzielen. Wir versuchen vorsichtig zu sein, um nicht in die Hype-Falle zu tappen. Wir glauben, dass hier ein riesiges Potenzial steckt, aber es ist zu einfach, eine Zielseite hochzukleben und zu sagen: „Holen Sie es sich hier. Es wird alles beantworten.“ Und das ist nicht gut. Die Leute werden einfach blind und abschalten.
„Jeder hat das gesehen und sagt: ‚ChatGPT ist wirklich gut. Wenn ich so eine Technologie bekommen könnte, um meinen Kundensupport zu unterstützen, ist das großartig.“ Aber von der Stange geht das nicht. Es kennt Ihr Geschäft nicht“
Des: Ich denke, Sie schaden Ihrem Ruf, wenn Sie sagen: „Dieses Ding macht etwas“, und das tut es eindeutig nicht, aber Sie haben es für Klicks oder was auch immer getan. Es fühlt sich so an, als ob das eigentliche Produkt, auf das alle in diesem neuen Bereich warten, der Endbenutzer-Bot ist, der die meisten Fragen immer richtig beantwortet. Gedanken dazu? Wochen, Monate, Tage?
Fergal: Das ist natürlich ein riesiger Bereich für alle. Auch den Komponisten würde ich nicht unterschätzen – ein Teil der Fragen wird immer auf den Komponisten übergehen. Und wenn wir diese Zeit für diese reduzieren können, ist das enorm. Aber absolut, einer der großen Preise in diesem Bereich ist, ob wir die Erfahrung des Gesprächsverständnisses, die wir mit ChatGPT gesehen haben, für Ihr individuelles Unternehmen zum Laufen bringen und gleichzeitig Halluzinationen vermeiden können? Es gibt viele Leute, die das untersuchen. Auch das untersuchen wir. Wir haben interessante und vielversprechende Prototypen, aber wir wissen noch nicht genau, ob wir die Schwelle überschritten haben, wo Halluzinationen selten genug sind, dass es sich lohnt und wertvoll ist. Wir fangen an, intern einige Meinungen dazu herauszukristallisieren, aber wir sind noch nicht bereit, mit Ihnen zu teilen, wo wir uns damit befinden.
Des: Völlig fair. Nun, ich schätze, wir werden uns in sechs Wochen oder so wieder melden.
Fergal: Es war eine sehr schnelllebige Zeit. Sehen Sie, das ist ein sehr spannendes Arbeitsfeld. Die Erwartungen der Kunden sind sehr hoch. Jeder hat das gesehen und sagt: „ChatGPT ist wirklich gut. Wenn ich so eine Technologie bekommen könnte, um meinen Kundensupport zu unterstützen, ist das großartig.“ Aber von der Stange geht das nicht. Es kennt Ihr Geschäft nicht. Sie können es heute nicht wirklich feinabstimmen. Selbst wenn Sie es auf Ihr spezielles Geschäft abstimmen könnten, würde es das wahrscheinlich nicht tun. Wir müssen clevere Techniken finden, und ich denke, dass Unternehmen wie Intercom gut positioniert sind, um dies zu versuchen. Und ja, es gibt viele interessante Technologie- und Sprachmodelle da draußen. Ich bin wirklich gespannt, all die Innovationen in diesem Bereich zu sehen.
Des: Cool. Vielen Dank.
Fergal: Danke. Danke dir.
☞ Klicken Sie hier , um sich der Beta-Warteliste für unsere KI-Funktionen anzuschließen oder KI-Neuigkeiten von Intercom zu erhalten.