KI-gestützte Benutzeroberfläche (auch bekannt als „Return of the Chat“)

Veröffentlicht: 2023-08-11

Die KI-Revolution ist größer als Mobilgeräte, größer als die Cloud, und einige bei Intercom sagen, sogar größer als das Internet selbst.

Viele der Prognosen basieren darauf, wie die neuen Funktionen die Software erheblich leistungsfähiger machen werden: die Fähigkeit, Bilder aus Beschreibungen zu rendern, ausführlich zuzuhören/zu lesen und in Sekundenschnelle zusammenzufassen, Probleme zu diagnostizieren, Themen zu kategorisieren und Maßnahmen zu ergreifen, alles mit der Geschwindigkeit des Denkens. All diese neuen Kräfte werden Softwareprodukte enorm verändern, und wir sehen bereits erste Anzeichen dafür. Eine weitere wesentliche Änderung, die ich erwarte, ist das Aufkommen der Chat-Benutzeroberfläche (auch Natural Language Interface genannt) als Standardschnittstelle für Produkte.

Neal Stephenson argumentierte in seinem epischen Essay/Rand „Am Anfang war die Befehlszeile“ (zu Recht), dass Befehlszeilen effektiver und effizienter sind als Point-and-Click- (oder Touch- und Swipe-)Schnittstellen. Was sie jedoch nicht sind, ist intuitiv oder für mehr als einen kleinen Prozentsatz der Welt zugänglich (es sei denn, Sie hätten gedacht, dass die Größenänderung von Bildern nur ein einfacher find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; weg.)

Die Befehlszeile besteht aus einer großen Anzahl geheimnisvoller Befehle mit albernen Namen und komplexer Syntax, aber der LLM-basierte Chat ist viel nachsichtiger. Es gibt ein Dutzend verschiedene Möglichkeiten zu sagen, dass Sie die Größe eines Bildes ändern möchten, und die LLMs werden jede davon verstehen.

Wenn Sie dasselbe Argument auf die Benutzeroberfläche übertragen, werden Sie einige Ähnlichkeiten feststellen. Hier ist zum Beispiel Workday, ein Produkt im Wert von 60 Milliarden US-Dollar. Ich nutze es widerwillig, um Urlaub zu beantragen, wenn ich mich daran erinnern kann, wie ich mich anmelden muss. Es ist sicherlich einfacher als die Befehlszeile, aber es sind immer noch eine Reihe von Schritten erforderlich, um das richtige Formular zu finden und auszufüllen.

Fragen Sie sich nun: Was ist einfacher, als „Des möchte den 14. Um Bonuspunkte zu erhalten, fragen Sie sich, ob Sie jemals eine allgemeine Benutzeroberfläche entwerfen könnten, die schneller wäre, als wenn ich einfach „des will den 14. Oktober frei zum Hochzeitstag“ eingeben würde. Das ist nicht einfach … Tatsächlich haben wir bereits einen großen Bedarf an tastaturorientierten Schnittstellen gesehen, und das schon , bevor sie so intuitiv waren. Anders ausgedrückt: Wie lange dauert es, bis Workday (mindestens) diese Art von Benutzeroberfläche hinzufügt?

(Okay, ich verstehe dich, ja, es könnte Jahre dauern.)

Wir begannen mit niedrig hängenden KI-Früchten

Heutzutage sehen wir, wie KI-Chatbots in Bereichen erfolgreich sind, in denen wir bereits eine Interaktion mit einem Textfeld erwartet haben, z. B. Suchmaschinen, Artikel schreiben, Kundensupport-Messenger (hi Fin!). Aber das ist noch nicht alles, das sind einfach die einfachsten und einfachsten Die funkfreundlichsten Anwendungsfälle für KI. Als Designer sind wir möglicherweise nicht bereit zu akzeptieren, dass die meisten unserer Arbeiten auf ein abgerundetes Rechteck reduziert werden, selbst wenn es eine hübsche Typografie aufweist.

Aber wir werden sehen, dass die Chat-Benutzeroberfläche Produkte transformiert, die zuvor durch ihre zwangsläufig harten Benutzeroberflächen, Sprachen oder Befehle eingeschränkt waren. Als ein nachvollziehbares Beispiel nehmen wir an, Sie befinden sich in Excel und möchten alle negativen Zellen rot hervorheben – wie machen Sie das? Die meisten von uns gehen zu Google, merken sich dann, dass das Wort, nach dem wir suchen, bedingte Formatierung ist, und dann googeln wir erneut „Bedingte Formatierung Excel“, und dann erklärt das Google-Antwortfeld, was zu tun ist, also kehren wir zu Excel zurück und folgen den Anweisungen Diese Anweisungen werden automatisch ausgeführt . Dann merken wir uns sofort das gesamte Wissen, das wir vorübergehend gewonnen haben, und kehren zu dem zurück, was wir ursprünglich versucht haben.

Heute können Sie einfach einen Bot bitten, dies für Sie zu tun. Chat-UI kann zu einer enormen Demokratisierung des Zugriffs auf Software führen.

Komplexe Software wird mit der Chat-Benutzeroberfläche besser

Die meisten Benutzer von Unternehmensprodukten sind ständige Neulinge – sie wissen gerade genug, um die ein oder zwei Aufgaben zu erledigen, die sie am häufigsten benötigen, aber darüber hinaus werden sie sich nur durch Hacken und Schrott an ein Ergebnis herantasten. Sie haben viele Vorstellungen von den Aufgaben, die sie gerne erledigen würden, wissen aber einfach nicht wie. Dieses Upstream-Hindernis breitet sich nach unten aus und bevor man es merkt, gibt man einfach den Glauben auf, das Produkt sei gut oder könne die Probleme lösen. Wenn Sie jemals einen Kunden wegen einer Funktion an einen Konkurrenten verloren haben, haben Sie diesen Schmerz bereits erlebt.

Denken Sie an Google Analytics oder Salesforce oder an Produkte mit ihrer Leistungsfähigkeit und Komplexität. Sie wissen, dass irgendwo tief unten die richtige Antwort auf eine wichtige Frage vergraben ist, wie zum Beispiel: „ Woher bekommen wir unsere leistungsstärksten Traffic-Quellen und was ist die neueste neue Quelle?“ oder „ Bei welchen Wettbewerbern sehen wir einen Anstieg der Deals?“ , aber es besteht keine Chance, dass Sie es selbst herausfinden können. Also fragen Sie entweder Ihren Experten vor Ort, oder Sie denken sich die Antwort aus und hoffen, dass es niemand herausfindet.

Das Erlernen der Benutzeroberfläche lohnt sich nur selten, auch wenn sie schön und elegant ist.

Aber wenn Sie einfach das, was Sie tun möchten, eingeben (oder sagen) und zusehen können, wie es passiert, verschwinden die Barrieren. Jeder erwirbt das Fachwissen, jeder wird zum Power-User und plötzlich ist das Produkt ein Game-Changer. Hier ist eine lächerlich einfache Möglichkeit, es zu visualisieren:

Bei all diesen Produkten gibt es Benutzer, die wissen, was sie tun möchten, aber nicht wissen, wie sie es tun sollen. Natural Language UI schrumpft diese Lücke auf nahezu Null.

Chat-Benutzeroberflächen für die frühe Veröffentlichung

Wir sehen bereits einige Beispiele für diesen Ansatz in freier Wildbahn.

  • Equals: Equals wurde von zwei ehemaligen Intercomrades entwickelt und ist eine Tabellenkalkulation der nächsten Generation mit Live-Verbindungen zu Live-Daten. (Haftungsausschluss/Offenlegung: Ich bin ein Investor.) Es ermöglicht Ihnen, das einzugeben, was Sie tun möchten, und Equals wird die Excel-Befehle ausarbeiten und generieren, die Sie nie kannten und die Sie selbst nicht ausführen konnten .

  • Mixpanel: Das Eventanalyseunternehmen hat kürzlich Spark angekündigt, eine generative KI-Chat-Schnittstelle, die es Ihnen ermöglicht, im Klartext eine Frage zu Ihren Daten zu stellen.

  • Stripe: Stripe hat eine neue Radarfunktion vorgestellt, die es Kunden ermöglicht, mithilfe natürlicher Sprache komplexe Regeln zur Betrugsprävention zu erstellen.

Während ich mich hier auf die Chat-Benutzeroberfläche als Eingabemechanismus konzentriere, stimmt es, dass Chat als Ausgabe schwieriger ist, da für viele Zwecke visuelle Priorisierung, Hierarchie, Design, Layout usw. einer Chat-Blase überlegen sind. Dinge wie Dashboards sind beispielsweise von Natur aus visuelle Elemente, die nicht durch eine Textantwort ersetzt werden können. Es kann jedoch sein, dass die Benutzeroberfläche vieler Produkte deutlich verblasst – zum Beispiel ist „Buchen Sie Ihren Urlaub am 14. Oktober“ → „Fertig“ eine vollkommen akzeptable Interaktion.

Ich bin davon überzeugt, dass Software dorthin führen wird – eine multimodale Kommunikation mit gemischten Methoden zwischen Menschen und Software. Wir hatten „Zeigen und Klicken“ und „Tippen und Wischen“ und jetzt befinden wir uns im Zeitalter des „Tippens und Sagens“. Diese Demokratisierung des Zugangs zu anspruchsvollen Produkten wird die Produkte und die Benutzer gleichermaßen verändern. Denn wie verändert sich Ihr Unternehmen, wenn alle Ihre Benutzer jetzt wissen, wie alles in Ihrem Produkt zu tun ist? Finden Sie es am besten heraus, bevor es Ihr Konkurrent tut.

Flossenstart CTA horizontal