UI bertenaga AI (alias "Return of the Chat")

Diterbitkan: 2023-08-11

Revolusi AI lebih besar dari seluler, lebih besar dari cloud, dan beberapa di Intercom mengatakan bahkan lebih besar dari internet itu sendiri.

Banyak proyeksi didasarkan pada bagaimana kemampuan baru akan membuat perangkat lunak jauh lebih kuat: kemampuan merender gambar dari deskripsi, mendengarkan/membaca panjang lebar dan meringkas dalam hitungan detik, mendiagnosis masalah, mengkategorikan topik, dan mengambil tindakan, semua dengan kecepatan pikiran. Semua kekuatan baru ini akan mengubah produk perangkat lunak secara besar-besaran, dan kami sudah melihatnya sekilas. Satu perubahan substansial lainnya yang saya harapkan adalah munculnya Chat UI (alias antarmuka bahasa alami) sebagai antarmuka standar untuk produk.

Esai / kata-kata kasar Neal Stephenson "Pada awalnya adalah baris perintah" (memang benar) berpendapat bahwa baris perintah lebih efektif dan efisien daripada antarmuka tunjuk dan klik (atau sentuh dan gesek). Namun, apa yang bukan itu adalah intuitif atau dapat diakses oleh lebih dari sebagian kecil dunia (kecuali jika Anda mengira bahwa mengubah ukuran gambar hanyalah find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; jauhnya.)

Baris perintah adalah sejumlah besar perintah misterius dengan nama konyol dan sintaksis rumit, tetapi obrolan bertenaga LLM jauh lebih mudah memaafkan. Ada selusin cara berbeda untuk mengatakan Anda ingin mengubah ukuran gambar, dan LLM akan memahami semuanya.

Jika Anda mengambil argumen yang sama ini ke UI, Anda akan menemukan beberapa kesamaan. Misalnya, ini adalah Workday, sebuah produk bernilai $60 miliar. Saya dengan enggan menggunakannya untuk meminta waktu istirahat, ketika saya dapat mengingat cara masuk. Ini lebih mudah daripada baris perintah pastinya, tetapi masih ada serangkaian langkah untuk menemukan formulir yang tepat dan mengisinya.

Sekarang tanyakan pada diri Anda, apa yang lebih mudah, mengetik "des want 14 oct off for wedding anniversary" atau menavigasi UI di atas dengan tab tak berujung, tombol hantu, dan drop-down? Untuk poin bonus, tanyakan pada diri Anda apakah Anda dapat merancang UI umum yang lebih cepat dari saya hanya dengan mengetik "des want 14 okt off untuk ulang tahun pernikahan". Itu tidak mudah… Faktanya, kami telah melihat keinginan besar untuk antarmuka yang mengutamakan keyboard muncul, dan itu sebelum mereka seintuitif ini. Dengan kata lain, berapa lama sebelum Workday (setidaknya) menambahkan jenis UI ini?

(Oke, saya dengar, ya bisa bertahun-tahun.)

Kami mulai dengan buah AI yang tergantung rendah

Hari ini kita melihat AI chatbots berkembang pesat di area di mana kita sudah mengharapkan interaksi dengan kotak teks, misalnya mesin pencari, penulisan artikel, pesan dukungan pelanggan (hai Fin!) Tapi itu tidak akan berhenti di situ, itu hanya yang termudah dan sebagian besar kasus penggunaan ramah radio untuk AI. Sebagai desainer, kita mungkin tidak siap untuk menerima bahwa sebagian besar pekerjaan kita akan disaring menjadi satu persegi panjang bulat, bahkan dengan tipografi yang cantik.

Tapi kita akan melihat UI obrolan mengubah produk yang sebelumnya dibatasi oleh antarmuka pengguna, bahasa, atau perintah yang sangat keras. Sebagai salah satu contoh yang dapat diterima, katakanlah Anda menggunakan Excel dan ingin menyorot semua sel negatif dengan warna merah – bagaimana Anda melakukannya? Sebagian besar dari kita pergi ke Google, lalu ingat kata yang kita cari adalah pemformatan bersyarat , lalu kita kembali ke Google "pemformatan bersyarat Excel" dan kemudian kotak jawaban Google menjelaskan apa yang harus dilakukan, jadi kita kembali ke Excel dan mengikuti instruksi tersebut secara otomatis . Kemudian kami langsung mengingat semua pengetahuan yang diperoleh sementara di sepanjang jalan dan kembali ke apa pun yang kami coba lakukan di tempat pertama.

Hari ini, Anda bisa meminta bot untuk melakukannya untuk Anda. UI Obrolan dapat mengarah pada demokratisasi besar-besaran akses ke perangkat lunak.

Perangkat lunak yang kompleks menjadi lebih baik dengan UI Obrolan

Sebagian besar pengguna produk perusahaan adalah pemula terus-menerus – mereka cukup tahu untuk melakukan satu atau dua tugas yang paling sering mereka butuhkan, tetapi lebih dari itu mereka hanya akan meretas dan mengorek jalan menuju hasil. Mereka memiliki banyak gagasan tentang tugas yang ingin mereka selesaikan, tetapi mereka tidak tahu caranya. Hambatan di hulu ini menyebar ke hilir dan sebelum Anda menyadarinya, Anda menyerah begitu saja dengan berpikir bahwa produk itu bagus atau dapat menyelesaikan masalah mereka. Jika Anda pernah kehilangan pelanggan karena pesaing karena fitur yang sudah Anda miliki, Anda pernah mengalami rasa sakit ini.

Pikirkan tentang Google Analytics, atau Salesforce, atau produk dengan kekuatan dan kerumitannya. Anda tahu bahwa terkubur jauh di dalam sana adalah jawaban yang tepat untuk pertanyaan penting seperti " di mana kami mendapatkan sumber lalu lintas berkinerja tertinggi, dan apa sumber baru terbaru?" , atau " pesaing apa yang kita lihat meningkat dalam transaksi?" , tetapi tidak ada kemungkinan Anda akan dapat mengetahuinya sendiri. Jadi Anda bisa bertanya pada pakar lokal Anda, atau mengarang jawabannya dan berharap tidak ada yang mengetahuinya.

Mempelajari UI, meskipun cantik dan elegan, jarang sepadan dengan waktu Anda.

Namun , jika Anda cukup mengetik (atau mengucapkan) hal yang ingin Anda lakukan, dan melihatnya terjadi, hambatan tersebut akan hilang. Setiap orang memperoleh keahlian, setiap orang menjadi pengguna yang kuat, dan tiba-tiba produk menjadi pengubah permainan. Inilah salah satu cara yang sangat sederhana untuk memvisualisasikannya:

Di semua produk ini, ada pengguna yang tahu apa yang ingin mereka lakukan tetapi tidak tahu bagaimana melakukannya. UI Bahasa Alami mengecilkan celah ini hingga mendekati nol.

UI obrolan rilis awal

Kami sudah melihat beberapa contoh pendekatan ini di alam liar.

  • Setara: Dibangun oleh dua mantan Intercomrades, Setara adalah spreadsheet generasi berikutnya dengan koneksi langsung ke data langsung. (Penafian/pengungkapan: Saya seorang investor.) Ini memungkinkan Anda untuk mengetik hal yang ingin Anda lakukan dan Persamaan akan berhasil dan menghasilkan perintah Excel yang tidak pernah Anda ketahui dan tidak akan dapat Anda lakukan sendiri .

  • Mixpanel: Perusahaan analitik acara baru-baru ini mengumumkan Spark, antarmuka obrolan AI generatif yang memungkinkan Anda mengajukan pertanyaan tentang data Anda, dalam bahasa sederhana.

  • Stripe: Stripe telah meluncurkan fitur Radar baru untuk memungkinkan pelanggan menggunakan bahasa alami untuk membuat aturan pencegahan penipuan yang rumit.

Meskipun saya berfokus di sini pada UI obrolan sebagai mekanisme input, memang benar bahwa obrolan sebagai keluaran lebih rumit, karena untuk banyak tujuan prioritas visual, hierarki, desain, tata letak, dll., semuanya lebih unggul daripada gelembung obrolan. Misalnya, hal-hal seperti dasbor pada dasarnya adalah item visual yang tidak dapat digantikan oleh respons teks. Namun, mungkin ada banyak produk yang UI-nya memudar secara substansial – misalnya, “Pesan liburan 14 Oktober” → “Selesai” adalah interaksi yang dapat diterima.

Saya percaya ke sanalah perangkat lunak akan menuju – komunikasi multimodal dengan metode campuran antara manusia dan perangkat lunak. Kami telah memiliki "tunjuk dan klik" dan "ketuk dan geser", dan sekarang kami berada di era "ketik dan ucapkan". Demokratisasi akses ke produk canggih ini akan mengubah produk dan pengguna secara setara. Lagi pula, bagaimana bisnis Anda berubah jika semua pengguna Anda sekarang tahu bagaimana melakukan segala sesuatu di produk Anda? Cari tahu lebih baik sebelum pesaing Anda melakukannya.

Peluncuran sirip CTA horizontal