AI destekli kullanıcı arabirimi ("Sohbetin Dönüşü" olarak da bilinir)
Yayınlanan: 2023-08-11AI devrimi mobilden, buluttan daha büyük ve Intercom'daki bazıları internetten bile daha büyük olduğunu söylüyor.
Öngörülerin çoğu, yeni yeteneklerin yazılımı nasıl çok daha güçlü hale getireceğine dayanıyor: açıklamalardan görüntüleri işleme, uzun uzadıya dinleme/okuma ve saniyeler içinde özetleme, sorunları teşhis etme, konuları kategorilere ayırma ve harekete geçme yeteneği, hepsi düşünce hızında. Tüm bu yeni güç, yazılım ürünlerini büyük ölçüde değiştirecek ve şimdiden bunun belirtilerini görüyoruz. Beklediğim bir diğer önemli değişiklik de Chat UI'nin (namı diğer doğal dil arayüzü) ürünler için standart bir arayüz olarak ortaya çıkması.
Neal Stephenson'ın "Başlangıçta komut satırı vardı" destansı makalesi/rantı (haklı olarak), komut satırlarının işaretle ve tıkla (veya dokun ve kaydır) arabirimlerinden daha etkili ve verimli olduğunu savundu. Bununla birlikte, sezgisel değildirler veya dünyanın küçük bir yüzdesinden fazlası tarafından erişilebilir değildirler (görüntüleri yeniden boyutlandırmanın yalnızca basit bir find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;
.)
Komut satırı, aptalca adlara ve karmaşık sözdizimlerine sahip çok sayıda gizli komuttur, ancak LLM destekli sohbet çok daha bağışlayıcıdır. Bir resmin yeniden boyutlandırılmasını istediğinizi söylemenin bir düzine farklı yolu vardır ve LLM'ler bunların her birini anlayacaktır.
Aynı argümanı UI'ye götürürseniz, bazı benzerlikler bulacaksınız. Örneğin Workday, 60 milyar dolarlık bir ürün. Nasıl giriş yapacağımı hatırlayabildiğimde izin istemek için gönülsüzce kullanıyorum. Elbette komut satırından daha kolay, ancak yine de doğru formu bulmak ve doldurmak için bir dizi adım gerekiyor.
Şimdi kendinize sorun, hangisi daha kolay, "des 14 ekimi evlilik yıldönümü için istiyor" yazmak mı yoksa sonsuz sekmeleri, hayalet düğmeleri ve açılır menüleriyle yukarıdaki kullanıcı arayüzünde gezinmek mi? Bonus puanlar için kendinize, sadece "evlilik yıldönümü için 14 ekim izin istiyor" yazmamdan daha hızlı olacak genel bir kullanıcı arayüzü tasarlayıp tasarlayamayacağınızı sorun. Kolay değil… Aslında, klavye öncelikli arayüzler için büyük bir iştahın ortaya çıktığını zaten gördük ve bu, onlar bu kadar sezgisel olmadan önceydi . Başka bir deyişle, Workday'in (en azından) bu tür bir kullanıcı arabirimini eklemesinden ne kadar önce?
(Tamam, seni anlıyorum, evet yıllar olabilir.)
Düşük asılı AI meyvesi ile başladık
Bugün, arama motorları, makale yazma, müşteri destek habercileri (merhaba Fin!) gibi bir metin kutusuyla zaten etkileşim beklediğimiz alanlarda yapay zeka sohbet robotlarının geliştiğini görüyoruz. yapay zeka için radyo dostu kullanım durumlarının çoğu. Tasarımcılar olarak, işimizin çoğunun, güzel bir tipografiye sahip olsa bile, yuvarlak bir dikdörtgene indirgeneceğini kabul etmeye hazır olmayabiliriz.
Ancak sohbet kullanıcı arabiriminin, daha önce zorunlu olarak zorunlu kullanıcı arabirimleri, dilleri veya komutları tarafından kısıtlanan ürünleri dönüştürdüğünü göreceğiz. İlişkilendirilebilir bir örnek olarak, diyelim ki Excel'desiniz ve tüm negatif hücreleri kırmızıyla vurgulamak istiyorsunuz - bunu nasıl yaparsınız? Çoğumuz Google'a gidiyoruz, sonra aradığımız kelimenin koşullu biçimlendirme olduğunu hatırlıyoruz ve sonra "koşullu biçimlendirme Excel"i yeniden aratıyoruz ve ardından Google yanıt kutusu ne yapacağımızı açıklıyor, bu yüzden Excel'e dönüyoruz ve takip ediyoruz bu talimatlar robotik olarak. Ardından, yol boyunca geçici olarak edindiğimiz tüm bilgileri anında hafızaya alırız ve ilk başta yapmaya çalıştığımız şeye geri döneriz.
Bugün, bir bottan bunu sizin için yapmasını isteyebilirsiniz. Sohbet kullanıcı arabirimi, yazılıma erişimin büyük ölçüde demokratikleşmesine yol açabilir.
Karmaşık yazılım, Chat UI ile daha iyi hale geliyor
Kurumsal ürün kullanıcılarının çoğu daimi acemidir - en sık ihtiyaç duydukları bir veya iki görevi yapacak kadar bilgi sahibidirler, ancak bunun ötesinde bir sonuca giden yolu hackleyip hurdaya ayırırlar. Tamamlamayı sevecekleri görevler hakkında pek çok fikirleri var ama bunu nasıl yapacaklarını bilmiyorlar. Yukarı yöndeki bu engel aşağı yönde yayılır ve siz farkına bile varmadan ürünün iyi olduğunu veya sorunlarını çözebileceğini düşünmekten vazgeçersiniz. Zaten sahip olduğunuz bir özellik yüzünden bir müşteriyi bir rakibe kaptırdıysanız, bu acıyı yaşamışsınız demektir.
Google Analytics'i veya Salesforce'u veya güç ve karmaşıklıktaki ürünleri düşünün. Biliyorsunuz, derinlerde bir yerlerde gömülü olan “ en yüksek performanslı trafik kaynaklarımızı nereden alıyoruz ve en son yeni kaynak nedir?” gibi önemli bir sorunun doğru cevabıdır. veya " anlaşmalarda hangi rakiplerin arttığını görüyoruz?" , ama kendi başına öğrenme şansın yok . Yani ya yerel uzmanınıza sorarsınız ya da cevabı uydurursunuz ve kimsenin öğrenmemesini umarsınız.
Kullanıcı arayüzünü öğrenmek, güzel ve zarif olsa bile nadiren zaman ayırmaya değer.
Ancak , yapmaya çalıştığınız şeyi yazabilir (veya söyleyebilirseniz) ve bunun gerçekleşmesini izleyebilirseniz, engeller ortadan kalkar. Herkes uzmanlığı edinir, herkes uzman kullanıcı olur ve ürün birden oyunun kurallarını değiştirir. İşte onu görselleştirmenin gülünç derecede basit bir yolu:
Tüm bu ürünlerde ne yapmak istediğini bilen ama nasıl yapacağını bilemeyen kullanıcılar bulunmaktadır. Natural Language UI, bu boşluğu neredeyse sıfıra indirir.
Erken sürüm sohbet kullanıcı arayüzleri
Bu yaklaşımın bazı örneklerini zaten vahşi doğada görüyoruz.
- Equals: İki eski Intercomrades tarafından oluşturulan Equals, canlı verilere canlı bağlantılara sahip yeni nesil bir elektronik tablodur. (Sorumluluk Reddi/açıklama: Ben bir yatırımcıyım.) Yapmaya çalıştığınız şeyi yazmanıza olanak tanır ve Equals, hiç bilmediğiniz ve kendi başınıza çözemeyeceğiniz Excel komutlarını çözecek ve üretecektir. .
- Mixpanel: Etkinlik analitiği şirketi kısa bir süre önce, verileriniz hakkında sade bir dille soru sormanıza olanak tanıyan üretken bir yapay zeka sohbet arabirimi olan Spark'ı duyurdu.
- Stripe: Stripe, müşterilerin karmaşık sahtekarlığı önleme kuralları oluşturmak için doğal dili kullanmalarına olanak tanıyan yeni bir Radar özelliğini kullanıma sundu.
Burada bir giriş mekanizması olarak sohbet kullanıcı arabirimine odaklanıyor olsam da, çıktı olarak sohbetin daha aldatıcı olduğu doğrudur çünkü görsel önceliklendirme, hiyerarşi, tasarım, düzen vb. birçok amaç için hepsi bir sohbet balonundan üstündür. Örneğin, gösterge panoları gibi şeyler, metin yanıtıyla değiştirilemeyen doğası gereği görsel öğelerdir. Bununla birlikte, kullanıcı arayüzünün önemli ölçüde azaldığını gören birçok ürün olabilir - örneğin, "14 Ekim'de tatil rezervasyonu yapın" → "Bitti", tamamen kabul edilebilir bir etkileşimdir.
Yazılımın gideceği yerin burası olduğuna inanıyorum – insanlar ve yazılım arasında çok modlu, karma yöntemli bir iletişim. "İşaretle ve tıkla" ve "dokun ve kaydır"ı yaşadık ve şimdi "yaz ve söyle" çağındayız. Sofistike ürünlere erişimin bu şekilde demokratikleştirilmesi, ürünleri ve kullanıcıları eşit şekilde dönüştürecektir. Sonuçta, artık tüm kullanıcılarınız ürününüzdeki her şeyi nasıl yapacaklarını biliyorsa işiniz nasıl değişir? En iyisi rakibinizden önce öğrenin.