Bilim kurgudan teknik gerçekliğe: AI'nın etkisini keşfetme

Yayınlanan: 2023-06-09

Yapay zeka halihazırda çalışma, iletişim kurma ve dünyayı deneyimleme şeklimizi yeniden şekillendiriyor. Önümüzdeki geniş olasılıklar manzarasını keşfederken, üretici yapay zekanın merak uyandıran dünyasına adım atın.

ChatGPT'nin piyasaya sürülmesinden bu yana ekibimiz, büyük dil modelleri (LLM'ler) içeren ürünler geliştirerek ve bu dönüştürücü teknolojideki son gelişmelerle ortaya çıkan bilinmeyenleri yönlendirerek, önce yapay zeka dünyasını derinlemesine araştırdı.

Odak noktamızın çoğu, müşteri hizmetlerini dönüştürmek için üretken yapay zekayı nasıl uygulayabileceğimiz üzerineydi ve sektör lideri yapay zeka sohbet robotumuz Fin'in piyasaya sürülmesi, bu odağın nasıl işe yaradığını gösteriyor.

Bununla birlikte, pratik uygulamaların ötesinde, düşündüğümüz sayısız büyük soru var - LLM'lere dikkatli bir şekilde yaklaşmalı mıyız? Bu yapay zeka olayı gerçekten ne kadar büyük? Ve geleceğe baktığımızda ne beklemeliyiz?

Bu bölümde, Kıdemli Makine Öğrenimi Direktörümüz Fergal Reid, Yapay Zekanın etkisini ve devrim niteliğindeki potansiyelini araştırmak için Ürün Tasarımından Sorumlu Başkan Yardımcımız Emmet Connolly ile bir araya geliyor. bu inanılmaz yeni teknoloji.

İşte önemli çıkarımlardan bazıları:

  • Akıllı sistemler oluşturma arayışında kuruluşlar, değerlerimizle uyum sağlamak ve insanlık üzerinde olumlu bir etki sağlamak için pekiştirmeli öğrenme gibi teknikleri benimsiyor.
  • GPT-4, örnek dışı senaryolarla test edildiğinde bile yüksek düzeyde bir muhakeme sergiliyor; bu, Alan Turing'in ünlü testi tarafından belirlenen çıtayı aşabileceğini gösteriyor gibi görünüyor.
  • Yatırımlar arttıkça ve donanım sınırlamaları aşıldıkça, benzeri görülmemiş bir benimseme ve ürünleştirme ile daha gelişmiş ve verimli modellerin geliştirilmesini bekleyebiliriz.
  • Gelecekte, bazı UI türlerinin yerini, sözlü girdiye, eldeki göreve ve kişisel tercihlerinize göre çıktıları anında kişiselleştirebilen AI aracıları alabilir.
  • AI, tasarımcılar ve programcılar için homurdanan işleri azaltma potansiyeline sahiptir, bu da onların uygulama yerine çözüme ve ürün vizyonuna daha fazla odaklanmalarına olanak tanır.


Tartışmamızdan hoşlanıyorsanız, podcast'imizin diğer bölümlerine göz atın. Apple Podcast'lerini, Spotify'ı, YouTube'u takip edebilir veya seçtiğiniz oynatıcıda RSS akışını yakalayabilirsiniz. Aşağıda, bölümün hafifçe düzenlenmiş bir kopyası var.


AI uyanışı

Emmet Connolly: Pekala, Fergal, biralar, kahveler vb. üzerine pek çok gündelik sohbetimiz oldu ve oturup bir tane alıp kaydetmenin ilginç olabileceğini söyledik, çünkü çoğunlukla doğrudan çalıştığımız için Son altı aydır büyük dil modelleriyle, işte yapmaya çalıştığımız şeye uygun ürün sorularıyla boğuşuyoruz.

Ancak, elbette, AI'nın ne anlama geldiği ve AI'nın geleceği hakkında daha geniş bir konuşma var. Uğraştığımız bu yeni materyalle ilgili bazı sorulara oturup deneyeceğimizi düşündük. Teknolojinin finansal etkilerinden bazıları nelerdir? Dikkat etmemiz gereken şeyler nelerdir? Başlayalım. Her şeyden önce, son altı aya ilişkin kapsayıcı düşünceleriniz var mı?

Fergal Reid: Evet, kesinlikle. Bunun nasıl gittiğini görelim. Makine öğreniminde veya yapay zekada çalışmış insanların bile işlerin ne kadar hızlı iyileştiğine şaşırdığını söylemek bence adil olur. Modelin bu kadar akıllı hale gelmesi, alanında uzman veya uzun süre sinir ağları ile çalışmış kişiler için bile şaşırtıcıydı.

Emmet: Bazı AI insanlarının, şimdi bizim neslimizin Manhattan Projesi üzerinde çalışıyor olabileceğinden biraz endişelendiğini düşünüyor musunuz? Bir süre önce, metni otomatik olarak tamamlamak için çalışıyordunuz ve birdenbire bu çok endişe verici, tartışılan bir konu haline geldi. Yapay zeka üzerinde çalışan insanların bunun merkezinde olması nasıl bir duygu?

“Bütün eğitiminizi yapıyorsunuz, model çıkıyor ve gerçekten zeki. Ama o zekayı bireysel olarak kodlamadınız. Hâlâ makine öğrenimi”

Fergal: Benim bakış açımı ortaya koymak için, büyük dil modelleri eğitmiyoruz. Onları kullanıyoruz; biz onların tüketicisiyiz. GPT-4'e erken erişimimiz oldu, ancak onları kendimiz eğitmiyoruz. Öte yandan burada yapay zeka konusunda uzman insanlardan oluşan bir ekibim var. Birçoğumuz, sanırım bu noktada onlarca yıldır yapay zekanın içindeyiz. Üniversitedeyken, ileri düzey yapay zekaya gerçekten ilgi duyuyordum, yapay zeka felsefesi üzerine kitaplar okuyordum ve insanlar onun bunu yapıp yapamayacağını tartışıyorlardı. Ve şimdi, birdenbire bu tartışmaların çoğunu daha az alakalı hale getiren sistemlerimiz var. Aniden, kimsenin yapabileceğini söylemediği şeyi yapabilen bir sistem var.

Sanırım karşı nokta, eğer büyük dil modelleri eğitiyorsanız, bunun bir ölçüde mühendislik görevi olduğudur. Tüm eğitiminizi yaparsınız, model ortaya çıkar ve gerçekten akıllıdır. Ama o zekayı bireysel olarak kodlamadınız. Hala makine öğrenimi. Yani, herkesin buna şaşırdığını düşündüğüm bir boyut var. İnsanların her seferinde bir kod satırı yeteneğini aşamalı olarak oluşturması gibi bir şey değil. Büyük bir antrenmanın sonunda ne olacağından kimse emin değil.

Emmet: Şaka yollu Manhattan Projesi'nden bahsettim ama sanırım bu, uğraştığımız bazı şeylere oldukça iyi bir benzetme.

Fergal: Ne yönden? Tehlikeli olduğu için mi?

Emmet: Bir şeyi manipüle etmenin bir yolunu bulduk. Bu durumda bilgi. Bir anlamda bir icattan çok bir keşif gibi geliyor. Çok geniş bir şekilde uygulanabilir. Kullanımlarının istenmeyen sonuçlarının ne olduğundan emin değiliz. Ve elbette, iyi aktörler tarafından olumlu amaçlar için kullanıldığı kadar, kötü aktörler tarafından da kötü amaçlar için kullanılabilir.

"Teknik düzeyde bu modellerin nasıl eğitildiğini biliyoruz, ancak bu bir kara kutu durumu"

Fergal: Dün, OpenAI bu teknolojiyle ilgili bir pozisyon bildirisi yayınladı ve AI teknolojisinin gözetimi çağrısında bulundu. Nükleer teknoloji ve biyoteknoloji ile paralellikler kurdular. Bence bu adil. Potansiyel olarak, bilim kurgunun en iyi geleneklerinde, insanların neyle uğraştıklarını bilmedikleri korkunç teknoloji kategorisindedir. Tüm bunların ters gidebileceği ve büyük dil modellerini eğitmenin insanların dikkatli olmaya başlaması gereken bir şey olduğu fikrine inanıyorum.

Emmet: Keşfettiğimizi düşündüğünüz şey hakkında konuşmayı çok isterim ve keşfettiğimizi söylemeye devam ediyorum çünkü bu konu hakkında konuşma şeklimizde neredeyse bir keşif gibi geliyor, "Vay canına, bu şey bizde var," gibi. ve bununla nasıl başa çıktığımıza dikkat etsek iyi olur. Bu konuda böyle mi düşünüyorsun? Teknik düzeyde bu modellerin nasıl eğitildiğini biliyoruz, ancak bu bir kara kutu durumu – bize verdikleri deterministik olmayan sonuçları nasıl ürettiklerini tam olarak anlamıyoruz.

Fergal: Evet, bence bu konuda düşünmenin doğru yolu bu. Bu bir sistem. Sistemi başlatır ve önce bir eğitim hedefi belirlersiniz, sonra o ölçekte çalışır ve ne olduğunu görürsünüz. Ve zamanla, ne olabileceğini anlamakta giderek daha iyi hale geliyorsun ama emin değilsin. Bir nevi test ediyorsun. Bence burada iyi bir benzetme, biyolojik bir sistemi hayal etmek, onu bir süre büyümeye hazırlamak ve sonra ne yaptığını görmek gibidir. Buna daha yakın. Bu kara kutu yöntemiyle test etmeniz gerekiyor. Davranışını kontrol etmelisin. Ne alacağınızı bilmiyorsunuz.

Emmet: Sanırım "bu zeki mi?" sorusunun bariz olduğu yer burası. geliyor ve bu, birçok konuşmayı meşgul eden büyük bir soru. Çünkü eğer akıllıysa, bu AGI yolunda olduğumuz anlamına gelir ve bu AGI kötü niyetli olabilir ve başımız büyük belaya girebilir. Bayrağı sallamaya değer bir şey gibi görünüyor, ancak aynı zamanda teknoloji etrafında çok fazla endişe yaratıyor.

Fergal: Bence burada bir dereceye kadar ihtiyatlı olmak ya da endişe etmek yerinde. Bu şeylerin akıllanmaya başladığını varsayalım. Zeka gerçekten korkutucu ve tehlikelidir. İnsan tartışmasız en tehlikelisidir. Dünya ve ekosistemler üzerinde büyük bir etkimiz oldu. En güçlü ya da en hızlı hayvan olduğumuz için değil. Bir insan bir aslanı öldürebilir çünkü insan daha zekidir. Daha zeki organizmalar, bir anlamda, genellikle daha tehlikelidir. Ve böylece, sonunda bizden daha zeki bir şey yaratabileceğimiz fikri gerçekten tehlikeli olabilir. Bununla ilgili hiçbir deneyimimiz yok, bu yüzden bazı önlemlerin tamamen garanti edildiğini düşünüyorum.

Kodlama hizalaması

Emmet: Farklı zeka türleri hakkında düşünme konusunda daha iyi olmamız gerektiğini düşünüyorum. Bir aslanın biraz zekası vardır ve yetenekleriyle birleştiğinde tehlikelidir, değil mi? Ama bunun somutlaşmış hali yok. Demek istediğim, çok zararlı olabilecek bilgisayar sistemlerine erişimi var ama habislik bir insan özelliği mi? Ve neden bu potansiyeli hemen bu sisteme yansıtıyoruz?

Fergal: Bence pek çok insan bunun kötü huylu olması gerekmediğini söylüyor. Kasıtlı olarak kötü olması gerekmez. Çok fazla kasıtlı olmasına gerek yok. İhtiyacınız olan tek şey, onu insanların istediği iyi şeylerle çatışmaya sokan bazı hedefleri optimize etmeye çalışan bir şey yaratmak, değil mi?

“Genel olarak iyi olduğunu düşündüğünüz bir şeyi yapmak için gönderiyor olabilir, ancak yöntemleri nedeniyle çatışmaya girebilirsiniz. Ve eğer bu şey senden daha akıllıysa, bu çatışma nasıl sonuçlanıyor?

Erken AI güvenlik literatüründe bir yakınsama aracı fikri var ve bu fikir, dünyada bir hedefiniz varsa, bu hedefe ulaşmak için yapmak isteyebileceğiniz pek çok şeyin sizi diğer insanlarla çatışmaya sokabileceği fikridir. hedefler. Kanseri tedavi etmek istiyorsanız, kanseri tedavi etmek için çok para isteyebilirsiniz ve şimdi para isteyen diğer tüm insanlarla anında çatışmaya girersiniz. Pek çok hedefe ulaşmak için enerjiye ve kaynaklara ihtiyacınız var. Ve böylece, amaca yönelik ve potansiyel olarak sizden daha akıllı olan herhangi bir sistemle karşılaşırsanız, bilinçli olmasa bile, onunla çatışmaya girebilirsiniz. Kötü olmak zorunda değil. Genel olarak iyi olduğunu düşündüğünüz bir şeyi yapmak için gönderiyor olabilir, ancak yöntemleri nedeniyle çatışmaya girebilirsiniz. Ve eğer bu şey senden daha akıllıysa, bu çatışma nasıl sonuçlanır?

İnsanlar "ataş maksimize edici" hakkında konuşmaya başlar, bu şeye az önce gidip çok ama çok ataç yapmasını söylediniz, çünkü çok fazla ataç ihtiyacımız var ve sonra, yanlışlıkla, gitti ve dünyanın tüm kaynaklarını tüketti ve onu çevirdi. bir ataç fabrikasına Ve "Hay aksi" gibi. Bunların hepsi bir süredir AI güvenlik tartışmasındaki fikirler.

Emmet: İnsani kaygılar da var. Tüm aktörler, teknoloji ve insanlar arasındaki bir teşvik uyumunu tarif ediyormuşsunuz gibi geliyor. İş yerinde gruplar halinde örgütlendiğimizde yaptığımız şey de bu. Basit bir örnek, ekipleriniz için doğru teşvikleri yerleştirmektir; aksi takdirde, başka bir şey yapmaları için teşvik edilebilirler. Satış ekibinizi kurumsal müşterilere satış yapmaya teşvik ederseniz, ancak aslında onların daha küçük şirketlere satış yapmalarını istiyorsanız, teşvikleri ayarlamanız gerekir. Ve bu konuda çok fazla deneyime sahibiz.

Fergal: Bakın, bu ne dereceye kadar teşvikleri güç dengesine karşı dengeleme konusunda gerçekten iyi bir iş çıkardığınız için mi? İnsanlara bakarsanız, işlerin ters gittiği devasa güç dengesizliklerinin olduğu zamanlarda, teşvikleri sürdürmek çok zordur. Teşviklere güveniyorsanız, bu zor. İnsanlar olarak kontrol ve dengeye sahip olmaya büyük özen ve dikkat gösteriyoruz. Ve yine, bu süper zeka tartışmasına dönersek, eğer aniden çok güçlü hale gelen bir süper zeka inşa etmek mümkünse, teşviklere güvenecek misiniz? Çünkü işleri devam ettirmek için teşviklere güvenmek her zaman zordur.

“Geçmişte, her zaman güç dengesine güvendik. Şimdi, hizalanmış değerlere güvenmek zorundayız”

Emmet: Sanırım kendi doğasını biraz daha ortaya çıkarmadan bunu bilemeyiz. Benim kişisel hissim, süper zekayı takıntı haline getirdiğimizde, onun bizden daha akıllı hale gelmesini takıntı haline getiriyoruz. Ve sanırım biraz risk var ama merkezde insanlar için bir de ego meselesi var. Bizi hayvanlar aleminden ayıran şey bu. İnsanlar genellikle yapay zekanın biraz uzaylı zekasına benzediğini söyler ve bence hayvanlar bu konuda yararlı bir düşünme biçimidir çünkü farklı zeka türleriyle barış içinde bir arada var olmak için evrimleştik. Şimdi bir köpeğim var, bir kedim var. Kedi çok özel ama yüksek derecede bir zekaya sahiptir - atletik yetenek. Hafiftir ve refleksleri hızlıdır. Zekayı geniş olarak ele alırsam, izlemesi çok zeki ve güzel.

Fergal: Buraya atlamalıyım çünkü bunun harika bir benzetme olduğunu düşünmüyorum. En azından rahatlatıcı değil. Ben bir pesketaryenim - çoğunlukla vejeteryanım. Fabrika çiftçiliği, ilgili hayvanlar için pek iyi değil. Ve bu yüzden, bilmiyorum, buradaki modelin hayvanlarla barış içinde bir arada yaşamak için evrimleştiğimizi duymak bana güven vermiyor.

Emmet: Evcil hayvanların nesi var?

Fergal: Hayır, evcil hayvanlar iyidir. Demek istediğim, gelecekte insanların evcil hayvan olacağı fikri var. Bence bu rahatsız edici olmalı.

Emmet: Tartışmamı tersine çeviriyorsun. Vurgulamaya çalıştığım nokta, kedinin bir tür zekaya sahip olduğuydu. Ayrıca kediden tamamen farklı bir zekaya sahip bir köpeğim var. Bir köpekle konuşabileceğini düşünüyorsun ve o bir nevi anlıyor ve senin ruhunun içine bakıyor falan. Ama aynı zamanda başka bir seviyede bir taş torbası kadar aptal. Onu seviyorum ama o. Şimdi, sanırım "Emmett, ileri sararsak bu durumdaki köpek sensin" demek istiyorsun. Ama orada mutlu bir birliktelik var. Umarım tür olarak da evcilleşmeyiz.

Fergal: Evet, eğer bizden daha zeki bir şey yapmanın mümkün olduğu ortaya çıkarsa, ateş edilmesi gereken şey bu, iyi huylu, evrendeki yaşamı önemseyen ve iyi değerlere sahip bir şeyle son bulduğun bu mutlu birliktelik. Ancak şu anda birçok insanın bu konuda bu kadar egzersiz yapmasının nedeni, orada büyük bir risk varmış gibi hissetmesidir. Daha güçlü bir şey inşa edecekseniz, bu değerlerin doğru olduğundan emin olmalısınız. Geçmişte, her zaman güç dengesine güvendik. Şimdi, hizalanmış değerlere güvenmek zorundayız. OpenAI ve Anthropic'e ve diğer oyunculara bakarsanız, bu nedenle bunca zamanı hizalama hakkında konuşarak geçiriyorlar. İnsanlar artık en zeki şeyler olmayacak. İstihbarat güçlü ve tehlikelidir. Uyumlu olduğundan emin olmalıyız.

Emmet: Yapay zeka topluluğu, sözde hizmete karşı bir son durum olarak hizalamayı fiilen sürdürmekte ne kadar iyi bir iş çıkarıyor? Çünkü her şey ters giderse en azından eski blog yazımızı işaret edip “Eh, hizalamadan bahsetmiştik, o yüzden bizi suçlamayın” diyebiliriz.

"Son teknoloji modellerle etkileşim halindeyseniz, onları iğrenç şeyler önermeye zorlamak oldukça zordur. Geçmişte pek çok insan varsayılan olarak yapacaklarının bu olduğunu düşündü”

Fergal: Bence oldukça iyi bir iş çıkarıyorlar. Pek çok insan buna katılmaz, değil mi? Pek çok insan, “Hey, daha büyük ve daha büyük modelleri eğitmeye devam etmek tamamen sorumsuzca. Ne yapacağını bilmiyorsun.” Belli bir noktanın ötesinde, bu muhtemelen doğru olur. Henüz o noktada olduğumuzu düşünmüyorum. 10 yıl önceki AI güvenlik ekibine bakarsanız, her zaman bir amaç işlevi belirlemenin iyi bir fikir olduğu bir şey vardı. Ona kanseri iyileştirmesini söylüyorsunuz ve o da diyor ki, "Birinci adım tüm insanları öldürmek. Artık kanser olmayacak” ve bu açıkça kötü. Ancak GPT-4 ile oynar ve "Kanseri tedavi etmek için iyi bir plan nedir?" "Bütün insanları öldürün" demiyor. Size oldukça iyi bir araştırma planı sunar. Ve eğer ona "Bütün insanları öldürmeye ne dersin?" "Hayır, bu ahlaki açıdan iğrenç" gibi olacaklar. Bu hizalama. Ve bu sadece ürettiği metin düzeyinde.

"Sadece metin üretiyor - zeki olduğu anlamına gelmez" tartışmasının tamamına girebiliriz. Bu konuda bir pozisyonum var. Bence akıllı. Tüm bu tartışmaya girebiliriz, ancak bu, uyum konusunda birçok insanın beklediğinden daha fazla ilerleme. Son teknoloji modellerle etkileşime giriyorsanız, onları iğrenç şeyler önermeye zorlamak oldukça zordur. Geçmişte pek çok insan varsayılan olarak yapacaklarının bu olduğunu düşündü. Ve yine, OpenAI kısa süre önce ortaya çıktı ve uyum konusunda ilerleme kaydettiklerini söyledi.

Emmet: Bunun olmasını engelleyen korkulukların yerleştirildiğini biliyor muyuz? Yoksa bu, sistemin kendi içinde ortaya çıkan bir özelliği midir? Eğitimin, kaynak verilerin, başka bir şeyin işlevi mi?

Fergal: Bu zor bir soru. Bence insanların vereceği cevap, bunun sadece kaynak verilerle ilgisi olmadığıdır. Sanırım son birkaç yıldaki büyük atılım, bu tür talimat GPT olayıdır. Modelinizi internetteki tüm verilerle eğitirsiniz ve talimatları tam olarak takip etmeyen bir şey bulursunuz. Ardından, bunu ince ayar veya bir hizalama veya talimat aşaması yoluyla koyarsınız, burada ona birçok iyi ve kötü davranış örneği verirsiniz ve model ağırlıklarını buna göre ayarlarsınız.

Emmet: Ve bu insan destekli öğrenme mi?

Fergal: Evet. Bunu yapmak için bir mekanizma, insan geri bildirimi ile pekiştirmeli öğrenmedir. Bunun gibi bir sürü benzer paradigma var, ancak temel fikir, pek çok şey üzerinde eğitim alabilmeniz ve ardından bir tür talimat ayarlaması yapabilmenizdir. Bu oldukça iyi çalışıyor gibi görünüyor.

"Uyumlu görünme konusunda gerçekten iyi olmak için bir şey eğitebilirsin. Ve sonra, altında, hiç hizalanmayan başka bir soyutlama katmanı olabilir. İnsanların seslendiği büyük risk bu”

Emmet: Ama aslında soruma cevap vermedin. Bu sürecin hangi kısmının onu iyi çalıştırdığını biliyor muyuz? Yoksa hala, "Buradaki bazı kadranları çevirdim ve nedense daha iyi davranıyor gibi görünüyor?"

Fergal: Komut ayarını yapmazsanız, çok daha az uyumlu olacaktır. "Hey, model, iyi görünmek böyle bir şey." Ve iyiye yakın bir şey ürettiğiniz her seferinde, bunu yapmaya daha çok teşvik ediliyorsunuz. Kötüye yakın bir şey ürettiğiniz her seferde, bunu daha az yapmaya teşvik ediliyorsunuz. Tüm ağırlıklarınız iyi yönde hafifçe ayarlanır. Ama sanırım eleştiri şu: "Kaputun altında neler olup bittiği hakkında hiçbir fikrin yok ve bunun yanlış gitmesinin yolları var." Sonunda uyumlu görünme konusunda gerçekten iyi olmak için bir şey eğitebilirsin. Ve sonra, altında, hiç hizalanmayan başka bir soyutlama katmanı olabilir. İnsanların seslendiği büyük risk bu.

Diğer insanlar, "Eh, biz hala eğimli iniş yapıyoruz. Hiçbir şeye karar veremez. Uyum sağlanacak.” Ama bence orada biraz sıçrama var. X, Y ve Z'yi yapacağını matematiksel olarak kanıtladığınız ve güçten güce güçten güce inşa ettiğiniz bir sistem değil. Ayarladığınız ve eğittiğiniz bir kara kutu sistemi.

Emmet: Eğer o pozisyon için acımasız olmaya çalışacaksam, bu biraz nükleer silahları stoklayıp "Ama bunu gerçekten çok dikkatli yaptık, bu yüzden onu çalıştıran düğmeye basmayacağız" demeye benziyor. kaza." Ancak yeterince uzun bir zaman çizelgesinde ve teknolojinin ne kadar erişilebilir olduğu göz önüne alındığında, kesinlikle bunu kontrol edemeyiz. Sorumlu davranan çok sayıda şirketimiz ve bireyimiz olabilir, ancak bu bizi en kötü uygulamadan korumak için hiçbir şey yapmayacaktır. İşlerin ters gittiği senaryolar nelerdir? Bununla ilgili tehlikelere rağmen doğrudan bunun üzerinde çalışmanın ahlaki argümanlarından biri, totaliter bir hükümet veya bir yerlerde gizli bir örgütün şu anda bunun kötü bir versiyonunu yapması gibidir.

Fergal: Bir noktada bu kesinlikle olacak. Henüz bu noktada olduğumuzu düşünmüyorum. Kesinlikle bir süper zeka oluşturabileceğiniz bir noktada olduğumuzu düşünmüyorum. Ama insanlar için onu inşa edebileceğinizin aşikar hale geldiği bir noktaya gelirsek, insanlar, hükümetler ve ordular bunu yapacak. Her zaman yaparlar çünkü her türlü askeri uygulamada potansiyel olarak yararlıdır, değil mi? Yani evet, bunun olacağını düşünüyorum. Buradaki söylem, bir tür düzenlemenin olduğu nükleer silahlar ve Uluslararası Atom Enerjisi Ajansı gibi şeylere gidiyor. Ve eğer işler böyle yürürse, eğer bir şok almazsak, "Ah, şu anki eğitim türüyle zekanın tükendiği ortaya çıktı" gibi değilse, bu olabilir. Bu olmazsa, insanların konuştuğu şey grafik kartlarını, GPU'ları falan takip etmektir. Ama bunun da sorunları var. Muhtemelen, bu sadece sınırlı bir süre devam edecek.

Turing testini kırmak

Emmet: İstihbarat olayına geri dönelim. Burada sıcak bir yaklaşımın olduğunu biliyorum. Ne tür olduğuna bağlı olarak, birçok AI şüphecimiz veya korku tellalımız var. Ve sonra, bölünmenin her yerinden insanlar var: Tanınmış bir dilbilimci olan Noam Chomsky, en sevdiğim bilimkurgu yazarlarından biri olan Ted Chiang, web'in bulanık JPEG'i hakkında bu makaleyi yazdı ve temelde bunun olmadığını söyledi. zeka – bu stokastik bir salon hilesidir. Akıllıları görme biçimimizde gerçekten akıllı görünmesini sağlayan gerçekten iyi bir salon numarası.

Fergal: Web'den alınan bulanık JPEG'in yanlış olduğuna dair orta ila yüksek düzeyde güvenim var. Ve ben biraz kendimi zorluyorum – bunun yanlış olduğuna eminim. Tek yaptığının web'i sıkıştırmak olduğu ve siz onun sıkıştırılmış bir versiyonunu alıyorsunuz. Ve bunun tamamen yanlış olduğunu söylemememin tek nedeni, bir şeyi sıkıştırmanın aslında zekaya neden olabilmesidir. Bir şeyleri sıkıştırma yeteneği bir zeka ölçüsü olabilir çünkü sadece sıkıştırıp bir sonraki jetonu tahmin ederek, dünyada bir sonraki adımda ne olacağını tahmin ediyorsunuz. Eğer doğruysa, kastetmediği şekilde doğrudur.

"Bu spekülatif konuşmayı yapıyor olmamıza rağmen, bu şeylerin sınırlamaları hakkında büyük tahminler yapmak için özellikle kötü bir zaman gibi görünüyor"

GPT-4 kullanırsanız, size en azından akıllı görünen bir çıktı verir ve bu, örneklem dışı akıl yürütmeyi gösterir. Eğitim verilerinde veya daha önce kimsenin okuduğu herhangi bir bilimkurgu hikayesinde olmayacak yeni bir şeyi düşünmeye itebilirsiniz ve bu oldukça iyi bir iş çıkarır. Muhtemelen gerçekten iyi bir insan kadar iyi bir iş çıkarmıyor, ama kesinlikle bir şey ki, eğer bu akıl yürütme değilse, akıl yürütmenin ne anlama geldiğini bilmiyorum.

Emmet: Ve belirli örnekleri gösterdiğiniz bir blog yazınız var.

Fergal: Hafta sonu canım sıkıldığı için yazdığım bir yazı. Emin olmak zor, değil mi? Ancak AI uzmanları da dahil olmak üzere pek çok kişi bunu tamamen reddediyor. “Ah, bu şey hiçbir şey anlamıyor. Sadece bir sonraki belirteç tahmini yapıyor. Bu, onlarca yıldır AI'da her zaman doğru yaklaşımdı. Ama artık su çamurlu ve kesinlikle bir şey anlamadığını söylemektense bunu herkes kabul etmeli.

Emmet: Bu spekülatif konuşmayı yapıyor ve kendimizi bu karışıma atıyor olsak da, bu tür şeylerin sınırlamaları hakkında büyük tahminler yapmak için özellikle kötü bir zaman gibi görünüyor. Web makalesinin bulanık JPEG'sinin Mart ayına ait olduğunu düşünüyorum ve bunun zaten GPT-4 tarafından kanıtlanıp kanıtlanmadığını merak ediyorum.

Feryal: Bence de. Ve burada onu eleştiren pek çok farklı pozisyon var. Çok hızlı bir şekilde çürütüldüğünü düşündüğüm web'in bulanık JPEG'i var. Ve bunu kanıtlamak zor, ancak yapabileceğiniz tek şey çok ama çok sayıda kanıt oluşturmak. Çünkü yapamazsınız… sizin düşünen bir insan olduğunuzu bilmediğim felsefi zombiler veya solipsizm fikri var. Bildiğim kadarıyla, kafanın içinde dev bir arama tablosu var.

"Yapabileceğin tek şey, 'Bak, o kadar tuhaf şeyler sorduğumda bu şey o kadar iyi iş çıkarıyor ki, bunun mantıklı olduğuna ikna olmaya başlıyorum' demek. Benim için GPT-4 bu sınırın ötesinde”

Benim de sübjektif bir bilinç duygum var ve bunun gerçek olup olmadığını anlayabilirsiniz, ama her iki durumda da, kendimi büyük bir arama tablosu gibi hissetmiyorum ama geri kalanınızı bilmiyorum. Bunu kanıtlamak çok zor. Birinden arama tablosu olmadığını kanıtlamasını isteyebilirsiniz. Ve sonunda yaptığınız tek şey, onları bu davranışsal şekilde test etmektir - GPT-4'ü test edebileceğimiz şekilde.

Alan Turing ve Turing test makalesi bu konuya ve davranış testinin yapabileceğiniz en iyi şey olduğu fikrine odaklandı. Ve bu modeller üzerinde bir davranış testi yaptığınızda, tamamen örneklem dışı olsalar bile, benim akıl yürütme dediğim şeyde iyi bir iş çıkarıyorlar. Bir davranış testiyle asla emin olamazsınız çünkü sorabileceğiniz tüm olası şeyleri ve tüm olası cevapları içeren yeterince büyük bir arama tablosu sizi yanıltabilir. Yapabileceğiniz tek şey, “Bak, bu şey o kadar iyi iş çıkarıyor ki, o kadar tuhaf şeyler sorduğumda bunun mantıklı olduğuna ikna olmaya başlıyorum. Benim için GPT-4 bu çubuğun ötesinde. Belki gelecekte birileri bir zeka teorisine sahip olacak ve ağın ağırlıklarını inceleyebilecek ve “Oh, akıl yürütme modülü burada. Henüz orada değiliz.”

Emmet: Görünüşe göre Turing testini aceleyle geçtik. Sanırım insanlar Turing testinin muhtemelen ve kesinlikle son altı ayda geçtiğini söyler ve yanılıyorsam beni düzeltir. Buna katılıyor musunuz, yoksa orada gerçekten yanlış mıyım?

Fergal: Bilmiyorum. Geçenlerde taklit oyun kağıdını hızlıca tekrar okudum ve aslında testte ortalama bir sorgulayıcının beş dakika harcadığından bahsediyor. Ve bu formülasyonla, muhtemelen geçilmeye yakın olduğunu söyleyebilirim.

Emmet: Bu aşamada büyük başarıyla geçtiğini varsayardım, değil mi?

"Turing'in orijinal makalesine baktığımda, o orijinal formülasyonun ruhuna uygun olarak aktarılmış gibi hissediyorum"

Feryal: Bilmiyorum. Beni GPT-4'ün ve bir insanın önüne oturtsaydınız, onu zayıf olduğu alanlara itmek için hileler öğrenebilir ve orada onun sinyallerini algılayabilirdim. Ve muhtemelen onu ayırt etmede iyi olabilirim. Bununla zaman geçirecek çoğu insanın muhtemelen stratejiler geliştirebileceğini umuyorum.

Emmet: Bence bir gözün olmalı. Onunla her gün çalışıyorsun. Diyelim ki, örneğin Midjourney V5 ile, insanların büyük çoğunluğu için artık söylentilerin olmadığı bu aşamaya geldik. Arkadaki parmakları, bulanıklığı, garip şekilleri düzelttiler. Ne arayacağınızı biliyorsanız, saçın olması gereken yerde hala biraz tüy görebilirsiniz. Ama bence bu aşamada oldukça adli tıp olmanız gerekiyor.

Fergal: GPT-4 ile bir şekilde orada olduğumuzu söylüyorum. Sokaktan koparılan ortalama bir insandan beş dakikalık bir teftişe göre muhtemelen onu geçti. Turing'in orijinal makalesine baktığımda, o orijinal formülasyonun ruhuna uygun olarak aktarılmış gibi geliyor.

Emmet: Muhtemelen bu aşamada ses sentezi için değil. Ve kesinlikle müzik ya da film gibi şeyler değil. Bu şeyin farklı hızlarda nasıl ilerlediğini görmek ilginç. Eğitim modellerinden mi kaynaklanıyor yoksa farklı medyaların temel sınırlamaları olduğunu mu düşünüyorsunuz?

Fergal: Bunun muhtemelen eğitim modellerinden kaynaklandığını söyleyebilirim. Zamanında gerçekten iyi video sentezi yapamamasının temel bir nedeni olduğunu düşünmüyorum.

Emmet: Video gibi bir şeyle bir insanı kandırmanın önündeki engel muhtemelen çok daha yüksek olsa da, harekete ve bunun gibi şeylere biyolojik olarak ne kadar uyumlu olduğumuzla ilgili. Bir sahteyi tespit etmek çok daha kolay.

Fergal: Ormandaki aslanlar sana doğru geliyor.

Emmet: Binlerce yıllık psikoloji, gitmemiz gerektiğinde koşmamızı sağlamayı amaçlıyordu.

S eğrisinde gezinme

Emmet: İnsanlar genellikle teknolojinin S-eğrisinden bahseder. Teknolojide yavaş ama sonra hızlı bir yükseliş veya olgunlaşma var ve sonra giderek azalıyor. Telefonlar inanılmaz derecede harikaydı, birkaç yıl boyunca yıldan yıla iyileştirmeler yapıldı, ancak bu yılki telefon geçen yılkiyle aynı çünkü S-eğrisi giderek azaldı. Bu teknolojiyle S eğrisinin neresindeyiz? Nerede olduğumuzu anlamak için nelere dikkat etmelisiniz?

Fergal: Evet, kesin olarak bilmek imkansız ve bunda bir sakınca görmemeliyiz. Bu alana akacak bir ton para ve kaynak olacağını biliyoruz. Büyük dil modelleri, süper zeka yolunda olsunlar ya da olmasınlar, hatta ulaşılabilir olsun ya da olmasın, mevcut biçimleriyle endüstriyel olarak yararlıdır ve muhtemelen tehlikeli şeylere dokunmadan endüstriyel olarak yararlı olacak daha birçok nesil vardır. Gidip bunları insanları daha verimli kılan, angaryayı ortadan kaldıran ve daha fazlasını yapmamıza yardımcı olan ürünlere dönüştürmeliyiz. Ve sanırım bunu görüyoruz.

"Bütün bu karmaşık, örtüşen geri bildirim döngüleri var, bu yüzden yakın zamanda durursa gerçekten şaşırırım. hızlandıracağını düşünüyorum”

Biz bunun neresindeyiz? Pekala, insanların GPT-4'ten daha büyük ve daha iyi olan daha fazla model eğitecekleri muhtemel görünüyor. Bu alana çok fazla para akacağı için, insanların gerçekten etkileyici şeyler yapan daha küçük ve daha verimli modeller yapma konusunda daha iyi hale gelmeleri oldukça muhtemel görünüyor. Ve tüm bu teknoloji üzerinde harika ürünler üretmek ve inşa etmek çok daha kolay olacak. Önümüzdeki birkaç yıl içinde gelecek olan son derece yüksek güvenim var. Bunun ötesinde, azalan getirilere ulaşıyor muyuz? Bu mümkün, ancak elde ettiğimiz S eğrisinin bir sürü farklı şeyin karmaşık bir fonksiyonu olduğunu söyleyebilirim.

Sonunda çok daha fazla GPU üreteceğiz ve video çok daha fazlasını yapacak, değil mi? Ve sonra, bunda daha iyi olacak ve ölçeği genişlettikçe daha ucuza gelecekler. Ayrıca, büyük sinir ağlarını eğitmek için daha iyi algoritmalar bulan tonlarca araştırma öğrencisi olacak. Bu daha iyi olacak. İnsanlar daha küçük, daha hızlı olanları eğitmek için güçlü modeller kullanacaklar. Tüm bu karmaşık, örtüşen geri bildirim döngüleri var, bu yüzden yakın zamanda durursa gerçekten şaşırırım. Bence hızlanacak.

Buna karşı tartılan şey, bazı şeylerin zamanla zorlaşmasıdır. Daha fazla antibiyotik bulmak için önce kolay bulunanları bulursunuz ve zamanla yenilerini bulmak giderek zorlaşır. Önce kolay kazanımları elde etmemiz, ardından ölçeklendirme yasalarına uymanız ve benzeri şeyler mümkündür. Open AI, daha fazla zekaya giden yolun daha büyük ve daha büyük modeller yetiştirmek olduğunu düşünmediklerini söyledi, ancak ben şüpheliyim. Belki burada bir sınıra ulaşırız ama bahse girerim daha büyük modellerle daha fazla zeka elde ederiz.

“İnternetten daha büyük olacağını düşünüyorum. Yeterince ileri giderse belki de sanayi devrimi kadar büyük”

Emmet: Az önce tanımladığınız tüm değişkenlerin yanı sıra, bu sefer farklı olan şey, hız ve ölçek. This is totally different in terms of how quickly it's going to get integrated into our products and lives. Bill Gates had this post recently where he said it's the biggest deal in technology since the microprocessor in the '70s. And it makes you think. When he saw that microprocessor, it was him and a hundred guys at the Homebrew Computer Club in some meetup or something, and they got access to it, played with it, and gradually rolled it out. One of the things I thought was dizzying this time was, I guess, in March, when OpenAI started releasing APIs, and people started to hack on top of it.

Fergal: March for GPT-4 and stuff?

Emmet: Right, exactly. Millions of people got to hack on this immediately, and I think it's going to be a very different dynamic. The amount of creativity that can be applied to the raw technology is orders of magnitude bigger than we've ever had before, and it's just going to add to the complete lack of predictability here.

Fergal: I think this is a huge technology revolution. I said this back in my first podcast with Des after ChatGPT came out, and I think it's going to be bigger than the internet. Maybe as big as the industrial revolution if it goes far enough. But this is the first one of this magnitude we've had in a while. When the internet came, you had this long, slow deployment, you had to run fiber around the world, you had to figure out how do you get this to last mile to everybody. Now-

Emmet: The infrastructure for delivery is there.

Fergal: And so, what needs to happen at scale is GPUs. We probably need to build a lot of GPUs to be able to run inference at scale. We need to build products, and the products need to be adaptive. But the product development loop can be pretty fast, and the rest of it seems to be bottlenecked on scaling GPUs and [inaudible 00:43:46] economics. And I think the [inaudible 00:43:48] economics are going to get really good, really fast. Even GPT-3.5 Turbo is not expensive.

Emmet: Does the software get cheap fast enough for there to be no bottleneck around GPUs?

“There have been lots of products in the past that were bottlenecked on hardware costs, and then that bottleneck went away. I expect we're going to see something like that here”

Fergal: Not at the moment. GPT-4 is a very expensive model and is absolutely bottlenecked on GPUs. But surely that will change. I've no private information here, but I suspect that GPT-3.5 Turbo is a distilled version of davinci-003 or something like that. It's cheaper to run. I bet it's cheaper on the backend too. Who knows, maybe they'll produce a distilled-down version of GPT-4 that is 10 times faster. That could happen anytime, for all I know.

Emmet: For the time being, though, the cost aspect is also a thing for product people to consider. There are some fundamental limitations based on the costs of providing this tech that I think a lot of businesses are also looking at it and going, “What's our model? What's our customer acquisition cost? How do we monetize usage of our product?” because there is probably a set of products out there where the use cases are ideally suited but the business model around the product is not. So there are a lot of interesting product challenges.

Fergal: Totally. And this was the case in the past. Once upon a time, Hotmail gave you a limit to the number of megabytes of email storage you would have. When Gmail came along, it was effectively unlimited because storage got cheap in the interim. There have been lots of products in the past that were bottlenecked on hardware costs, and then that bottleneck went away. I expect we're going to see something like that here. We're in the early days here. But a lot of the time, they're cheap compared to a human doing the same type of task. And so it's like, “Is it valuable enough? Is it something you wouldn't have a human do? Is it valuable enough to have a machine do it?” And for a lot of stuff, the answer is yes. I think we're going to see really fast adoption here.

Frictionless interfaces

Emmet: You talked about Gmail and the email limit, and famously, it was launched on April Fool's Day, and was it an April Fool's joke that they were giving you a gigabyte of storage. All of these new technical capabilities unlocked new interface possibilities. Now that you have a gigabyte, you don't have to archive or folder, you can just search, and everything can go in threads, so it changes the nature of the product that's possible.

AI is going to open up a whole bunch of new products. In the early days, we'll probably see a bunch of products retrofitting themselves, and we did this as well. “What's the easiest opportunity? We've got this often-used text box in our product. Let's add the ability to summarize, rephrase, shorten,” blah, blah, blah. We added that, and our customers loved it because it's a great use case when you're talking to your customers. Every text box on the internet that needs one will probably have one soon.

“I personally feel like user interfaces are likely to go away. Designers won't design user interfaces – AI agents will design user interfaces”

What are the next-level things? From an interface point of view, what will be possible? You're talking about a lot of money flooding in that's going to enable new types of products. We've been talking about conversational commerce, and at Intercom, we have spent a lot of time thinking about bots. Aside from the raw technical capabilities, it'll open up a whole offshoot of the evolution of software because you can build very different types of software with this now.

Fergal: I think that change could come quite fast. As a thought experiment, if you had an intelligent human whom you work with a lot who knows you and your preferences, and you were interfacing with them, they were driving the computer, and you were telling them what to do, what would that look like? A lot of the commands you would give would be verbal. Sometimes, you might reach down and say, “Oh, let me just take over the mouse from you,” but a lot of what you'd give would be high-level and verbal. But then you'd look at the screen to see the output. If someone has a bar chart with a bunch of data, you don't want to describe that verbally – you want to see that visually.

I think we're going to end up in a future where a lot of the input to the computer is verbal, and a lot of the output is going to be customized on the fly. It will probably be text because it's really fast, but I personally feel like user interfaces are likely to go away. Designers won't design user interfaces – AI agents will design user interfaces. If the agent feels you need to see a bar chart to make sense of the data, it'll render a bar chart. Otherwise, it'll render stuff in a very ad-hoc way. You basically get an interface customized to the task you want and what you're familiar with rather than something designed by someone.

You will probably end up with an agent that navigates the software for you, and that's going to be better than navigating the software for 99% of the use cases.

Emmet: That's very plausible. We imagine that everything will become text-first now, and in fact, it means, “You'll have everything you have today plus a whole other set of things that are now text-first as well.” I think it'll be largely additive rather than upending things.

Fergal: I don't agree. I think there's going to be an upending moment here. I think every complex piece of software is going to have some sort of freeform texting where you describe your task, but I think it'll change. You will probably end up with an agent that navigates the software for you, and that's going to be better than navigating the software for 99% of the use cases.

Emmet: That's super different from the LLMs we're used to working with today in an important way. Today you talk to them, they give you text back, and that's it, but you're describing a world that maybe we're just starting to creep into with ChatGPT plug-ins where they're starting to act on your behalf.

Fergal: I think it's wrong to say you put text into them, and they give you text back. The really scrappy interface to ChatGPT and GPT-4 looks like that due to an accident of history. And on a technological level, they do, in fact, do text completion, but that's going to disappear pretty fast. That's not how we use Fin. In Fin, the LLM is a building block deep down. You talk to a bot, sometimes you click buttons together to do stuff, and you're going to see that again and again.

Initially, the fastest way to integrate LMMs is text input/text output, but they're just going to become a building block. Medium-term, LLMs are an intelligent building block that people learn to use to get software to do intelligent things. Long-term, you're probably going to end up with an intelligent agent; your browser is probably going to turn into an intelligent agent.

Emmet: And the agent is clicking on coordinates on the screen for you.

Fergal: Probably initially, for backward compatibility. But then, I think, you just build APIs. Why would you build websites?

Emmet: That's what the logical part of my brain thinks, but most of the software we build today is built using HTML, which was not designed. It's also an accident of history that we're building software applications using a markup language with loads of other stuff sprinkled on top. Maybe we'll just end up building what we have.

Fergal: I'm sure it'll be there as some compatibility or some intermediate layer.

Emmet: Or a fallback or something like that. What we're talking about there, to be clear, is looking at a picture of what's on your screen, finding the text that says, “click here,” and simulating moving your mouse to actually click on the “click here” for you? Is that what you're talking about when you mean an agent acting in the browser?

“We won't really care what it's like down underneath the hood. We just know we can ask for what we want, and it'll complete the task”

Fergal: No. And again, this is speculative, but imagine there's a legacy government website you want to get something done on. For example, you need to update your bank account details. What you do is say to your agent on your phone or desktop or browser, “Hey, I need to update my bank account on the government's social security website.” Your agent goes, “Okay, done.” In the background, your little intelligence agent went and drove the website; it didn't show that to you. After a certain point, people working in the government are going to be like, “Well, why do we need to keep building the websites? We just need to build the API.”

Emmet: Right. LLMs are a pretty awesome API to an API, in a sense. You can layer it on top, and it's just a more human-readable API to any machine-readable API.

Fergal: Yeah, exactly, but I'd phrase it differently. The intelligence we happen to have comes in the form of LLMs at the moment, but that's going to get abstracted away. We won't really care what it's like down underneath the hood. We just know we can ask for what we want, and it'll complete the task. If you say to it, “What was the unemployment rate in Ireland over the last 10 years for people in their 20s?” It'll go to the Central Statistics Office website, download the data, parse it, render a graph, and so on.

I have a talk coming up, and I needed a graph. I spent time on Google trying to find the exact one I had in my head, writing my search query in Google, and after two minutes, I just couldn't find the right graph. So, I went to GPT and said, “Generate me the following graph.” It generated the plug-in code, and I just put it into my notebook. I copied and pasted my graph and put it in my presentation. The fastest way for me to get the graph I wanted was to have an intelligence system generate the code. That was faster than trying to find it on Google. There's a lot of interface friction, but that's going to go away, and you're going to end up with a really fast agent that accomplishes tasks. Once you have that, it's going to eat your current software stack.

Emmet: I'm understanding what you're saying a little bit better, but I don't see all software being reduced to a text input box because that's the wrong input and output modality for a lot of stuff, including what you just described. A good example is all the image generation stuff, which is loads of fun to play with, but you've got to go onto a Discord bot to engage with Midjourney and hack it by writing F stop 1.4, hyper-realistic… No, this is fundamentally a visual thing I'm trying to create. I want a more tactile UI. I want more knobs and dials. What are the properties of it that I can dial up and down and play with rather than feeling my way blind in effectively a command line interface? Because the lack of affordances in a command line interface means it's often not the best UI.

Fergal: Ama gelecekte muhtemelen menajerinize "Hey, dün çektiğim fotoğrafları düzenlemek istiyorum" gibi bir şey diyeceksiniz. Ve sizi ve karmaşıklık seviyenizi bilir. Fotoğraflarınızı düzenlemek istediğinizde, dört filtre ve bir kırpma aracı aradığınızı veya alternatif olarak, süper yakınlaştırma yanlısı şeyler yapmak istediğinizi bilir. Gidip desen kitaplığında bunların her biri için en iyi arabirimleri arar ve bu arabirimi sizin için oluşturur.

“Tamamen yaptığınız göreve bağlı olacak. Eğer bir pilotsanız, 'Uçağı indirme zamanı! Hey, LLM, bunu yapmam için otomatik olarak bir arayüz oluştur'”

Emmet: Ve sonra "Aslında biraz daha profesyonel olmasını istiyorum" diyorsun. Ve "Tamam, size kullanıcı arayüzünün profesyonel sürümünü vereceğim" diyor. Ve bunu dinamik olarak işler.

Fergal: Bak, arayüzü kullanmayı öğrenmek istemediğin bazı görevler olacak. Des geçenlerde farklı bir podcast'te bundan bahsediyordu. Workday'de tatil zamanınızı güncellemeniz gerekiyor ve bunun için bir arayüz öğrenmek istemiyorsunuz. Sadece görevin tamamlanmasını istiyorsun. Örneğin, profesyonel bir programcı olduğunuz ve benim bir IDE kullanmayı öğrenmem gereken başka şeyler de olacak. Bazı tasarımcılar ne isteyeceğim ve ne yapmam gerektiği hakkında çok detaylı düşündü ve muhtemelen orada hafif bir özelleştirme katmanı var, ancak yine de kullanmayı öğreneceğim iyi tasarlanmış bir arayüz var. İlki için, yapmak istediğim görevler için arayüzlerin kaybolacağını veya birçoğunun geçici olarak oluşturulacağını düşünüyorum. İkincisi için, evet, uyarlanabilir olacaklar.

Emmet: Söylediklerinin hepsine katılıyorum. Ayrıca bana ek bir nüans geliyor. Tamamen yaptığınız göreve bağlı olacaktır. Eğer bir pilotsanız, gitmek istemeyeceksiniz, “Uçağı indirme zamanı! Hey, LLM, bunu yapmam için otomatik olarak bir arayüz oluştur." Düzenleme ve bunun gibi şeyler olacak, eminim. Ancak bu, her zaman son derece deterministik, ikili, açma/kapatma anahtarı güdümlü doğruluk makineleri olarak düşündüğümüz bilgisayarlarla çalışmaktan kaynaklanan büyük farklardan birini yansıtıyor ve şimdi, birdenbire, bu çok değişiyor. Ve bu, tarif ettiğimiz her şeyin yanı sıra büyük bir değişiklik – ne bekleyebileceğiniz, kişisel olarak sizin için çalışmasını nasıl bekleyebileceğiniz ve üzerinde sahip olduğunuz değiştirilebilirlik veya kontrol miktarı. Bence çok daha heyecan verici deney farklılıkları görmeye başlayacağız ve bugün sahip olduğumuz, duvar kağıdınızı veya yazı tipi boyutunu değiştirebileceğiniz özelleştirme düzeyi, muhtemelen kıyaslandığında sönük kalacak.

Çemberin merkezine doğru

Emmet: Ayrıca geri dönmek istediğim ilginç bir şey söyledin. Çoğunlukla bir kitaplıktan montaj yapan tasarımcıları hayal edin. Kullanıcı arayüzü tasarımının görevi ilginç çünkü tasarım sistemleriyle kendimizi buna göre ayarlıyoruz. Bir tasarım sistemi, bileşenlerden oluşan bir model kitaplığıdır. Büyük bir ürün oluşturuyorsanız, tutarlı olmasını ve onu hızlı bir şekilde bir araya getirebilmeyi istersiniz. Bu nedenle, döşediğimiz birçok temel çalışma ve inşa ettiğimiz sistemler, diyelim ki tasarım ekipleri ve muhtemelen mühendislik ekipleri de dahil olmak üzere, bu sistemler tarafından hızlı bir şekilde yeniden kullanılabilecek bileşenler inşa etmek, hepsi hedeflenmiştir. bu araçları oldukça hızlı bir şekilde oluşturma yeteneğimize doğru. Tanımladığınız şey, tasarım sisteminizi alıp ondan bir kullanıcı arayüzü oluşturan bir şey ve kilometrelerce uzakta görünmüyor.

Fergal: Ya da standart açık kaynak tasarım sistemini alıp ondan bir araç oluşturuyor olabilir. Bunun bireysel şirketler düzeyinde mi yoksa geniş bir yatay düzeyde mi olacağını bilmiyorum.

Emmet: Evet, bu çok sıkıcı olurdu. Trajik olurdu. iOS 7'den önce, skeuomorphism falan vardı, sonra süper inatçı düz tasarıma geçtiler ve tüm endüstri, Apple'ın hakimiyetinden o kadar etkilendi ki, tüm web siteleri aynı görünmeye başladı. Apple, insan arayüzü yönergelerini yayınladı ve "Bakın, iPhone uygulamaları şimdi böyle görünmeli" dedi. Ama bence çeşitliliğin düzleşmesine ve daha sıkıcı bir ağa yol açtı. Ve bu, kendi kendini inşa edebilen bu sistemlerin hizmetindeydi.

Fergal: Menajerinize bunun havalı ve retro görünmesini istediğinizi söyleyebilirsiniz. Bunun olacağını hayal etmelisiniz ve bence, insanların gerçekte ne kullandıkları açısından işler çok daha özelleştirilebilir hale gelecek çünkü belirli bir ekiple nasıl arayüz oluşturulacağını anlayan akıllı bir katmanınız var. Muhtemelen bugün bunu yapardın. Bugün kullanıcı arabirimleri için Midjourney'i oluşturmak üzere yola çıkarsanız, muhtemelen bunu yapabilirsiniz. Kullanıcı arabirimleri yazmak için kod veya CSS oluşturabilen GPT-4'ümüz var ve tüm görüntüleri ve metni yerleştirdiğiniz ve onları bir nevi ezdiğiniz görüntü sentez modellerimiz var. Bahse girerim oldukça hızlı bir şeyler inşa edebilirsin.

Emmet: Bunu söylediğin için çok komik ve benim duygusal tepkim, “Hayır, anlamıyorsun; Kullanılabilirlik ve insanları anlama ve bunun gibi şeyler hakkında düşünmeniz gerekiyor.” Ve sonra, "Evet, bunlar bahsettiğimiz muhakeme yetenekleri ve görünüşe göre şimdi onlara sahip." Ve bunun hakkında konuşurken, o kadar duygusalım ki...

Fergal: Kriz.

Emmet: Yapay zeka senin disiplinin için geliyor. Ama dürüst olmak gerekirse, bu konuda o kadar endişeli değilim çünkü bence pek çok tasarımcı ve bunun programcılar için de söylendiğini duydum, bunun büyük ölçüde hızlandırdığı ve iyileştirdiği homurdanan işlerin yasını tutmayacaklar. Aslında, belki bir yakınlaştırma seviyesine çıkmalarına ve çözümün uygulanmasından ziyade çözüm hakkında biraz daha fazla düşünmelerine olanak tanır. Ürün inşa etmek hâlâ çok zahmetli ve çok zaman alıyor ve bence bu zahmetli işin bir kısmını çıkarırsak ne olacağını görmek harika olacak.

Fergal: Demek istediğim, işler, işe yerleştirmeler ve iş değişikliği hakkındaki tüm bu tartışma ve burada bir şeyler olacak. Bunu duyduğumda, "Ah, belki bu artık tasarımcılara ihtiyacınız olmadığı anlamına geliyor - belki de sadece ürün yöneticilerine ihtiyacınız var" dedim. Ve bir ürün yöneticisi artık bir tasarımcının yaptığı her şeyi yapabilir. Belki bir programcıya ihtiyacınız yoktur, belki de sadece bir ürün yöneticisine ihtiyacınız vardır. Ve hepimiz gelecekte ürün yöneticilerine dönüşüyoruz. Bilmiyorum. Belki bunun gibi çok daha fazla rol ve iş olabilir ya da belki daha az olacaktır.

Emmet: Bence buna eğilmeliyiz. Kariyerimde fark ettiğim bir şey, ne kadar kıdemli olursanız, disiplininize o kadar az özgül oluyorsunuz. Daha genel bir lider haline gelmelisin.

Fergal: Bu konuşmayı tasarım ekibinden biriyle yaptım. Mühendislik, ürün ya da tasarım gibi bir disiplinde yeni olduğunuzda, bir çemberin kenarındasınız demektir. Ve sonra, kıdemli olduğunuzda, merkeze doğru daha fazla ilerliyorsunuz. Dairenin merkezinde ürün var. Ve böylece, gittikçe daha kıdemli hale geldikçe, dünyanız inşa ettiğiniz ürün hakkında giderek daha fazla ve geldiğiniz açıdan daha az ilgili hale gelir.

Emmet: Bunu ben de görebiliyorum. Yani, hepimiz Başbakan olacağız, plan bu mu?

Fergal: Evet, yani sonuçta böyle bir işte yapmaya çalıştığımız şey bu.

Emmet: Demek istediğim, doğrudan uygulanabilir herhangi bir pratik beceriye sahip olmayan bir ürün sorumlusu değilse, bir Proje Yöneticisi nedir, değil mi Fergal?

Fergal Reid: Evet, biliyorum. PM nedir?

Emmet: Bence bitirmeliyiz. Sağol Fergal.

Fergal: Teşekkürler Emmet.

Fin bekleme listesi