Keynote: Aramanın Geleceği #SMX
Yayınlanan: 2022-06-12Tüm hafta boyunca SMX West'i canlı blogladığımız BCI blogunu izlediniz. Bu, Google Zürih'te baş mühendis olan Behshad Behzadi'nin demo ağırlıklı bir sunumu olan gösterinin açılış konuşmasıdır.
Behzadi, konuşma aramasının yöneticisidir. Danny Sullivan, Behzadi'nin bu sunumu daha önce SMX London'da yaptığını ve konuşma aramasıyla nelerin mümkün olduğuna dair akıllara durgunluk veren bir sunum olduğunu söylüyor. Behzadi 10 yıldır Google'da, ilk yedi yılı sıralama üzerinde ve son üç yılı Now on Tap dahil olmak üzere geleceğin teknolojisi üzerinde çalışıyor.
Aramanın hareket ettiği ve Google'ın stratejik olarak daha fazla yatırım yaptığı yer burasıdır. Ekranda Kaptan Kirk'ün bir fotoğrafı ve ardından Kirk'ün Star Trek bilgisayarıyla konuşurken olduğu bir video beliriyor. (Uzay Yolu klibinden önce atlanamayan 15 saniyelik bir YouTube reklamı oynatıldığında seyirci kesinlikle çatlar.)
Behzadi'nin oynattığı bir diğer video da, yapay zeka işletim sistemini gördüğümüz “Her” filminden. Bu filmlerin ikisi de cevaplar ve yardım için bir makineyle konuştuğunuz bir geleceği hayal ediyor. Bu tür bir yapay zeka deneyimine geçiyoruz ve gelecekte 20 yıl veya 200 yıl olmayacak. Şu anda hareket ettiğimiz yön bu ve demolarında göreceğimiz gibi, zaten oldukça yakınız.
Arama Bu Noktaya Nasıl Geldi?
2002'de başlayarak, arama işlevlerinin eşanlamlıları nasıl anladığı konusunda erken bir atılım. "cs" içeren sorguların bir listesini ve Google'ın "cs"yi nasıl farklı yorumlayabileceğini gösteriyor:
- “kaliforniya'da doktora cs kabulü” —> cs = bilgisayar bilimi (Google'ın yorumu)
- "cs öz sermaye fonları için günlük fiyatlar" —> cs = kredi suisse
- “cs bank hayfield” —> cs = vatandaşlar devleti
- "2007 cs dünya kupası" —> cs = karşı vuruş
- "amsterdam cs'den havaalanına otobüs" —> Google, cs = merkez istasyon yorumladı
İleriye dönük bir başka büyük adım da 2007'deki Evrensel Arama'ydı. Elmaları ve portakalları karşılaştırdığımız için tüm sonuç sorunu çok daha zor hale geliyor.
Daha sonra, 2012'de Bilgi Grafiği ve Google'ın "sıraları değil, şeyleri" anlaması, gerçek dünyayı anlamada bir sonraki adımdı. 2 milyar varlık, 54 milyar gerçek, 38.000 varlık türü - ve büyüyor. (Behzadi her sunum yaptığında bu sayıları günceller.)
Dünya değişiyor
Dünya giderek daha mobil hale geliyor. 2015'te insanlar telefon ve tabletlerde masaüstünden daha fazla arama yaptı. Yani geleceği inşa etmek istediğinizde aklınıza mobil geliyor. Akıllı telefonların yanı sıra sizinle birlikte hareket eden ve bulunduğunuz yerin bağlamını bilen başka cihazlar da var. Buna saatler gibi giyilebilir cihazlar ve hatta akıllı arabalar dahildir.
Mobil dünyada insanlar konuşmayı giderek daha fazla kullanıyor. Yeni cihazlarla konuşma, giriş yapmanın en kolay ve bazen tek yoludur.
- Sesli arama oranı, konuşma türünden daha hızlı büyüyor.
- Sesli aramadaki artışın nedeni, günümüzde konuşma tanımanın gerçekten çalışıyor olmasıdır.
- Günümüzde konuşma tanıma kelime hata oranı yüzde 8'dir.
Unutulmaması gereken başka bir şey de, konuşma aramasının normal olmasıdır. Bugün telefonunuzda arama yaptığınızda kimse bunun garip olduğunu düşünmüyor. Bu nedenle insanlar sorgulama dili yerine daha doğal cümleler kullanırlar.
“Paris'te hava nasıl?” "Paris hava durumu"na karşı
Bu mobil dünyada insanlar ihtiyaçlarının yanıtlarını hem uygulamalarda hem de web'de buluyor.
O halde Aramanın Geleceği Nedir?
Nihai asistanı oluşturmak için.
Nihai asistan şunları anlamalıdır:
- Dünya
- sen ve senin dünyan
- Mevcut bağlamınız
Demolar!
- dünya ile ilgili cevaplar
- senin hakkında cevaplar
- uygulamalar
- Hareketler
- Bağlamlar ve konuşmalar
- Şimdi Dokunun
dünya ile ilgili cevaplar
Örneğin, "Bana votka ile yapılan kokteyllerin bir listesini gösterir misiniz?"
senin hakkında cevaplar
Örneğin, "Bir sonraki uçuşum ne zaman?" veya “İşimin adresi nedir?”
E-postanızı aramanın yanı sıra, takviminizde etkinlikler için arama yapabilir, fotoğraflarınızı yunuslar için arayabilirsiniz ve fotoğraf tanıma oldukça güçlüdür.
uygulamalar
Google'dan bir şarkıyı başlığına göre çalmasını istiyor.
Hareketler
Sadece sorarak istediğiniz zaman için alarm kurabilirsiniz.
Bağlamlar ve konuşmalar
Konuşma tanımadan anlamaya - sorduğu ilk sesli arama, "Rigi ne kadar yüksek?" Google soruyu anlamıyor. Ardından, Google'ın listelediği "Alpler'deki dağlar" diyor. Ve sonra, "Rigi ne kadar yüksek?" diye soruyor. ve şimdi Google, Rigi dağının yüksekliğiyle cevap verebilir.
Ses düzeltme: “Bana Galler resimlerini göster” diye sorabilirsiniz ve balinaların resimlerini geri alırsınız. Sonra "galler" diyorsunuz ve Google bunun bir düzeltme olduğunu anlıyor ve Galler'in resimlerini gösteriyor.
Şimdi Dokunun
Bir sohbette olduğu ve bir restoran rezervasyonu hakkında konuştuğu andan, rezervasyonun yapıldığı ana kadar, bu iki dokunuş.
Nihai asistan hala bilim kurgu mu? Gittikçe daha inandırıcı hale geliyor. Star Trek bilgisayarının veya “Her” işletim sisteminin deneyimine çok benzer bir şey neredeyse burada. Behzadi bu filmlere bilim kurgu demezdi.
Aramanın geleceği, önemli şeylere odaklanabilmeniz için günlük yaşamınızda size yardımcı olan en büyük yardımcıdır.
Soru-Cevap
Soru : B2B'de laptop ile konuşmak hala kabul edilmiyor. Bu teknolojinin B2B'deki yerinden bahseder misiniz?
B2B için cevaplama ve işleri halletme yetenekleri açısından aynı, daha önce aranmış olana dayalı bir sonraki aramanın yapılması durumunda teknoloji hala aynı.
Soru : Mobil ve masaüstünde sesli aramanın başarı oranı nedir? Bu başarıyı nasıl ölçüyorsunuz?
Bu, yanıtlaması zor bir soru çünkü sorgu türleri farklı.
Soru : Bir çoğumuz ve müşterilerimizin Apple ürünleri var. Bu Google teknolojilerini Apple ürünlerine nasıl genişletebilirsiniz?
Apple telefonlar iyi telefonlar ve tüm kullanıcılara ulaşmak istiyoruz. Belki bugün gösterdiklerinin yüzde 80'i Apple telefonlarında çalışıyor. Tüm uygulama entegrasyonu daha zor kısımdır.