Mobil cihazların kullanılabilirliğini geliştirmek için Derin Öğrenmeyi kullanmanın 6 yolu
Yayınlanan: 2020-01-23Gelişmiş, daha kişiselleştirilmiş mobil deneyimler için artan küresel taleple birlikte, mobil uygulama geliştirme endüstrisinde yaygın AI ve derin öğrenme uyarlaması kaçınılmazdır. Mobil algılama ve bulut bilişim ile ortaya çıkan sinir bozucu gecikme sorunlarını unutun. Optimum sonuçlar sağlamak için gerçek zamanlı veri işleme hızları ile sıfıra yakın gecikme köşede.
Apple'ın yerleşik sinir işleme birimlerine sahip gelişmiş Bionic akıllı telefon çipleri, sinir ağlarının doğrudan cihaz üzerinde inanılmaz hızlarda çalışmasına yardımcı oluyor. Mobil geliştiriciler, Apple'ın Core ML ve Google'ın ML Kit platformlarını ve TensorFlow Lite ve Keras gibi derin öğrenme kitaplıklarını kullanarak daha düşük gecikme süresi, daha az hata ve daha hızlı veri işleme ile uygulamalar oluşturabilir.
Cihazda makine öğreniminin ana avantajı, kullanıcılara sorunsuz ve doğru bir kullanıcı deneyimi sunmasıdır. Verilerin işlenmesi için harici sunuculara gönderilmesi söz konusu olmadığından, gelişmiş veri koruması ve kullanıcı güvenliği ve gizliliği elde edersiniz. Ayrıca mobil cihazlardaki sinir ağları ile uygulamalarınızın her özelliğine erişmek için internete bağlanmanız gerekmez. Elbette çoğu standart özellik için internete ihtiyacınız olacak.
Derin öğrenmeyi mobil cihazlara dağıtmanın 6 yolu
Derin öğrenme algoritmalarını uygulamak için mobil cihaz bilgi işlem yeteneklerinden yararlanmak, şüphesiz mobil cihazların kullanılabilirliğini geliştirdi. İşte nasıl:
1. Cihazda konuşma tanıma
Konuşma tanıma, tekrarlayan sinir ağları (RNN), evrişimli sinir ağları (CNN), derin sinir ağları (DNN) ve diğer mimarileri kullanarak girdi dizilerini çıktı dizilerine dönüştürmeyi veya dönüştürmeyi içerir. Geliştiriciler, isteğiniz ve otomatik asistanın yanıtı arasında gecikmelere neden olan gecikme sorunuyla mücadele etti, ancak artık mobil cihazlarda kompakt yinelenen sinir ağı dönüştürücü (RNN-T) teknolojisini kullanarak bu sorunu aşabiliyoruz.
RNN-T'ler diziden diziye modellerdir. Bununla birlikte, bir çıktı üretmeden önce bir girdi dizisinin tamamını işlemenin olağan yöntemini izlemek yerine, girdi işleme ve çıktı akışında sabit bir sürekliliği korurlar. Bu, gerçek zamanlı konuşma tanıma ve işlemeyi kolaylaştırır. Bunu, ardışık sesli komutları duraklamadan ve her istekten sonra 'Hey, Google'ı çağırmanıza gerek kalmadan işleyebilen Google Asistan ile görürsünüz.
Daha doğal, iki yönlü bir konuşma sağlar ve Asistan talimatlarınızı bir T'ye kadar takip eder. Bir e-posta konusu belirlemesini, klasörlerinizden birinde bir fotoğraf bulmasını ve sizi kız kardeşinizin yerine yönlendirmesini ister misiniz? Bitti.
Google'ın yeni Pixel 4'ü ile devam eden Canlı Altyazı özelliği, sesli notlara, podcast'lere ve videolara gerçek zamanlı olarak ve - işlem cihazda olduğu için - uçak modunda da altyazı sağlayabilir. Örneğin, Twitter akışınızda bir video görünürse, sesi açmanıza gerek kalmadan altyazılarından ne hakkında olduğunu öğrenebilirsiniz. Canlı Altyazı henüz müzikle veya telefon ve görüntülü aramalarla çalışmıyor.
2. Hareket tanıma ile artan verimlilik
Cihaz üzerinde makine öğrenimi ardışık düzen modelleri ile mobil cihazınızı el ve vücut hareketlerini algılamak, izlemek ve tanımak için eğitebilirsiniz. Cihazınızın kamerası, hareketlerinizi ve hareketlerinizi 3D görüntü verileri olarak kaydeder ve saklar. Sinir ağlarının derin öğrenme algoritmaları daha sonra belirli statik ve dinamik hareketleri tanımlamak ve deşifre etmek için bu hareket kitaplığını kullanır. Daha sonra bunları gerçek zamanlı olarak amacınızla eşleştirir ve istediğiniz komutları yürütürler.
Google Pixel 4 akıllı telefonlar, telefonunuzla karmaşık ve sözlü olmayan etkileşimi kolaylaştıran Soli çipiyle birlikte gelir. Telefonun üst kısmındaki bu minyatür radar sensörü, telefon etkileşimlerinizi etkinleştirmek için varlığınızı ve el ve vücut hareketlerinizi algılayabilen Motion Sense teknolojisine güç sağlar. Elinizi sallayarak, telefona dokunmadan bile ona ertelemesini, alarmı susturmasını veya çalma listenizdeki bir sonraki şarkıya geçmesini söyleyebilirsiniz.
3. Artırılmış Gerçekliğin sürükleyici yetenekleri
Geliştiriciler, Google'ın ARCore ve Apple'ın ARKit platformlarını kullanarak dijital nesneleri ve ortamları gerçek yaşam ayarlarıyla yan yana getirebilen artırılmış gerçeklik uygulamaları oluşturabilir. Telefon tabanlı artırılmış gerçekliğin sürükleyici yetenekleri perakende, eğlence, seyahat ve diğer endüstriler üzerinde önemli bir etkiye sahip. Lacoste ve Sephora gibi markalar artık müşterilerinin artırılmış gerçeklik uygulamalarıyla ürünleri denemelerine veya önizlemelerine olanak tanıyor ve giderek artan sayıda alışveriş yapan kişi, satın alma kararını vermeden önce ürünleri telefonlarında incelemeyi tercih ediyor.
Pokemon, Ingress ve Ghostbusters World gibi etkileşimli artırılmış gerçeklik oyunları kapsamlı bir basın ve özel bir takipçi kitlesi aldı. Şehirde yolunuzu bulmak istiyorsanız, Google Maps Live View size gerçek zamanlı navigasyon sağlayacaktır.
4. Daha yüksek kaliteli fotoğraflar
Yüksek fotoğraf kalitesi, alıcılar için son modellerin birçoğu ile alabilecekleri akıllı telefon seçerken önemli bir kriterdir. Bunlar, fotoğraf çekme söz konusu olduğunda akıllı telefonları geleneksel kameralardan tamamen farklı bir alana fırlatan donanım bileşenleri (merkezi işlem birimleri (CPU'lar), görüntü sinyali işlemcileri, derin öğrenme görüntü algoritmaları ve sinirsel işleme birimleri) ile donatılmıştır. Bunlarla akıllı telefonlar, yüksek çözünürlüklü fotoğraflar çekmek için gördüklerinin piksel sınıflandırma düzeyinde daha fazla farkındalık gösterebilir.

Google Pixel telefonlar ve Apple iPhone'lar , insanları ve nesneleri tanımak, derinlik haritaları oluşturmak, uzun pozlamaları sorunsuz bir şekilde birleştirmek ve doğru renk dengesini hesaplamak için birden fazla kamera ve karmaşık makine öğrenimi algoritmaları kullanır.
Algoritmalar, sinir ağlarını bir görüntü veri kümesi üzerinde eğiterek, bireysel görüntü gereksinimlerine nasıl yanıt verileceğini ve fotoğrafları gerçek zamanlı olarak rötuşlamayı öğreniyor. MIT ve Google'dan araştırmacılar tarafından geliştirilen otomatik rötuş sistemi, fotoğrafçıların daha çekimi yapmadan önce bir görüntüye farklı stiller uygulamalarına olanak tanıyor.
Evrişimli bir ağ düşük çözünürlükte görüntü işlemeyi gerçekleştirdikten sonra, afin renk dönüşümü olarak bilinen bir eşleme yöntemi görüntü piksel renklerini değiştirir. Ağ, bu dönüşüm formüllerini, daha sonra yüksek çözünürlüklü bir görüntü çıktısı sağlayan bir 3B ızgarada saklar. Her şey milisaniyeler içinde gerçekleşir.
Akıllı telefonlar artık düşük ışıkta ve gece fotoğrafçılığında DSLR'leri geride bırakıyor. Akıllı telefon kameraları, derin sinir ağlarını ve sensörleri birleştirerek, insan gözünün algılayabileceğinden daha fazla renkle daha keskin görüntüler yakalayabilir.
P20 Pro ile uygulanabilir düşük ışıkta çekimler sunan Huawei, yüksek kaliteli, düşük ışıkta fotoğrafçılık ve düşük ışıkta videografi sunmak için Mate 30 serisinde RYYB filtreleri, büyük sensörler ve AI görüntü işleme kullanır. Google Pixel 4, 0,3-3 lüks aralığında fotoğraf çekebilen Gece Görüşü modu ile birlikte gelir ve astrofotografisi karanlık, yıldızlı bir gökyüzü yakalayabilir. Karanlıkta otomatik olarak devreye giren gece modunun yanı sıra Apple'ın yeni Deep Fusion sistemi, ışık seviyelerine uyum sağlayacak ve iPhone fotoğrafçılığını daha etkileyici bir seviyeye taşıyacak.
Fotoğrafçılıktan hiç anlamasanız bile bu akıllı telefonlar ile harika fotoğraflar çekebileceksiniz.
5. Artan güvenlik ve gizlilik
Genel Veri Koruma Düzenlemelerine (GDPR) ve Kaliforniya Tüketici Gizliliği Yasasına (CCPA) uymak, cihaz üzerinde makine öğrenimi ile daha kolay hale geldi. Biyometri, şifreleme veya canlı altyazı için verileri işlemek üzere bir sunucuya veya buluta yüklemeniz gerekmediğinden veri güvenliğini garanti eder.
Cihazda otomatik şifreleme, içeriğinizi bir PIN, şifre veya desenle koruyan ve verilerinize yalnızca telefonunuzun kilidini açtığınızda erişime izin veren başka bir kullanışlı akıllı telefon özelliğidir. Bu nedenle, cihazınızı kaybederseniz veya çalınırsa, herhangi birinin verilerinizi ele geçirme olasılığı yok denecek kadar azdır.
iPhone'un Face ID özelliği , daha güvenli bir akıllı telefon deneyiminin bir örneğidir. Apple akıllı telefon çiplerindeki cihazdaki sinir ağları, kullanıcının yüz verilerini işler ve güvenli bir şekilde depolar. Tanımlama cihazınızda gerçekleşir, böylece gizliliğiniz ve güvenliğiniz engellenmeden kalır.
Google Pixel 4'ün Soli çipi tarafından kolaylaştırılan Face Unlock teknolojisi, yüz tanıma için yüz modellerinizi oluşturmak için 3D IR derinlik eşlemesini kullanır ve bunları bir cihazdaki Titan M6 güvenlik çipinde saklar. Face Unlock, kimlik sahtekarlığı olasılığını ortadan kaldırarak kullanıcılara biyometrik güvenlik sunmak için 1Password uygulamasıyla iyi çalışır. 1Password uygulamasını Pixel 4'te kurmak için, Otomatik Doldurma'ya bilgilerinizi girmeniz ve oturum açmak için Parmak İzi Kilit Açma işlevi yerine Yüz Kilidi Açma'yı kullanmanız yeterlidir.
6. Görüntü tanımada daha fazla doğruluk
Cihazdaki makine öğrenimini görüntü sınıflandırma teknolojisiyle eşleştirerek, karşılaştığınız hemen hemen her şeyi gerçek zamanlı olarak tanımlayabilir ve ayrıntılı bilgi alabilirsiniz. Yabancı dilde bir metin okumak ister misiniz? Anında ve doğru bir çeviri almak için telefonunuzla tarayın. Bir kıyafet veya bir mobilya parçası ilginizi çekti mi? Fiyat ve nereden satın alabileceğiniz hakkında bilgi almak için tarayın. Restoran menüsünde cazip yeni bir yemek var mı? İçeriğini ve beslenme bilgilerini öğrenmek için telefonunuzu kullanabilirsiniz.
Google Lens, Calorie Mama ve Leafsnap gibi uygulamalar gerçek zamanlı olarak görüntü tanımayı kolaylaştırarak mobil cihazların kullanılabilirliğini ve öğrenilebilirliğini artırıyor ve kullanıcı deneyimini geliştiriyor.
Mobil cihazlarda derin öğrenme: son düşünceler
Cihazda makine öğreniminin olanakları çok büyük. Giderek daha verimli akıllı algoritmalar, daha derin sinir ağları ve daha güçlü AI çipleri ile derin öğrenme mobil uygulamaları bankacılık, perakende, sağlık hizmetleri, veri analitiği, bilgi teknolojisi, telekomünikasyon, havacılık ve diğer çeşitli sektörlerde standart olacaktır.
Doğrulanmış Pazar Araştırmasına göre, küresel derin öğrenme pazarının 2026 yılına kadar 26,64 milyar dolara ulaşması ve derin öğrenme yonga seti teknolojisi pazarının 2,9 milyar dolara ulaşması bekleniyor. Derin öğrenme yetenekleri gelişmeye devam ettikçe, mobil cihazların kullanılabilirlik özellikleri de gelişecek ve daha fazla inovasyonu destekleyecektir.
Bir sonraki yazılım projeniz için hazır mısınız? Bizimle temasa geçin!