6 moduri în care puteți folosi Deep Learning pentru a îmbunătăți gradul de utilizare a dispozitivelor mobile

Publicat: 2020-01-23

Cu o cerere globală crescută pentru experiențe mobile îmbunătățite și mai personalizate, IA pe scară largă și adaptarea învățării profunde în industria de dezvoltare a aplicațiilor mobile sunt inevitabile. Uitați de problemele frustrante de latență care apar cu detecția mobilă și cloud computing. Latența aproape de zero este la colț, cu viteze de procesare a datelor în timp real pentru a oferi rezultate optime.

Cipurile avansate de smartphone Bionic de la Apple cu unități de procesare neuronală încorporate ajută deja rețelele neuronale să ruleze direct pe dispozitiv la viteze incredibile. Folosind platformele Apple Core ML și Google ML Kit și bibliotecile de deep learning precum TensorFlow Lite și Keras, dezvoltatorii de telefonie mobilă pot crea aplicații cu latență mai mică, mai puține erori și procesare mai rapidă a datelor.

Principalul avantaj al învățării automate pe dispozitiv este că oferă utilizatorilor o experiență de utilizator perfectă și precisă. Deoarece nu se pune problema trimiterii datelor către servere externe pentru procesare, obțineți protecție îmbunătățită a datelor și securitate și confidențialitate a utilizatorilor. De asemenea, cu rețelele neuronale pe dispozitivele mobile, nu este nevoie să vă conectați la internet pentru a accesa fiecare caracteristică a aplicațiilor dvs. Desigur, veți avea nevoie de internet pentru majoritatea funcțiilor standard.

6 moduri de a implementa învățarea profundă pe dispozitivele mobile

Folosirea capabilităților de calcul a dispozitivelor mobile pentru a implementa algoritmi de învățare profundă a îmbunătățit, fără îndoială, capacitatea de utilizare a dispozitivelor mobile. Iată cum:

1. Recunoașterea vorbirii pe dispozitiv

Recunoașterea vorbirii implică transformarea sau transducerea secvențelor de intrare în secvențe de ieșire folosind rețele neuronale recurente (RNN), rețelele neuronale convoluționale (CNN), rețelele neuronale profunde (DNN) și alte arhitecturi. Dezvoltatorii s-au confruntat cu problema latenței – care creează întârzieri între cererea dvs. și răspunsul asistentului automatizat – dar acum o putem ocoli utilizând tehnologia traductorului de rețea neuronală recurentă compactă (RNN-T) în dispozitivele mobile.

RNN-T-urile sunt modele secvență-la-secvență. Cu toate acestea, în loc să urmeze metoda obișnuită de procesare a unei întregi secvențe de intrare înainte de a produce o ieșire, ei mențin o continuitate constantă în procesarea lor de intrare și fluxul de ieșire. Acest lucru facilitează recunoașterea și procesarea vorbirii în timp real. Vedeți acest lucru cu Asistentul Google, care poate procesa comenzi vocale consecutive fără să se clatine și fără a vă solicita să invocați „Hei, Google” după fiecare solicitare.

Oferă o conversație mai naturală, bidirecțională, iar Asistentul vă va urma instrucțiunile până la un T. Vrei să seteze un subiect de e-mail, să găsească o fotografie într-unul dintre dosarele tale și să te îndrume către locul surorii tale? Este gata.

Mergând mai departe cu noul Pixel 4 de la Google, funcția sa Live Caption poate oferi subtitrări la note audio, podcasturi și videoclipuri în timp real și, deoarece procesarea este pe dispozitiv, de asemenea, în modul avion. Deci, de exemplu, dacă un videoclip apare în feedul dvs. Twitter, puteți afla despre ce este vorba din subtitrările sale, fără a fi nevoie să activați sunetul. Subtitrări live nu funcționează încă cu muzică sau cu apeluri telefonice și video.

2. Eficiență crescută cu recunoașterea gesturilor

Cu modelele de pipeline de învățare automată pe dispozitiv, vă puteți antrena dispozitivul mobil să detecteze, să urmărească și să recunoască gesturile mâinilor și ale corpului. Camera dispozitivului dvs. înregistrează și stochează gesturile și mișcările dvs. ca date de imagine 3D. Algoritmii de învățare profundă ai rețelelor neuronale folosesc apoi această bibliotecă de gesturi pentru a identifica și descifra anumite gesturi statice și dinamice. Apoi le potrivesc în timp real cu intenția dvs. și execută comenzile dorite.

Telefoanele inteligente Google Pixel 4 vin cu cipul Soli care facilitează interacțiunea complexă și nonverbală cu telefonul dvs. Acest senzor radar în miniatură din partea de sus a telefonului alimentează tehnologia Motion Sense care vă poate detecta prezența și gesturile mâinii și corpului pentru a permite interacțiunile cu telefonul. Cu o mișcare a mâinii, fără să atingi măcar telefonul, îi poți spune să amâne, să dezactiveze alarma sau să navighezi la următoarea melodie din lista ta de redare.

3. Capacitățile imersive ale Realității Augmentate

Folosind platformele ARCore de la Google și ARKit de la Apple, dezvoltatorii pot construi aplicații de realitate augmentată care pot juxtapune obiecte și medii digitale cu setări din viața reală . Capacitățile imersive ale realității augmentate bazate pe telefon au un impact semnificativ asupra comerțului cu amănuntul, divertismentului, călătoriilor și altor industrii. Branduri precum Lacoste și Sephora permit acum clienților lor să încerce sau să previzualizeze produse cu aplicații de realitate augmentată, iar un număr tot mai mare de cumpărători preferă să verifice produsele de pe telefoanele lor înainte de a lua decizia de a le cumpăra.

Jocurile interactive de realitate augmentată, cum ar fi Pokemon, Ingress și Ghostbusters World, au primit o presă extinsă și un număr mare de urmăritori. Dacă doriți să vă găsiți drumul prin oraș, Google Maps Live View vă va oferi navigare în timp real.

4. Fotografii de calitate superioară

Calitatea înaltă a fotografiilor este un criteriu important pentru cumpărători atunci când selectează smartphone-uri, pe care le pot obține cu multe dintre cele mai recente modele. Acestea sunt echipate cu componente hardware – unități centrale de procesare (CPU), procesoare de semnal de imagine, algoritmi de imagine de învățare profundă și unități de procesare neuronală – care au catapultat smartphone-urile într-un domeniu complet diferit de camerele tradiționale atunci când vine vorba de fotografiere. Cu acestea, smartphone-urile pot arăta mai multă conștientizare la nivel de clasificare a pixelilor cu privire la ceea ce văd pentru a fotografia fotografii de înaltă definiție.

Telefoanele Google Pixel și iPhone-urile Apple folosesc mai multe camere și algoritmi de învățare automată complecși pentru a recunoaște oameni și obiecte, pentru a crea hărți de adâncime, pentru a uni fără probleme expuneri lungi și pentru a calcula echilibrul corect al culorilor .

Antrenând rețelele neuronale pe un set de date de imagini, algoritmii învață cum să răspundă la cerințele individuale de imagine și să retușeze fotografiile în timp real. Dezvoltat de cercetători de la MIT și Google, sistemul de retușare automată le permite fotografilor să aplice diferite stiluri unei imagini chiar înainte de a fotografia.

După ce o rețea convoluțională efectuează procesarea imaginii la rezoluție scăzută, o metodă de cartografiere cunoscută sub numele de transformare de culoare afină modifică culorile pixelilor imaginii. Rețeaua stochează aceste formule de transformare într-o grilă 3D care permite apoi o imagine de înaltă rezoluție. Totul are loc în câteva milisecunde.

Smartphone-urile depășesc acum și DSLR-urile în lumina slabă și fotografia de noapte. Încorporând rețele neuronale profunde și senzori, camerele smartphone-urilor pot captura imagini mai clare, cu mai multe culori decât le poate percepe ochiul uman.

Huawei, care a introdus fotografii lucrabile cu lumină scăzută cu P20 Pro, folosește filtre RYYB, senzori mari și procesare a imaginii AI în seria Mate 30 pentru a oferi fotografii de înaltă calitate, cu lumină scăzută, precum și videografie în lumină scăzută. Google Pixel 4 vine cu modul Night Sight care poate face fotografii în intervalul 0,3-3 lux, iar astrofotografie poate surprinde un cer întunecat și înstelat. Alături de un mod de noapte care se activează automat în întuneric, noul sistem Deep Fusion de la Apple se va adapta la nivelurile de lumină și va duce fotografia de pe iPhone la un nivel mai impresionant.

Chiar dacă nu înțelegeți fotografia, veți putea face fotografii grozave cu aceste smartphone-uri.

5. Securitate și confidențialitate sporite

Respectarea Reglementărilor generale privind protecția datelor (GDPR) și a Legii privind confidențialitatea consumatorilor din California (CCPA) a devenit mai ușoară cu învățarea automată pe dispozitiv. Acesta garantează securitatea datelor, deoarece nu este nevoie să încărcați date pentru biometrie, criptare sau subtitrări live pe un server sau un cloud pentru procesare.

Criptarea automată pe dispozitiv este o altă caracteristică utilă a smartphone-ului care vă protejează conținutul cu un PIN, parolă sau model și permite accesul la datele dvs. numai atunci când vă deblocați telefonul. Deci, dacă vă pierdeți dispozitivul sau este furat, șansa ca cineva să vă obțină datele este neglijabilă.

Funcția Face ID a iPhone-ului este un exemplu de experiență de smartphone mai sigură. Rețelele neuronale de pe dispozitiv din cipurile smartphone-urilor Apple procesează și stochează în siguranță datele faciale ale utilizatorului. Identificarea are loc pe dispozitivul dvs., astfel încât confidențialitatea și securitatea dvs. rămân nestingherite.

Tehnologia Face Unlock de la Google Pixel 4, facilitată de cipul Soli, utilizează maparea 3D a adâncimii IR pentru a vă crea modelele feței pentru recunoașterea feței și le stochează pe un cip de securitate Titan M6 de pe dispozitiv. Face Unlock funcționează bine cu aplicația 1Password pentru a oferi utilizatorilor securitate biometrică prin eliminarea șanselor de fraudă de identitate. Pentru a configura aplicația 1Password pe Pixel 4, trebuie doar să introduceți detaliile dvs. în Completarea automată și să utilizați Face Unlock pentru a vă conecta în loc de funcția Fingerprint Unlock.

6. Mai multă acuratețe în recunoașterea imaginii

Asociând învățarea automată de pe dispozitiv cu tehnologia de clasificare a imaginilor, puteți identifica și obține informații detaliate în timp real despre aproape orice întâlniți. Doriți să citiți un text în limbă străină? Scanați-l cu telefonul pentru a obține o traducere instantanee și precisă. Ți-a atras pofta o ținută sau o piesă de mobilier? Scanați-l pentru a obține informații despre preț și de unde îl puteți cumpăra. Există un fel de mâncare nou tentant în meniul unui restaurant? Puteți folosi telefonul pentru a afla ingredientele și informațiile nutriționale ale acestuia.

Facilitând recunoașterea imaginilor în timp real, aplicații precum Google Lens, Calorie Mama și Leafsnap sporesc gradul de utilizare și capacitatea de învățare a dispozitivelor mobile și îmbunătățesc experiența utilizatorului.

Învățare profundă pe dispozitive mobile: gânduri finale

Posibilitățile învățării automate pe dispozitiv sunt imense. Cu algoritmi inteligenți din ce în ce mai eficienți, rețele neuronale mai profunde și cipuri AI mai puternice, aplicațiile mobile de deep learning vor fi standard în sectorul bancar, retail, asistență medicală, analiza datelor, tehnologia informației, telecomunicații, aerospațial și diverse alte industrii.

Potrivit Verified Market Research, piața globală de deep learning este probabil să atingă 26,64 miliarde USD până în 2026, piața tehnologiei chipset-urilor de deep learning ajungând la 2,9 miliarde USD. Pe măsură ce capacitățile de învățare profundă continuă să se îmbunătățească, funcțiile de utilizare ale dispozitivelor mobile vor evolua odată cu și vor alimenta noi inovații.

Ești gata pentru următorul tău proiect software? Contactează-ne!