AWS kullanarak işletmenize Machine Learning çözümleri nasıl eklenir?
Yayınlanan: 2020-05-13Makine öğrenimi sürekli gelişiyor ve büyük veri bölümlerinin hızlı ve otomatik analizine izin verdiği için küresel ekonomide büyük bir rol oynuyor.
Amazon, makine öğrenimi teknolojisini programcılara daha da yakınlaştırmak için şu anda AWS platformunda 10'dan fazla makine öğrenimi ve yapay zeka hizmeti sunuyor. Bu hizmetlerle, işinizi bir üst seviyeye taşıyabilecek modelleri basit bir şekilde oluşturmaya başlayabilirsiniz.
Bu hizmetlerin çoğu tamamen yönetilir; bu, bu araçlar verilerle çalışmak için önceden eğitilmiş modellerden yararlandığından, bunları kullanmak için herhangi bir makine öğrenimi deneyimine ihtiyacınız olmadığı anlamına gelir. İş probleminize bağlı olarak, bilgisayarla görme, doğal dil işleme, öneriler ve tahmin gibi alanlarda önceden eğitilmiş makine öğrenimi hizmetlerinden birini seçebilirsiniz. Aşağıdaki grafik, aşamaların her birinde kullanabileceğiniz AWS araçlarıyla birlikte bir Makine Öğrenimi çözümü iş akışını gösterir.

AWS ile iş dünyasına Machine Learning nasıl uygulanır?
Birincisi: Verilerin Toplanması
ML çözümlerinin oluşturulmasında en önemli unsur veridir. 3 tür veri vardır: yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış.
- Yapılandırılmış verilerin öğeleri adreslenebilir ve ilişkisel bir veritabanında saklanabilir. Bu tür veriler önceden tanımlanmış bir şemaya sahiptir. Yapılandırılmış verilere bir örnek, sayısal ve dize (metin) verileri içeren ilişkisel bir veritabanıdır.
- Yarı Yapılandırılmış veri kümeleri ilişkisel veritabanlarında bulunmaz, ancak yine de analiz edilmelerini kolaylaştıran bazı önceden tanımlanmış öğelere (şema) sahiptir. Yarı yapılandırılmış veri dosyası türlerine örnek olarak XML, HTML, RDF veya JSON verilebilir.
- Yapılandırılmamış veriler diğer her şeydir. Bu veri türünün önceden tanımlanmış bir yapısı yoktur ve genellikle bir dizi dosya olarak depolanırlar. En popüler yapılandırılmamış veri örnekleri metin belgeleri, fotoğraflar, video ve ses dosyaları ve uygulama günlükleridir.
Veri Yükleme – Kinesis nedir?
AWS Kinesis hizmeti, web ve mobil uygulamalar gibi çeşitli kaynaklardan sürekli olarak oluşturulabilen verileri alır. Gigabaytlarca veriyi çok hızlı bir şekilde yakalayabilen gerçek zamanlı bir veri akışı hizmetidir. Kinesis aşağıdaki araçları sunar:
- Kinesis Video Streaming – cihazlardan AWS'ye video akışı yapmanıza yardımcı olabilecek bir araç
- Kinesis Data Streaming – BT günlükleri, web sitesi tıklamaları veya finansal işlemler gibi verileri toplamanıza yardımcı olabilecek bir araç
- Kinesis Data Firehose – akış verilerini veri depolarına (örn. S3, Redshift) veya analiz araçlarına yüklemek için bir araç
- Kinesis Data Analytics – SQL veya Java ile gerçek zamanlı olarak akış verilerini işleyen bir araç
Veri yükleme – Tutkal nedir?
Veri yüklemeye yardımcı olabilecek başka bir AWS hizmeti, Apache Spark tarafından yönetilen Glue'dur . Analitik için kullanılmadan önce verileri hazırlamak için kullanılabilen bir ayıklama, dönüştürme ve yükleme aracıdır (ETL). Glue hem yapılandırılmış hem de yarı yapılandırılmış verilerle çalışabilir.
Glue'nun öğeleri Veri Kataloğu, ETL motoru ve bir zamanlayıcıdır. Tutkal Veri Kataloğu, aracın en önemli parçasıdır. Veri kaynakları arasında dolaşan ve şemalarını algılayan tarayıcılar tarafından otomatik olarak keşfedilen, verilen verilerle ilgili meta verileri kaydeder.
ETL motorları, programlama yapmayan kullanıcılar için ETL sürecinde kullanılmak üzere Python ve Scala kodu üretebilir. Ayrıca kullanıcı tarafından sağlanan bir kod ile verileri işleyebilir. Zamanlayıcı işleri izleyebilir, görevleri çalıştırabilir ve bazı olaylara göre (örneğin her Pazartesi belirli bir saatte veya başka bir görev tamamlandığında veya başarısız olduğunda) bunları tetikleyebilir.
İkincisi: Doğru Makine Öğrenimi Araçlarını Seçme
İhtiyacımız olan verileri topladıktan sonra ML çözümlerimizi oluşturmaya başlayabiliriz. AWS, çeşitli türlerdeki verileri işleyebilen birkaç Makine Öğrenimi Aracı sunar.
Şimdi bu araçların her birine bir göz atalım ve iş dünyasında olası ana uygulama alanlarını sunalım .
SageMaker nedir?
SageMaker , en çok makine öğrenimi geliştiricileri ve veri bilimcileri için kullanışlıdır. Bu hizmet, makine öğrenimi modellerinin konseptten üretime minimum çabayla alınmasına yardımcı olan eksiksiz bir çözümdür. Amazon SageMaker, verileri etiketlemeye, modelleri oluşturmaya, optimize etmeye, eğitmeye, test etmeye ve dağıtmaya yardımcı olabilecek zengin bir araç setine (Ground Truth, Notebooks, Experiments, Debugger, Model Monitor, Neo) sahiptir.
Belirli bir problem için doğru algoritmayı manuel olarak bulmak, genellikle saatlerce eğitim ve test gerektirir. SageMaker, eldeki durum için en iyi ML modelini otomatik olarak bulmak için önceden eğitilmiş 50 farklı ML modelini kullanan bir AutoPilot seçeneğine sahiptir. Geliştiriciler, temel bir modeli hızlı bir şekilde bulmak için bu çözümü kullanabilir.
Kişiselleştirmek nedir?
Kişiselleştirme , öneri sistemleri oluşturmaya yardımcı olan bir makine öğrenimi hizmetidir. Kişiselleştirme, uygulamalardan, örneğin tıklamalar, sayfa görünümleri, satın almalar gibi etkinlik akışlarını işleyebilir ve bunları kişiselleştirilmiş öneriler oluşturmak için kullanabilir. Kullanıcılarınız hakkında yaş veya coğrafi konum gibi ek bilgileri de kullanabilirsiniz. Uygulamanızda öneri sonuçlarının gösterilmesi, kısa API çağrıları ile basitleştirilebilir. Kişiselleştirme'deki makine öğrenimi teknolojisi, Amazon.com tarafından yıllarca kullanılmak üzere geliştirilmiştir.

Anlamak nedir?
Anlamak , yapılandırılmamış metin verilerinden değerli içgörüler çıkarmak için makine öğrenimini kullanan bir Doğal Dil İşleme (NLP) hizmetidir. Bu hizmet, metnin temel özelliklerini algılamak için duygu analizi, konuşma parçası çıkarma ve simgeleştirme uygular. Anlamak, belirli bir metnin ne kadar olumlu veya olumsuz olduğunu anlamada yardımcı olabilir.
Comprehend'in ek bir aracı vardır: Amazon Comprehend Medical, özellikle tıp endüstrisi için. Amazon Comprehend Medical, tıbbi belgeleri (hastaların tıbbi kayıtları, klinik notlar gibi) analiz edebilir ve ilaçlar, dozlar ve sıklıklarla ilgili bilgileri çıkarabilir. Anlamak, tamamen yönetilen bir hizmettir.
Tahmin nedir?
Tahmin , zaman serisi tahmin modelleri oluşturmak için makine öğrenimini kullanır. Tahmine dayalı modeller oluşturmak için geçmiş zaman serisi verilerini (tahminleri etkileyebileceğine inandığınız) ek değişkenlerle birleştirebilir. Bu Amazon çözümü, hisse senedi fiyatları veya müşteri ürün talebi gibi değerleri tahmin etmek için geçerlidir. Tahmin ayrıca tam olarak yönetilen bir hizmettir ve iş gereksinimlerine göre ölçeklendirilebilir.
Lex nedir?
Lex , konuşmayı metne dönüştürmek için otomatik konuşma tanımayı (ASR) ve metnin amacını tanımak için Doğal Dil Anlama'yı (NLU) kullanır. Bu çözüm, kullanıcının konuşma botları oluşturmasını sağlar.
Örneğin, müşteri sorgularını otomatik olarak yanıtlayacak olan manuel müşteri desteğinin yerine Lex'i kullanabilirsiniz. Amazon Lex, Amazon Alexa (Amazon'un sanal asistanı AI) ile aynı derin öğrenme teknolojisini kullanır.
Polly nedir?
Polly , metni gerçeğe yakın konuşmaya dönüştürmek için derin öğrenme algoritmalarını kullanan bir bulut hizmetidir. Şu anda Japonca, Çince, Korece ve Arapça dahil olmak üzere 29 dilde 60 erkek ve kadın sesini desteklemektedir. Polly ayrıca zamanı, tarihleri, birimleri, kesirleri ve kısaltmaları da işleyebilir. Bu çözüm, kullanıcının konuşabilen uygulamalar oluşturmasını sağlar.
Dolandırıcılık Dedektörü Nedir?
Fraud Detector , ödeme sahtekarlıkları veya sahte hesaplar gibi dolandırıcılık amaçlı çevrimiçi etkinliklerin belirlenmesine yardımcı olabilecek bir AWS hizmetidir. Bu hizmet tamamen yönetilir, böylece sadece birkaç tıklamayla bir dolandırıcılık tespit modeli oluşturulabilir.
Textract nedir?
Textract , taranan belgelerdeki verileri otomatik olarak okuyabilen bir hizmettir. Textract, milyonlarca sayfayı birkaç saat içinde işleyebilir ve belge iş akışlarının otomatikleştirilmesine yardımcı olabilir. Bu hizmet, kredi başvuruları veya tıbbi belgeler gibi belgelerin işlenmesinde faydalıdır.
Çevir nedir?
Translate , dilden dile metin çevirisi yapmak için hizmet verilen bir AWS makine öğrenimidir. Geleneksel istatistiksel algoritmalara kıyasla daha doğru ve daha doğal sesli çeviri sağlamak için derin öğrenme modellerini kullanır. Translate, 54 dili (örneğin Afrikanca, Bulgarca, Estonca dahil) ve 2.804 dil çiftini destekler.
Tanımak nedir?
Tanıma , görüntülerden ve filmlerden nesneleri, insanları ve metinleri tanıyabilen bir bilgisayarla görme hizmetidir. Tanıma, yüzleri tanımlayıp karşılaştırabilir, onları analiz edebilir ve ağız, burun veya gözler gibi bazı yüz özelliklerini tanımlayabilir.
Rekognition, yüz görüntülerinde mutluluk, üzüntü veya şaşkınlık gibi duyguları otomatik olarak algılayan bir modüle sahiptir. Ayrıca, gerçek zamanlı görüntüyü depolanan referans görüntüyle karşılaştırarak kullanıcının kimliğini onaylayacak olan kullanıcı yüzü doğrulaması da gerçekleştirebilir.
Üçüncüsü: Makine Öğrenimi Çözümlerini Dağıtma
Modelleri dağıtmanın en yaygın olarak kullanılan yöntemi, iki yoldan biriyle kullanabileceğiniz SageMaker Hizmeti'dir:
- HTTPS uç noktalarını ayarlamak için SageMaker Barındırma Hizmetini kullanma . Bu çözümde, istemci uygulamaları, dağıtılan modellerden tahminler almak için HTTPS uç noktalarına istek gönderir. Bu çözümü kullanmak için, ona Docker imajınızı sağlamalısınız. Birden çok modeli dağıtmanız gerekiyorsa, çok modelli uç noktaları da kullanabilirsiniz.
- Tüm bir veri kümesi için tahminler almanıza yardımcı olan SageMaker Toplu Dönüşümü kullanma . Batch Transform kullanarak bir modeli dağıtmak için modeli, veri kümelerini ve tahminleri depolamak için bir S3 klasörüne ihtiyacınız vardır.
Dağıtım alternatifi, AWS IoT Greengrass kullanmaktır. Bu hizmet, AWS'yi nesnelerin interneti (IoT) cihazlarına genişletir. Cihazlar bu hizmeti kullanarak verileri toplayabilir, filtreleyebilir, işleyebilir ve ayrıca Lambda işlevlerini, Docker kapsayıcılarını çalıştırabilir ve bulut bağlantısı olmadan bile ML modellerine dayalı tahminler yürütebilir. Greengrass, internete bağlandığında tüm verileri bulut hizmetleriyle senkronize eder.
Özet
Gördüğünüz gibi Amazon Web Service, işletmeniz için etkili makine öğrenimi çözümleri oluşturmanıza yardımcı olabilecek zengin bir araç seti sunar. ML AWS araçlarıyla uygulamalarınıza yüz algılama, sohbet robotları, konuşma tanıma, sosyal medya içeriğinin duygu analizi gibi yeni özellikler ekleyebilirsiniz. AWS, birkaç ayda bir yeni kullanım örneklerine dayalı olarak yeni makine öğrenimi hizmetleri ekler ve bu da onu yapay zeka çözümleri oluşturmak için en hızlı büyüyen platformlardan biri yapar.
Miquido ile geleceğe yönelik bir makine öğrenimi çözümü geliştirin!