AI terimleri sözlüğü: GPT'yi, sinir ağlarını ve daha fazlasını anlama

Yayınlanan: 2023-06-01

Yapay zekanın olanakları ilginizi çekiyor ama tüm teknik jargonla başa çıkmakta zorlanıyor musunuz? AI sözlüğümüz, temel terim ve kavramları anlamanıza yardımcı olacaktır.

AI, her hafta ortaya çıkan yeni gelişmeler ve uygulamalarla sürekli gelişiyor ve genişliyor - ve yetişmesi gereken jargon miktarı da aynı hızla gelişiyor gibi geliyor.

Sonuç olarak, biraz bunaltıcı olabilir, bu yüzden yapay zekanın cesur yeni dünyasını daha iyi anlamanıza yardımcı olacak bir kavram ve terim listesi derledik.

AI ve otomasyon hakkında daha fazla içeriğimizin gelen kutunuza gönderilmesini istiyorsanız, düzenli bültenimize abone olmayı unutmayın.


yapay zeka (AI)

AI, görsel algı, konuşma tanıma, karar verme ve dil çevirisi gibi tipik olarak insan düzeyinde zeka gerektiren karmaşık görevleri yerine getirebilen akıllı makinelerin oluşturulmasını ifade eder. AI sistemleri, zaman içinde performanslarını öğrenmek ve geliştirmek için eğitilebilir ve bu da daha karmaşık görevleri daha yüksek verimlilik ve doğrulukla tamamlamalarına olanak tanır.

derin öğrenme

Derin öğrenme, sinir ağlarını birden fazla katmanla eğitme yöntemlerini ifade eder ve her katman farklı soyutlama düzeylerini temsil eder. Tipik olarak bu derin ağlar, veriler hakkında tahminler yapmak veya kararlar almak için büyük veri kümeleri üzerinde eğitilir.

Tek katmanlı bir sinir ağı, yaklaşık tahminler yapabilir, ancak ek katmanlar, tahminleri optimize etmek ve iyileştirmek için her biri önceki katmanın üzerine inşa ederek doğruluğu artırmaya yardımcı olabilir.

Derin öğrenme algoritmaları, görüntüler, ses ve metin gibi karmaşık ve yapılandırılmamış verileri işlemede oldukça etkilidir ve doğal dil işleme, konuşma tanıma ve yüz tanımayı içeren görüntü tanıma sistemleri gibi çok çeşitli uygulamalarda önemli ilerlemeler sağlamıştır. , sürücüsüz arabalar vb.

gömme

Doğal dil işleme (NLP) bağlamında bir yerleştirme, değişken uzunluktaki metni sabit uzunluktaki bir dizi sayıya dönüştürmek için kullanılan bir reçetedir. Genellikle bu sayı kümesi bir anlamda semantik anlamı koruyacaktır - örneğin, "köpek" ve "hayvan" için sayı kümesi matematiksel anlamda birbirine yakın olacaktır. Bu, metnin NLP algoritmaları tarafından verimli bir şekilde işlenmesini sağlar.

Kodlayıcı ve kod çözücü ağları

Bunlar, işi belirli bir girdiyi, diyelim ki metni, sabit uzunluktaki sayılar kümesi (kodlayıcı) gibi sayısal bir gösterime dönüştürmek ve ayrıca bu sayıları tekrar istenen bir çıktıya (kod çözücü) dönüştürmek olan derin sinir ağı mimarileri türleridir. ).

Makine çevirisi gibi doğal dil işleme görevlerinde çok yaygın olarak kullanılırlar.

İnce ayar

Önceden eğitilmiş bir modeli yeni bir veri kümesi üzerinde eğiterek belirli bir göreve uyarlama süreci. Bu model önce büyük, genel bir veri kümesinde ve ardından görevle ilgili daha küçük, daha spesifik bir veri kümesinde eğitilir; bu şekilde model, göreve özgü verilerde daha incelikli kalıpları tanımayı öğrenebilir ve bu da daha iyi performans sağlar.

İnce ayar, sıfırdan yenilerini eğitmek yerine genel modelleri kullanarak zamandan ve kaynaklardan tasarruf sağlayabilir ve aynı zamanda modelin küçük bir eğitim setinin özelliklerini son derece iyi öğrendiği, ancak bunu yapamadığı durumlarda fazla uydurma riskini azaltabilir. diğer verilere genellemek için.

Üretken rakip ağlar (GAN'lar)

İki sinir ağının birbiriyle rekabet ettiği denetimsiz makine öğreniminde kullanılan bir yapay zeka algoritması sınıfı. GAN'ların iki bölümü vardır: yeni makul veri örnekleri oluşturmak için eğitilmiş bir oluşturucu modeli ve örnekleri gerçek veri veya sahte (oluşturulmuş) veri olarak sınıflandırmaya çalışan bir ayırıcı model. İki model daha sonra, ayrımcı gerçek ile sahte arasındaki farkı söylemekte daha da kötüleşene ve sahte verileri gerçek olarak sınıflandırmaya başlayana kadar birbirleriyle rekabet eder.

Üretken AI

Büyük miktarda eğitim verisindeki kalıpları tanımlayarak ve orijinal verilere benzeyen benzersiz çıktılar üreterek metin, resim, video ve bilgisayar kodu dahil olmak üzere çok çeşitli içerik oluşturabilen bir yapay zeka türü. Kurallara dayalı diğer yapay zeka biçimlerinin aksine, üretken yapay zeka algoritmaları, açıkça programlanmamış veya önceden tanımlanmamış yeni çıktılar oluşturmak için derin öğrenme modelleri kullanır.

Üretken yapay zeka, insan yaratıcılığını taklit eden son derece gerçekçi ve karmaşık içerikler üretebilir ve bu da onu görüntü ve video oluşturma, doğal dil işleme ve müzik besteleme gibi çok çeşitli uygulamalar için değerli bir araç haline getirir. Örnekler, metin için ChatGPT ve görüntüler için DALL-E ve Midjourney gibi son atılımları içerir.

Üretken önceden eğitilmiş trafo (GPT)

Üretken önceden eğitilmiş transformatörler veya GPT'ler, insan benzeri metinler oluşturmak için büyük veri kümelerinde yüz milyarlarca parametre ile eğitilmiş bir sinir ağı modelleri ailesidir. Google araştırmacıları tarafından 2017'de tanıtılan dönüştürücü mimarisine dayalıdırlar. sonuç için daha önemli olarak algılar. Bir dizideki bir sonraki kelimeyi değil, uzun yanıtlar üretebilirler.

GPT model ailesi, bugüne kadarki en büyük ve en karmaşık dil modelleri olarak kabul edilir. Genellikle soruları yanıtlamak, metni özetlemek, kod oluşturmak, konuşmalar, hikayeler ve diğer birçok doğal dil işleme görevi için kullanılırlar, bu da onları sohbet botları ve sanal asistanlar gibi ürünler için çok uygun hale getirir.

Kasım 2022'de OpenAI, dünyayı kasıp kavuran ve herkesin onu denemek için akın ettiği GPT-3.5 üzerine inşa edilmiş bir sohbet robotu olan ChatGPT'yi piyasaya sürdü. Ve yutturmaca gerçek: GPT'deki daha yeni gelişmeler, teknolojiyi yalnızca müşteri hizmetleri gibi iş ortamları için uygun değil, aynı zamanda dönüşümsel hale getirdi.

halüsinasyonlar

Yapay zeka sisteminin, eğitim verileri ve mimarisindeki sınırlamalar nedeniyle gerçeklere dayalı olarak yanlış, yanlış veya anlamsız olan makul görünen bir yanıt sağladığı büyük dil modellerinde talihsiz ama iyi bilinen bir olgu.

Yaygın bir örnek, bir modele eğitim almadığı bir konuda olgusal bir soru sorulduğunda ve modelin "Bilmiyorum" demek yerine bir şeyler uydurması olabilir. Halüsinasyon sorununu hafifletmek, aktif bir araştırma alanıdır ve herhangi bir büyük dil modelinin (LLM) yanıtını değerlendirirken her zaman aklımızda tutmamız gereken bir şeydir.

Büyük dil modeli (LLM)

LLM'ler, insanlar tarafından yazılan metne benzer doğal dil metni üretebilen bir tür sinir ağıdır. Bu modeller genellikle kitaplardan, makalelerden, web sayfalarından vb. gelen yüz milyarlarca kelimeden oluşan büyük veri kümeleri üzerinde eğitilir ve yeni içerik oluşturmak veya tahmin etmek için kelimeler arasındaki karmaşık kalıpları ve ilişkileri anlamak için derin öğrenmeyi kullanır.

Geleneksel NLP algoritmaları tipik olarak yalnızca kelimelerin anlık bağlamına bakarken, LLM'ler bağlamı daha iyi anlamak için geniş metin alanlarını dikkate alır. OpenAI'nin GPT'si gibi modeller de dahil olmak üzere farklı LLM türleri vardır.

LLM aracıları (örn. AutoGPT, LangChain)

LLM'ler kendi başlarına metni girdi olarak alır ve çıktı olarak daha fazla metin sağlar. Aracılar, onlara insan müdahalesi olmadan kararlar alma, özerk olarak çalışma ve görevleri planlama ve gerçekleştirme yetkisi veren bir LLM üzerine inşa edilmiş sistemlerdir. Aracılar, üst düzey dil talimatlarını bunları gerçekleştirmek için gereken belirli eylemlere veya koda çevirmek için LLM'lerin gücünü kullanarak çalışır.

Ajanslara şu anda bir ilgi ve gelişme patlaması yaşanıyor. AutoGPT gibi araçlar, bir görev listesini girdi olarak alacak ve gerçekten sizin için görevleri deneyecek ve yapacak "görev listesi yapanlar" gibi heyecan verici uygulamalara olanak tanıyor.

Makine öğrenimi (ML)

Açıkça programlanmadan makinelerin belirli bir görevdeki performanslarını kademeli olarak iyileştirmelerini sağlayan algoritmaların ve istatistiksel modellerin geliştirilmesini içeren bir yapay zeka alt alanı. Başka bir deyişle, makine verilerden "öğrenir" ve daha fazla veri işledikçe, tahminlerde bulunma veya belirli görevleri yerine getirme konusunda daha iyi hale gelir.

Üç ana makine öğrenimi türü vardır: denetimli öğrenme, denetimsiz öğrenme ve takviyeli öğrenme.

  • Denetimli öğrenme, algoritmaları verileri sınıflandırmak veya sonuçları doğru bir şekilde tahmin etmek üzere eğitmek için tasarlanmış etiketli veri kümelerini kullanan bir makine öğrenimi yaklaşımıdır. Örneğin, bir dizi etiketli kedi ve köpek resmi sağlarsanız, bir model yeni, etiketlenmemiş kedi ve köpek resimlerini tahmin edebilir;
  • Denetimsiz öğrenme, önceden etiketler veya özel programlama olmadan ve minimum insan denetimiyle bir veri kümesinde algılanmayan kalıpları arar;
  • Takviyeli öğrenme, çevresinden gelen geri bildirime dayalı kararlar almak için bir modelin eğitilmesini içerir. Bir oyunu kazanmak veya bir görevi tamamlamak gibi bir ödül sinyalini en üst düzeye çıkaran eylemlerde bulunmayı öğrenir.

Doğal dil işleme (NLP)

NLP, insan dili ve bilgisayarlar arasındaki etkileşime odaklanan bir yapay zeka dalıdır. İnsan dilinin kural tabanlı modellemesini, bilgisayarların insan dilini işlemesini, anlamasını ve oluşturmasını sağlayan, tipik olarak büyük miktarda veri kullanılarak eğitilen istatistiksel, makine öğrenimi ve derin öğrenme modelleriyle birleştirir.

Uygulamaları, metin ve konuşma da dahil olmak üzere insan dilini analiz etmek, anlamak ve oluşturmak için tasarlanmıştır. Bazı yaygın NLP görevleri arasında dil çevirisi, duyarlılık analizi, konuşma tanıma, metin sınıflandırma, adlandırılmış varlık tanıma ve metin özetleme yer alır.

Nöral ağlar

Sinir ağları, 1944'te iki Chicago araştırmacısı Warren McCullough ve Walter Pitts tarafından önerilen ve insan beyninin yapısından sonra modellenen makine öğreniminin bir alt alanıdır. Tahminler veya kararlar vermek için verileri işleyen ve analiz eden birbirine bağlı düğümlerin veya nöronların katmanlarından oluşur: her katman, önceki katmandaki düğümlerden girdiler alır ve sonraki katmandaki düğümlere beslenen çıktılar üretir. Son katman, sonuçları verir.

Görüntü ve konuşma tanıma, doğal dil işleme ve tahmine dayalı modelleme dahil olmak üzere çok çeşitli uygulamalar için kullanılmıştır.

Hızlı mühendislik

İstem, anlamlı çıktılar elde etmek için bir LLM'ye girdi olarak sağladığınız metin veya kod olarak yazılmış bir dizi talimattır ve bir soru kadar basit olabilir. İstem mühendisliği, herhangi bir görev için mümkün olan en iyi çıktıyı üretecek etkili istemler oluşturma becerisidir (veya bazılarına göre sanattır). Büyük dil modellerinin (LLM'ler) nasıl çalıştığını, eğitildikleri verileri ve güçlü yanlarını ve sınırlamalarını anlamayı gerektirir.

İnsan geri bildiriminden (RLHF) pekiştirmeli öğrenme

RLHF, bir takviye öğrenme sisteminin ödül modelini eğitmek için açık insan geri bildirimi kullanma sürecini ifade eder. Bir LLM bağlamında, bu, LLM'nin çıktılarını sıralayan ve tercih ettikleri yanıtları seçen insanlar olabilir. insanlar Daha sonra ödül modeli, insan tercihleriyle daha uyumlu çıktılar üretmek için İBÖ'de ince ayar yapmak için kullanılır.

Bu tekniklerin, yeteneklerinde çığır açan ilerlemeler gören ChatGPT gibi LLM'lerin geliştirilmesinde oldukça etkili bir adım olduğu düşünülmektedir.

trafo

Transformatör, doğal dil ve zaman serileri gibi sıralı verilerin işlenmesini sağlayacak şekilde birleştirilen birden çok kodlayıcı ve kod çözücü bileşeninden oluşan bir tür derin sinir ağı mimarisidir.


Bunlar, AI'da karşılaşmanız muhtemel olan en yaygın terimlerden sadece birkaçıdır. Kuşkusuz, bunun gibi sözlükler sonsuza kadar devam eden bir proje olacak - teknoloji gelişmeye devam ettikçe, yeni terimler ve fikirler ortaya çıkmaya devam edecek. Ancak şimdilik bu kavramları anlayarak en son gelişmelere ayak uydurmanıza yardımcı olacak sağlam bir temel oluşturabilirsiniz.

Fin bekleme listesi