مسرد مصطلحات الذكاء الاصطناعي: فهم GPT والشبكات العصبية والمزيد
نشرت: 2023-06-01هل أنت مفتون بإمكانيات الذكاء الاصطناعي ولكنك تجد صعوبة في التعامل مع كل المصطلحات التقنية؟ سيساعدك مسرد مصطلحات الذكاء الاصطناعي الخاص بنا على فهم المصطلحات والمفاهيم الأساسية.
يتطور الذكاء الاصطناعي ويتوسع باستمرار ، مع ظهور تطورات وتطبيقات جديدة كل أسبوع - ويبدو أن مقدار المصطلحات التي يجب مواكبة تطورها يتطور بنفس السرعة.
بشكل عام ، يمكن أن يكون الأمر مربكًا بعض الشيء ، لذلك قمنا بتجميع قائمة من المفاهيم والمصطلحات لمساعدتك على فهم أفضل لعالم الذكاء الاصطناعي الجديد الشجاع.
إذا كنت ترغب في الحصول على المزيد من المحتوى الخاص بنا حول الذكاء الاصطناعي والأتمتة في صندوق الوارد الخاص بك ، فتأكد من الاشتراك في النشرة الإخبارية العادية لدينا.
الذكاء الاصطناعي (AI)
يشير الذكاء الاصطناعي إلى إنشاء آلات ذكية قادرة على أداء المهام المعقدة التي تتطلب عادةً ذكاءً على مستوى الإنسان ، مثل الإدراك البصري والتعرف على الكلام واتخاذ القرار وترجمة اللغة. يمكن تدريب أنظمة الذكاء الاصطناعي على التعلم وتحسين أدائها بمرور الوقت ، مما يسمح لها بإكمال مهام أكثر تعقيدًا بكفاءة ودقة أكبر.
تعلم عميق
يشير التعلم العميق إلى طرق تدريب الشبكات العصبية بأكثر من طبقة واحدة ، حيث تمثل كل طبقة مستويات مختلفة من التجريد. عادةً ما يتم تدريب هذه الشبكات العميقة على مجموعات بيانات كبيرة لعمل تنبؤات أو قرارات بشأن البيانات.
قد تكون الشبكة العصبية ذات الطبقة الواحدة قادرة على عمل تنبؤات تقريبية ، لكن الطبقات الإضافية يمكن أن تساعد في تحسين الدقة - كل بناء على الطبقة السابقة لتحسين التنبؤات وصقلها.
تعد خوارزميات التعلم العميق فعالة للغاية في معالجة البيانات المعقدة وغير المهيكلة ، مثل الصور والصوت والنص ، وقد أتاحت تحقيق تقدم كبير في مجموعة واسعة من التطبيقات مثل معالجة اللغة الطبيعية والتعرف على الكلام وأنظمة التعرف على الصور التي تشمل التعرف على الوجه ، سيارات ذاتية القيادة ، إلخ.
التضمين
يعتبر التضمين في سياق معالجة اللغة الطبيعية (NLP) وصفة لتحويل النص ذي الطول المتغير إلى مجموعة من الأرقام ذات الطول الثابت. عادةً ما تحافظ هذه المجموعة من الأرقام على المعنى الدلالي بمعنى ما - على سبيل المثال ، ستكون مجموعة الأرقام لكل من "كلب" و "حيوان" قريبة من بعضها البعض بالمعنى الرياضي. يتيح ذلك معالجة النص بكفاءة بواسطة خوارزميات البرمجة اللغوية العصبية.
شبكات التشفير وفك التشفير
هذه هي أنواع معماريات الشبكة العصبية العميقة التي تتمثل مهمتها في تحويل إدخال معين ، على سبيل المثال نص ، إلى تمثيل رقمي ، مثل مجموعة أرقام ذات طول ثابت (جهاز تشفير) ، وكذلك تحويل هذه الأرقام مرة أخرى إلى الإخراج المطلوب (وحدة فك التشفير) ).
يتم استخدامها بشكل شائع في مهام معالجة اللغة الطبيعية مثل الترجمة الآلية.
الكون المثالى
عملية تكييف نموذج مدرب مسبقًا لمهمة محددة من خلال تدريبه على مجموعة بيانات جديدة. يتم تدريب هذا النموذج أولاً على مجموعة بيانات عامة كبيرة ثم على مجموعة بيانات أصغر وأكثر تحديدًا تتعلق بالمهمة - وبهذه الطريقة ، يمكن للنموذج التعرف على أنماط أكثر دقة في البيانات الخاصة بالمهمة ، مما يؤدي إلى أداء أفضل.
يمكن أن يوفر الضبط الدقيق الوقت والموارد من خلال استخدام نماذج عامة بدلاً من تدريب نماذج جديدة من البداية ، ويمكن أن يقلل أيضًا من مخاطر التجهيز الزائد ، حيث تعلم النموذج ميزات مجموعة التدريب الصغيرة بشكل جيد للغاية ، ولكنه غير قادر على ذلك. للتعميم على البيانات الأخرى.
شبكات الخصومة التوليدية (GANs)
فئة من خوارزميات الذكاء الاصطناعي المستخدمة في التعلم الآلي غير الخاضع للإشراف حيث تتنافس شبكتان عصبيتان مع بعضهما البعض. تتكون شبكات GAN من جزأين: نموذج مولد تم تدريبه لتوليد أمثلة جديدة من البيانات المعقولة ، ونموذج مميِّز يحاول تصنيف الأمثلة إما على أنها بيانات حقيقية أو بيانات (مُنشأة) مزيفة. ثم يتنافس النموذجان ضد بعضهما البعض حتى يزداد التمييز سوءًا في معرفة الفرق بين الحقيقي والمزيف ويبدأ في تصنيف البيانات المزيفة على أنها حقيقية.
الذكاء الاصطناعي التوليدي
نوع من الذكاء الاصطناعي يمكنه إنشاء مجموعة متنوعة من المحتوى - بما في ذلك النصوص والصور والفيديو ورموز الكمبيوتر - من خلال تحديد أنماط بكميات كبيرة من بيانات التدريب وإنشاء مخرجات فريدة تشبه البيانات الأصلية. على عكس الأشكال الأخرى للذكاء الاصطناعي التي تستند إلى القواعد ، تستخدم خوارزميات الذكاء الاصطناعي التوليدية نماذج التعلم العميق لتوليد مخرجات جديدة غير مبرمجة أو محددة مسبقًا.
الذكاء الاصطناعي العام قادر على إنتاج محتوى واقعي ومعقد للغاية يحاكي الإبداع البشري ، مما يجعله أداة قيمة لمجموعة واسعة من التطبيقات ، مثل إنشاء الصور والفيديو ، ومعالجة اللغة الطبيعية ، والتأليف الموسيقي. تشمل الأمثلة الاختراقات الحديثة مثل ChatGPT للنص و DALL-E و Midjourney للصور.
المحولات التوليدية المدربة مسبقًا (GPT)
المحولات التوليدية المدربة مسبقًا ، أو GPTs ، هي عائلة من نماذج الشبكات العصبية المدربة بمئات المليارات من المعلمات على مجموعات بيانات ضخمة لإنشاء نص يشبه الإنسان. وهي تستند إلى بنية المحولات ، التي قدمها باحثو Google في عام 2017 ، والتي تسمح للنماذج بفهم أفضل وتطبيق السياق الذي يتم فيه استخدام الكلمات والتعبيرات والانتقاء بشكل انتقائي لأجزاء مختلفة من الإدخال - مع التركيز على الكلمات أو العبارات ذات الصلة التي تعتبرها أكثر أهمية للنتيجة. إنهم قادرون على توليد ردود طويلة ، وليس فقط الكلمة التالية في تسلسل.
تعتبر عائلة نماذج GPT أكبر نماذج اللغة وأكثرها تعقيدًا حتى الآن. تُستخدم عادةً للإجابة على الأسئلة وتلخيص النص وإنشاء التعليمات البرمجية والمحادثات والقصص والعديد من مهام معالجة اللغة الطبيعية الأخرى ، مما يجعلها مناسبة تمامًا لمنتجات مثل روبوتات المحادثة والمساعدين الافتراضيين.
في تشرين الثاني (نوفمبر) 2022 ، أصدرت شركة OpenAI ChatGPT ، وهو روبوت محادثة مبني على قمة GPT-3.5 ، والذي أحدث ثورة في العالم ، حيث توافد الجميع لتجربته. وهذا الضجيج حقيقي: التطورات الحديثة في GPT جعلت التكنولوجيا ليست مجدية فقط لإعدادات العمل مثل خدمة العملاء ، ولكن في الواقع تحويلية.
الهلوسة
ظاهرة مؤسفة ولكنها معروفة في نماذج اللغات الكبيرة ، حيث يوفر نظام الذكاء الاصطناعي إجابة معقولة المظهر غير صحيحة أو غير دقيقة أو غير منطقية بسبب القيود في بيانات التدريب وبنيته.

والمثال الشائع هو عندما يُسأل نموذج ما سؤالًا واقعيًا عن شيء لم يتم تدريبه عليه وبدلاً من قول "لا أعرف" فإنه سيصنع شيئًا ما. يعد التخفيف من مشكلة الهلوسة مجالًا نشطًا للبحث وهو أمر يجب أن نضعه في الاعتبار دائمًا عند تقييم استجابة أي نموذج لغوي كبير (LLM).
نموذج لغة كبير (LLM)
LLMs هي نوع من الشبكات العصبية القادرة على توليد نص بلغة طبيعية مشابه للنص المكتوب من قبل البشر. يتم تدريب هذه النماذج عادةً على مجموعات بيانات ضخمة من مئات المليارات من الكلمات من الكتب والمقالات وصفحات الويب وما إلى ذلك ، وتستخدم التعلم العميق لفهم الأنماط المعقدة والعلاقات بين الكلمات لإنشاء محتوى جديد أو التنبؤ به.
في حين أن خوارزميات البرمجة اللغوية العصبية التقليدية عادةً ما تنظر فقط إلى السياق المباشر للكلمات ، فإن LLMs تعتبر مساحات كبيرة من النص لفهم السياق بشكل أفضل. هناك أنواع مختلفة من LLM ، بما في ذلك نماذج مثل GPT الخاصة بـ OpenAI.
وكلاء LLM (مثل AutoGPT و LangChain)
من تلقاء نفسها ، تأخذ LLM النص كمدخل وتوفر المزيد من النص كإخراج. الوكلاء هم أنظمة مبنية على LLM تمنحهم وكالة لاتخاذ القرارات ، والعمل بشكل مستقل ، والتخطيط للمهام وتنفيذها دون تدخل بشري. يعمل الوكلاء باستخدام قوة LLMs لترجمة تعليمات اللغة عالية المستوى إلى الإجراءات المحددة أو التعليمات البرمجية المطلوبة لأدائها.
يوجد حاليًا انفجار في الاهتمام والتطور في الوكلاء. تعمل أدوات مثل AutoGPT على تمكين تطبيقات مثيرة مثل "القائمون على قائمة المهام" والتي ستأخذ قائمة مهام كمدخلات وتحاول بالفعل القيام بالمهام نيابة عنك.
تعلم الآلة (ML)
حقل فرعي من الذكاء الاصطناعي يتضمن تطوير الخوارزميات والنماذج الإحصائية التي تمكن الآلات من تحسين أدائها تدريجيًا في مهمة محددة دون أن تتم برمجتها بشكل صريح للقيام بذلك. بمعنى آخر ، "يتعلم" الجهاز من البيانات ، ومع معالجة المزيد من البيانات ، يصبح أفضل في عمل التنبؤات أو أداء مهام محددة.
هناك ثلاثة أنواع رئيسية من التعلم الآلي: التعلم تحت الإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز.
- التعلم الخاضع للإشراف هو نهج التعلم الآلي الذي يستخدم مجموعات البيانات المصممة لتدريب الخوارزميات على تصنيف البيانات أو التنبؤ بالنتائج بدقة. على سبيل المثال ، إذا قدمت مجموعة من الصور المصنفة للقطط والكلاب ، فسيكون النموذج قادرًا على التنبؤ بالصور الجديدة غير الموسومة للقطط والكلاب ؛
- يبحث التعلم غير الخاضع للإشراف عن أنماط غير مكتشفة في مجموعة بيانات بدون تسميات موجودة مسبقًا أو برمجة محددة وبأقل إشراف بشري ؛
- يتضمن التعلم المعزز تدريب نموذج لاتخاذ القرارات بناءً على التغذية الراجعة من بيئته. يتعلم اتخاذ الإجراءات التي تزيد من إشارة المكافأة ، مثل الفوز بلعبة أو إكمال مهمة.
معالجة اللغة الطبيعية (NLP)
البرمجة اللغوية العصبية هو فرع من فروع الذكاء الاصطناعي يركز على التفاعل بين لغة الإنسان وأجهزة الكمبيوتر. فهو يجمع بين النمذجة القائمة على القواعد للغة البشرية والنماذج الإحصائية والتعلم الآلي ونماذج التعلم العميق ، وعادة ما يتم تدريبها باستخدام كميات كبيرة من البيانات ، والتي تمكن أجهزة الكمبيوتر من معالجة وفهم وتوليد اللغة البشرية.
تم تصميم تطبيقاته لتحليل وفهم وتوليد اللغة البشرية ، بما في ذلك النص والكلام. تتضمن بعض مهام البرمجة اللغوية العصبية الشائعة ترجمة اللغة ، وتحليل المشاعر ، والتعرف على الكلام ، وتصنيف النص ، والتعرف على الكيانات المسماة ، وتلخيص النص.
الشبكات العصبية
الشبكات العصبية هي حقل فرعي من التعلم الآلي اقترحه عام 1944 باحثان من شيكاغو ، وارين ماكولوغ ووالتر بيتس ، على غرار بنية الدماغ البشري. يتكون من طبقات من العقد أو الخلايا العصبية المترابطة التي تعالج البيانات وتحللها لعمل تنبؤات أو قرارات: تتلقى كل طبقة مدخلات من العقد في الطبقة السابقة وتنتج مخرجات يتم تغذيتها للعقد في الطبقة التالية. الطبقة الأخيرة ، إذن ، تنتج النتائج.
لقد تم استخدامها لمجموعة واسعة من التطبيقات ، بما في ذلك التعرف على الصور والكلام ومعالجة اللغة الطبيعية والنمذجة التنبؤية.
الهندسة السريعة
الموجه عبارة عن مجموعة من التعليمات المكتوبة كنص أو رمز تقدمه كمدخل إلى LLM لتؤدي إلى مخرجات ذات مغزى ، ويمكن أن تكون بسيطة مثل سؤال. الهندسة السريعة هي المهارة (أو الفن ، كما قد يجادل البعض) لإنشاء مطالبات فعالة من شأنها أن تنتج أفضل نتيجة ممكنة لأي مهمة معينة. يتطلب فهم كيفية عمل نماذج اللغة الكبيرة (LLMs) ، والبيانات التي تم تدريبهم عليها ، ونقاط القوة والقيود الخاصة بهم.
التعلم المعزز من التغذية الراجعة البشرية (RLHF)
يشير RLHF إلى عملية استخدام التغذية الراجعة البشرية الصريحة لتدريب نموذج المكافأة لنظام التعلم المعزز. في سياق LLM ، قد يكون هذا هو ترتيب البشر لمخرجات LLM واختيار الاستجابات التي يفضلونها - ثم يتم استخدامها لتدريب شبكة عصبية أخرى ، تسمى نموذج المكافأة ، والتي يمكنها التنبؤ بما إذا كانت استجابة معينة ستكون مرغوبة لـ البشر. ثم يتم استخدام نموذج المكافأة لضبط LMM لإنتاج مخرجات تتماشى بشكل أفضل مع التفضيلات البشرية.
يُعتقد أن هذه التقنيات خطوة ذات تأثير كبير في تطوير LLMs مثل ChatGPT التي شهدت تطورات هائلة في قدراتها.
محول
المحول هو نوع من بنية الشبكة العصبية العميقة التي تتكون من مكونات متعددة للتشفير وفك التشفير يتم دمجها بطريقة تمكن من معالجة البيانات المتسلسلة مثل اللغة الطبيعية والسلاسل الزمنية.
هذه ليست سوى عدد قليل من المصطلحات الأكثر شيوعًا في الذكاء الاصطناعي والتي من المحتمل أن تواجهها. مما لا شك فيه أن مثل هذه المسارد ستكون إلى الأبد مشروعًا مستمرًا - مع استمرار تطور التكنولوجيا ، ستستمر المصطلحات والأفكار الجديدة في الظهور. لكن في الوقت الحالي ، من خلال فهم هذه المفاهيم ، يمكنك بناء أساس متين يساعدك على مواكبة أحدث التطورات.