อภิธานศัพท์ของคำศัพท์ AI: ทำความเข้าใจกับ GPT, โครงข่ายประสาทเทียม และอื่นๆ

เผยแพร่แล้ว: 2023-06-01

คุณรู้สึกทึ่งกับความเป็นไปได้ของ AI แต่พบว่ามันยากที่จะเข้าใจศัพท์แสงทางเทคนิคทั้งหมดหรือไม่? อภิธานศัพท์ AI ของเราจะช่วยให้คุณเข้าใจคำศัพท์และแนวคิดหลัก

AI มีการพัฒนาและขยายตัวอย่างต่อเนื่อง โดยมีการพัฒนาและแอปพลิเคชันใหม่ๆ เกิดขึ้นทุกสัปดาห์ และรู้สึกเหมือนว่าจำนวนศัพท์แสงที่ต้องตามให้ทันนั้นกำลังพัฒนาอย่างรวดเร็วพอๆ กัน

สรุปแล้ว อาจเป็นเรื่องที่หนักใจเล็กน้อย เราจึงได้รวบรวมรายการแนวคิดและคำศัพท์เพื่อช่วยให้คุณเข้าใจโลกใบใหม่ที่กล้าหาญของปัญญาประดิษฐ์ได้ดียิ่งขึ้น

หากคุณต้องการรับเนื้อหาเพิ่มเติมเกี่ยวกับ AI และระบบอัตโนมัติที่ส่งถึงกล่องจดหมายของคุณ อย่าลืมสมัครรับจดหมายข่าวของเรา


ปัญญาประดิษฐ์ (เอไอ)

AI หมายถึงการสร้างเครื่องจักรอัจฉริยะที่สามารถทำงานที่ซับซ้อนซึ่งโดยทั่วไปต้องใช้ความฉลาดระดับมนุษย์ เช่น การรับรู้ภาพ การรู้จำคำพูด การตัดสินใจ และการแปลภาษา ระบบ AI สามารถฝึกฝนเพื่อเรียนรู้และปรับปรุงประสิทธิภาพเมื่อเวลาผ่านไป ทำให้สามารถทำงานที่ซับซ้อนมากขึ้นได้อย่างมีประสิทธิภาพและแม่นยำยิ่งขึ้น

การเรียนรู้อย่างลึกซึ้ง

การเรียนรู้เชิงลึกหมายถึงวิธีการฝึกโครงข่ายประสาทเทียมที่มีมากกว่าหนึ่งเลเยอร์ โดยแต่ละเลเยอร์จะแสดงถึงระดับนามธรรมที่แตกต่างกัน โดยทั่วไปแล้ว เครือข่ายเชิงลึกเหล่านี้จะได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่เพื่อทำการคาดการณ์หรือตัดสินใจเกี่ยวกับข้อมูล

โครงข่ายประสาทเทียมที่มีเลเยอร์เดียวอาจสามารถคาดการณ์ได้โดยประมาณ แต่เลเยอร์เพิ่มเติมสามารถช่วยปรับปรุงความแม่นยำได้ โดยแต่ละเลเยอร์จะสร้างขึ้นจากเลเยอร์ก่อนหน้าเพื่อเพิ่มประสิทธิภาพและปรับแต่งการคาดการณ์

อัลกอริธึมการเรียนรู้เชิงลึกมีประสิทธิภาพสูงในการประมวลผลข้อมูลที่ซับซ้อนและไม่มีโครงสร้าง เช่น รูปภาพ เสียง และข้อความ และช่วยให้เกิดความก้าวหน้าที่สำคัญในแอปพลิเคชันที่หลากหลาย เช่น การประมวลผลภาษาธรรมชาติ การรู้จำเสียง และระบบจดจำรูปภาพที่รวมถึงการจดจำใบหน้า , รถยนต์ไร้คนขับ ฯลฯ

การฝัง

การฝังในบริบทของการประมวลผลภาษาธรรมชาติ (NLP) เป็นสูตรสำหรับเปลี่ยนข้อความที่มีความยาวผันแปรเป็นชุดของตัวเลขที่มีความยาวคงที่ โดยปกติแล้วชุดตัวเลขนี้จะรักษาความหมายเชิงความหมายในบางแง่ เช่น ชุดตัวเลขสำหรับ "สุนัข" และ "สัตว์" จะอยู่ใกล้กันในแง่คณิตศาสตร์ ทำให้สามารถประมวลผลข้อความได้อย่างมีประสิทธิภาพด้วยอัลกอริธึม NLP

เครือข่ายตัวเข้ารหัสและตัวถอดรหัส

เหล่านี้คือประเภทของสถาปัตยกรรมโครงข่ายประสาทเทียมเชิงลึกซึ่งมีหน้าที่แปลงอินพุตที่กำหนด พูดข้อความ ให้เป็นตัวแทนตัวเลข เช่น ชุดตัวเลขที่มีความยาวคงที่ (ตัวเข้ารหัส) และยังแปลงตัวเลขเหล่านี้กลับเป็นเอาต์พุตที่ต้องการ (ตัวถอดรหัส ).

มักใช้ในงานประมวลผลภาษาธรรมชาติ เช่น การแปลด้วยคอมพิวเตอร์

ปรับจูน

กระบวนการปรับโมเดลที่ได้รับการฝึกอบรมล่วงหน้าให้เหมาะกับงานเฉพาะโดยการฝึกอบรมในชุดข้อมูลใหม่ แบบจำลองนั้นได้รับการฝึกอบรมในชุดข้อมูลทั่วไปขนาดใหญ่ก่อน จากนั้นจึงฝึกชุดข้อมูลที่เกี่ยวข้องกับงานซึ่งมีขนาดเล็กกว่าและเฉพาะเจาะจงมากขึ้น ด้วยวิธีนี้ แบบจำลองสามารถเรียนรู้ที่จะจดจำรูปแบบที่เหมาะสมยิ่งขึ้นในข้อมูลเฉพาะของงาน ซึ่งจะนำไปสู่ประสิทธิภาพที่ดีขึ้น

การปรับละเอียดสามารถประหยัดเวลาและทรัพยากรได้โดยใช้โมเดลทั่วไปแทนการฝึกโมเดลใหม่ตั้งแต่เริ่มต้น และยังสามารถลดความเสี่ยงของการโอเวอร์ฟิต ซึ่งโมเดลได้เรียนรู้คุณลักษณะของชุดฝึกขนาดเล็กเป็นอย่างดี แต่ก็ไม่สามารถทำได้ เพื่อสรุปเป็นข้อมูลอื่น

เครือข่ายฝ่ายตรงข้ามกำเนิด (GANs)

คลาสของอัลกอริทึม AI ที่ใช้ในแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล ซึ่งโครงข่ายประสาทเทียมสองเครือข่ายแข่งขันกันเอง GAN มีสองส่วน: แบบจำลองตัวสร้างที่ได้รับการฝึกฝนเพื่อสร้างตัวอย่างใหม่ของข้อมูลที่น่าเชื่อถือ และแบบจำลองตัวจำแนกที่พยายามจำแนกตัวอย่างว่าเป็นข้อมูลจริงหรือข้อมูลปลอม (สร้างขึ้น) จากนั้นโมเดลทั้งสองจะแข่งขันกันเองจนกว่าผู้แยกแยะจะแยกแยะความแตกต่างระหว่างข้อมูลจริงกับข้อมูลปลอมได้แย่ลง และเริ่มจัดประเภทข้อมูลปลอมว่าเป็นข้อมูลจริง

AI กำเนิด

ปัญญาประดิษฐ์ประเภทหนึ่งที่สามารถสร้างเนื้อหาได้หลากหลาย รวมถึงข้อความ รูปภาพ วิดีโอ และรหัสคอมพิวเตอร์ โดยการระบุรูปแบบในข้อมูลการฝึกอบรมจำนวนมาก และสร้างผลลัพธ์ที่มีลักษณะเฉพาะซึ่งคล้ายกับข้อมูลต้นฉบับ อัลกอริทึม AI กำเนิดใช้รูปแบบการเรียนรู้เชิงลึกเพื่อสร้างผลลัพธ์ใหม่ที่ไม่ได้ตั้งโปรแกรมหรือกำหนดไว้ล่วงหน้า ซึ่งแตกต่างจาก AI รูปแบบอื่นๆ ที่อิงตามกฎ

Generative AI สามารถผลิตเนื้อหาที่สมจริงและซับซ้อนซึ่งเลียนแบบความคิดสร้างสรรค์ของมนุษย์ ทำให้เป็นเครื่องมือที่มีประโยชน์สำหรับการใช้งานที่หลากหลาย เช่น การสร้างภาพและวิดีโอ การประมวลผลภาษาธรรมชาติ และการประพันธ์เพลง ตัวอย่างรวมถึงความก้าวหน้าล่าสุด เช่น ChatGPT สำหรับข้อความ และ DALL-E และ Midjourney สำหรับรูปภาพ

เจเนอเรทีฟพรีเทรนหม้อแปลง (GPT)

Generative pre-trained transformers หรือ GPT เป็นตระกูลของโมเดลโครงข่ายประสาทเทียมที่ได้รับการฝึกฝนด้วยพารามิเตอร์นับแสนล้านในชุดข้อมูลขนาดใหญ่เพื่อสร้างข้อความที่เหมือนมนุษย์ โดยอ้างอิงจากสถาปัตยกรรมทรานสฟอร์มเมอร์ที่นักวิจัยของ Google นำมาใช้ในปี 2017 ซึ่งช่วยให้โมเดลเข้าใจและใช้บริบทที่ใช้คำและสำนวนได้ดีขึ้น และเลือกเข้าร่วมกับส่วนต่างๆ ของอินพุต โดยเน้นที่คำหรือวลีที่เกี่ยวข้อง มันรับรู้ว่ามีความสำคัญต่อผลลัพธ์มากกว่า พวกเขาสามารถสร้างการตอบสนองที่ยาวนาน ไม่ใช่แค่คำถัดไปในลำดับ

โมเดลตระกูล GPT ถือเป็นโมเดลภาษาที่ใหญ่ที่สุดและซับซ้อนที่สุดจนถึงปัจจุบัน โดยทั่วไปจะใช้เพื่อตอบคำถาม สรุปข้อความ สร้างโค้ด การสนทนา เรื่องราว และงานประมวลผลภาษาธรรมชาติอื่นๆ อีกมากมาย ทำให้เหมาะสำหรับผลิตภัณฑ์ต่างๆ เช่น แชทบอทและผู้ช่วยเสมือน

ในเดือนพฤศจิกายน 2022 OpenAI ได้เปิดตัว ChatGPT ซึ่งเป็นแชทบอทที่สร้างขึ้นบน GPT-3.5 ซึ่งสร้างพายุหมุนไปทั่วโลก โดยทุกคนแห่กันไปลองใช้งาน และกระแสโฆษณาก็เกิดขึ้นจริง: ความก้าวหน้าล่าสุดใน GPT ทำให้เทคโนโลยีไม่เพียงแค่เป็นไปได้สำหรับการตั้งค่าทางธุรกิจ เช่น การบริการลูกค้าเท่านั้น แต่ยังทำให้เกิดการเปลี่ยนแปลงอีกด้วย

ภาพหลอน

ปรากฏการณ์ที่น่าเสียดายแต่เป็นที่รู้จักกันดีในแบบจำลองภาษาขนาดใหญ่ ซึ่งระบบ AI ให้คำตอบที่ดูน่าเชื่อถือซึ่งไม่ถูกต้องตามข้อเท็จจริง ไม่ถูกต้อง หรือไม่สมเหตุสมผล เนื่องจากข้อจำกัดในข้อมูลและสถาปัตยกรรมการฝึกอบรม

ตัวอย่างทั่วไปคือเมื่อนางแบบถูกถามคำถามที่เป็นข้อเท็จจริงเกี่ยวกับสิ่งที่ไม่ได้รับการฝึกอบรม และแทนที่จะพูดว่า "ฉันไม่รู้" จะเป็นการจำลองบางอย่างขึ้นมา การบรรเทาปัญหาภาพหลอนเป็นพื้นที่ของการวิจัยและเป็นสิ่งที่เราควรคำนึงถึงเสมอเมื่อประเมินการตอบสนองของโมเดลภาษาขนาดใหญ่ (LLM)

โมเดลภาษาขนาดใหญ่ (LLM)

LLM เป็นโครงข่ายประสาทเทียมชนิดหนึ่งที่สามารถสร้างข้อความภาษาธรรมชาติที่คล้ายกับข้อความที่เขียนโดยมนุษย์ โดยทั่วไป โมเดลเหล่านี้ได้รับการฝึกฝนในชุดข้อมูลจำนวนมหาศาลของคำหลายแสนล้านคำจากหนังสือ บทความ หน้าเว็บ ฯลฯ และใช้การเรียนรู้เชิงลึกเพื่อทำความเข้าใจรูปแบบที่ซับซ้อนและความสัมพันธ์ระหว่างคำเพื่อสร้างหรือทำนายเนื้อหาใหม่

ในขณะที่อัลกอริทึม NLP แบบดั้งเดิมมักดูเฉพาะบริบทของคำ แต่ LLM จะพิจารณาข้อความจำนวนมากเพื่อให้เข้าใจบริบทได้ดีขึ้น LLM มีหลายประเภท รวมถึงโมเดลเช่น GPT ของ OpenAI

ตัวแทน LLM (เช่น AutoGPT, LangChain)

ด้วยตัวของมันเอง LLM ใช้ข้อความเป็นอินพุตและให้ข้อความเพิ่มเติมเป็นเอาต์พุต ตัวแทนคือระบบที่สร้างขึ้นจาก LLM ที่ให้สิทธิ์ในการตัดสินใจ ดำเนินการอย่างอิสระ วางแผนและปฏิบัติงานโดยปราศจากการแทรกแซงของมนุษย์ ตัวแทนทำงานโดยใช้พลังของ LLM เพื่อแปลคำสั่งภาษาระดับสูงเป็นการกระทำหรือรหัสเฉพาะที่จำเป็นในการดำเนินการ

ขณะนี้มีการระเบิดของความสนใจและการพัฒนาในตัวแทน เครื่องมือต่างๆ เช่น AutoGPT กำลังเปิดใช้แอปพลิเคชันที่น่าตื่นเต้น เช่น "ผู้ทำรายการงาน" ซึ่งจะใช้รายการงานเป็นข้อมูลเข้า และพยายามทำงานให้คุณจริงๆ

การเรียนรู้ของเครื่อง (ML)

ฟิลด์ย่อยของ AI ที่เกี่ยวข้องกับการพัฒนาอัลกอริทึมและแบบจำลองทางสถิติที่ช่วยให้เครื่องจักรสามารถปรับปรุงประสิทธิภาพในการทำงานเฉพาะอย่างก้าวหน้าโดยไม่ต้องตั้งโปรแกรมอย่างชัดเจนให้ทำเช่นนั้น กล่าวอีกนัยหนึ่ง เครื่องจักรจะ "เรียนรู้" จากข้อมูล และเมื่อประมวลผลข้อมูลมากขึ้น ก็จะสามารถคาดการณ์หรือทำงานบางอย่างได้ดีขึ้น

แมชชีนเลิร์นนิงมีสามประเภทหลักๆ ได้แก่ การเรียนรู้แบบมีผู้สอน การเรียนรู้แบบไม่มีผู้ดูแล และการเรียนรู้แบบเสริมแรง

  • การเรียนรู้ภายใต้การดูแล เป็นวิธีการเรียนรู้ด้วยเครื่องที่ใช้ชุดข้อมูลที่มีป้ายกำกับซึ่งออกแบบมาเพื่อฝึกอัลกอริทึมในการจำแนกข้อมูลหรือทำนายผลลัพธ์อย่างแม่นยำ ตัวอย่างเช่น หากคุณจัดเตรียมชุดภาพแมวและสุนัขที่มีป้ายกำกับ แบบจำลองจะสามารถคาดการณ์ภาพแมวและสุนัขใหม่ที่ไม่มีป้ายกำกับได้
  • การเรียนรู้แบบไม่มีผู้ดูแล จะค้นหารูปแบบที่ตรวจไม่พบในชุดข้อมูลโดยไม่มีป้ายกำกับที่มีอยู่แล้วหรือการตั้งโปรแกรมเฉพาะ และด้วยการดูแลขั้นต่ำของมนุษย์
  • การเรียนรู้การเสริมแรง เกี่ยวข้องกับการฝึกอบรมแบบจำลองเพื่อทำการตัดสินใจโดยอิงจากผลตอบรับจากสภาพแวดล้อม มันเรียนรู้ที่จะดำเนินการเพื่อเพิ่มสัญญาณรางวัล เช่น ชนะเกมหรือทำภารกิจให้สำเร็จ

การประมวลผลภาษาธรรมชาติ (NLP)

NLP เป็นแขนงหนึ่งของ AI ที่มุ่งเน้นไปที่ปฏิสัมพันธ์ระหว่างภาษามนุษย์กับคอมพิวเตอร์ โดยจะรวมการสร้างแบบจำลองตามกฎของภาษามนุษย์เข้ากับสถิติ การเรียนรู้ของเครื่อง และแบบจำลองการเรียนรู้เชิงลึก ซึ่งโดยปกติแล้วจะได้รับการฝึกฝนโดยใช้ข้อมูลจำนวนมาก ซึ่งทำให้คอมพิวเตอร์สามารถประมวลผล ทำความเข้าใจ และสร้างภาษามนุษย์ได้

แอปพลิเคชันได้รับการออกแบบเพื่อวิเคราะห์ ทำความเข้าใจ และสร้างภาษามนุษย์ รวมถึงข้อความและคำพูด งาน NLP ทั่วไปบางอย่างรวมถึงการแปลภาษา การวิเคราะห์ความรู้สึก การรู้จำเสียง การจัดประเภทข้อความ การรู้จำเอนทิตีที่มีชื่อ และการสรุปข้อความ

เครือข่ายประสาท

โครงข่ายประสาทเทียมเป็นสาขาย่อยของแมชชีนเลิร์นนิงที่เสนอในปี 1944 โดยนักวิจัยสองคนในชิคาโก Warren McCullough และ Walter Pitts ซึ่งจำลองมาจากโครงสร้างของสมองมนุษย์ ประกอบด้วยชั้นของโหนดหรือเซลล์ประสาทที่เชื่อมต่อกัน ซึ่งประมวลผลและวิเคราะห์ข้อมูลเพื่อทำการทำนายหรือตัดสินใจ แต่ละชั้นจะรับอินพุตจากโหนดในเลเยอร์ก่อนหน้าและสร้างเอาต์พุตที่ป้อนไปยังโหนดในเลเยอร์ถัดไป เลเยอร์สุดท้ายจะแสดงผลลัพธ์ออกมา

พวกมันถูกนำไปใช้งานหลากหลายประเภท รวมถึงการรู้จำภาพและคำพูด การประมวลผลภาษาธรรมชาติ และการสร้างแบบจำลองเชิงทำนาย

วิศวกรรมพรอมต์

พรอมต์คือชุดคำสั่งที่เขียนเป็นข้อความหรือรหัสที่คุณระบุเป็นข้อมูลป้อนเข้าไปยัง LLM เพื่อให้ได้ผลลัพธ์ที่มีความหมาย และอาจเป็นคำถามง่ายๆ วิศวกรรมพรอมต์เป็นทักษะ (หรือศิลปะ บางคนอาจโต้แย้ง) ในการสร้างข้อความแจ้งที่มีประสิทธิภาพซึ่งจะสร้างผลลัพธ์ที่ดีที่สุดเท่าที่จะเป็นไปได้สำหรับงานใดๆ ก็ตาม จำเป็นต้องมีความเข้าใจในวิธีการทำงานของโมเดลภาษาขนาดใหญ่ (LLMs) ข้อมูลที่ได้รับการฝึกฝน ตลอดจนจุดแข็งและข้อจำกัดของโมเดลเหล่านี้

การเรียนรู้การเสริมแรงจากความคิดเห็นของมนุษย์ (RLHF)

RLHF หมายถึงกระบวนการใช้ความคิดเห็นที่ชัดเจนจากมนุษย์เพื่อฝึกฝนรูปแบบรางวัลของระบบการเรียนรู้แบบเสริมแรง ในบริบทของ LLM มนุษย์อาจจัดอันดับผลลัพธ์ของ LLM และเลือกการตอบสนองที่พวกเขาต้องการ จากนั้นจะใช้ในการฝึกอบรมโครงข่ายประสาทเทียมอีกรูปแบบหนึ่ง ซึ่งเรียกว่าแบบจำลองการให้รางวัล ซึ่งสามารถคาดการณ์ได้ว่าการตอบสนองที่ได้รับจะเป็นที่ต้องการหรือไม่ มนุษย์ จากนั้นโมเดลรางวัลจะใช้ในการปรับแต่ง LMM อย่างละเอียดเพื่อสร้างเอาต์พุตที่สอดคล้องกับความชอบของมนุษย์มากขึ้น

เทคนิคเหล่านี้ถือเป็นขั้นตอนที่มีผลกระทบอย่างมากในการพัฒนา LLM เช่น ChatGPT ซึ่งได้เห็นความก้าวหน้าที่ก้าวล้ำในความสามารถของพวกเขา

หม้อแปลง

หม้อแปลงเป็นสถาปัตยกรรมโครงข่ายประสาทเทียมแบบลึกชนิดหนึ่งที่ประกอบด้วยส่วนประกอบตัวเข้ารหัสและตัวถอดรหัสหลายตัวที่รวมกันเพื่อให้สามารถประมวลผลข้อมูลตามลำดับ เช่น ภาษาธรรมชาติและอนุกรมเวลา


นี่เป็นเพียงคำศัพท์ทั่วไปบางส่วนใน AI ที่คุณมักจะพบเจอ ไม่ต้องสงสัยเลยว่า อภิธานศัพท์เช่นนี้จะเป็นโครงการต่อเนื่องตลอดไป เนื่องจากเทคโนโลยีมีการพัฒนาอย่างต่อเนื่อง คำศัพท์และแนวคิดใหม่ๆ จะเกิดขึ้นเรื่อยๆ แต่สำหรับตอนนี้ การทำความเข้าใจแนวคิดเหล่านี้ คุณจะสามารถสร้างรากฐานที่มั่นคงซึ่งจะช่วยให้คุณก้าวทันการพัฒนาล่าสุดได้

รายการรอ Fin