4 ขั้นตอนง่ายๆ ในการเป็นนักวิทยาศาสตร์ข้อมูลพลเมือง

เผยแพร่แล้ว: 2022-05-07

นักวิทยาศาสตร์ข้อมูลพลเมืองคืออะไร

บุคคลที่สามารถทำงานได้ (บางส่วน) ระดับนักวิทยาศาสตร์ข้อมูล โดยไม่ต้องอบรมจากนักวิทยาศาสตร์ข้อมูล

พนักงานที่สามารถใช้ซอฟต์แวร์ Business Intelligence เพื่อทำคลัสเตอร์ แบ่งกลุ่ม และผสมผสานข้อมูลขั้นสูงได้ แม้ว่าพวกเขาจะไม่มีปริญญาเอกด้านสถิติก็ตาม

กล่าวอีกนัยหนึ่ง? นักวิทยาศาสตร์ข้อมูลพลเมืองคือยูนิคอร์นในละแวกใกล้เคียงที่เป็นมิตรของทุกธุรกิจ

หากคุณต้องการคำจำกัดความที่เป็นทางการ Gartner ให้คำจำกัดความของ Citizen Data Scientist (CDS) ว่าเป็น “บุคคลที่สร้างหรือสร้างแบบจำลองที่ใช้การวิเคราะห์การวินิจฉัยขั้นสูงหรือความสามารถในการคาดการณ์และกำหนดล่วงหน้า แต่มีหน้าที่งานหลักอยู่นอกสาขาสถิติและการวิเคราะห์ ”

ในหลายกรณี “นอกสาขาสถิติและการวิเคราะห์” หมายถึง CDS เป็นนักวิเคราะห์ธุรกิจ—นักวิเคราะห์ธุรกิจที่เรียนรู้ที่จะสร้างแบบจำลองระดับสูงเหล่านั้นจากการผสมผสานของความคิดริเริ่ม (ถ้าฉันสามารถหาตัวแปร x ได้ ฉัน สามารถเพิ่มรายได้ของเราได้) และความต้องการ (นักวิทยาศาสตร์ด้านข้อมูลของเรามีการเก็บภาษีมากเกินไปในฐานะครูโดยไม่มีระยะเวลาในการวางแผน)

เนื่องจากนักวิทยาศาสตร์ด้านข้อมูลถูกเก็บภาษีมากขึ้นจากคำขอเพื่อให้ธุรกิจขับเคลื่อนด้วยข้อมูลมากขึ้น นักวิทยาศาสตร์ด้านข้อมูลพลเมืองสามารถช่วยธุรกิจของตนได้สองวิธีหลัก:

  • พวกเขาสามารถแบ่งเบาภาระของนักวิทยาศาสตร์ข้อมูลโดยใช้ซอฟต์แวร์ข่าวกรองธุรกิจที่เหมาะสมเพื่อทำงานวิทยาศาสตร์ข้อมูลที่เรียบง่าย
  • พวกเขาสามารถนำมุมมองของบุคคลภายนอกในด้านธุรกิจมาสู่วิทยาศาสตร์ข้อมูล

โชคดีที่การเป็นนักวิทยาศาสตร์ข้อมูลพลเมืองไม่จำเป็นต้องได้รับปริญญา หรือแม้แต่การฝึกอบรมหนึ่งปีเต็ม มันไม่จำเป็นต้องทำงาน แต่ผลประโยชน์ทำให้งานคุ้มค่า หากคุณสนใจที่จะเป็นนักวิทยาศาสตร์ข้อมูลพลเมือง ต่อไปนี้คือขั้นตอนสี่ขั้นตอนที่จะช่วยให้คุณเริ่มต้นได้

1. ขอเข้าถึงแหล่งข้อมูลเพิ่มเติมและใหม่

หากคุณเบื่อที่จะจัดการกับข้อมูลเดิมๆ จากรายงานแบบเดิมๆ แสดงว่าคุณมีอาการคันของนักวิทยาศาสตร์ข้อมูลพลเมือง และอาจถึงเวลาที่ต้องขอให้หัวหน้างานของคุณเข้าถึงข้อมูลที่ไม่รวมอยู่ในรายงานปกติของคุณ และข้อมูล

เมื่อคุณเปิดการเข้าถึงข้อมูลให้กับนักวิทยาศาสตร์ที่ไม่ใช่ข้อมูล คุณจะเห็นจุดแข็งและประโยชน์ที่ได้รับจากวิทยาศาสตร์ข้อมูลพลเมือง ด้วยการขยายข้อมูลไปยังกลุ่มนักวิทยาศาสตร์ข้อมูลพลเมืองที่มีเอกลักษณ์เฉพาะ IBM เปลี่ยนการแข่งขันวิมเบิลดันปี 2016 ให้เป็นคลังข้อมูล ยักษ์ใหญ่ด้านคอมพิวเตอร์ให้อำนาจนักเทนนิสมืออาชีพใช้โปรแกรมวิเคราะห์ข้อมูล Watson Analytics ผลลัพธ์ที่ได้คือข้อมูลเชิงลึกที่ไม่เคยมีมาก่อนในการแสดงของผู้เล่น Watson Analytics สามารถใช้จุดข้อมูลที่มีขนาดเล็กพอๆ กับที่ลูกบอลตกลงไปเพื่อตัดสินว่าสไตล์ของผู้เล่นเปลี่ยนไปหรือไม่

การขยายการเข้าถึงผู้ที่ไม่มีปริญญาวิทยาศาสตร์ข้อมูลก็เป็นเรื่องง่ายอย่างน่าประหลาดใจ—ที่จริงแล้ว การฝึกนักกีฬามืออาชีพให้ใช้ซอฟต์แวร์วิทยาศาสตร์ข้อมูลง่ายกว่าการฝึกนักวิทยาศาสตร์ข้อมูลให้เข้าใจความซับซ้อนของเทนนิสระดับมืออาชีพ ยิ่งไปกว่านั้น มันหมายถึงกลุ่มคนที่มีความรู้ระดับผู้เชี่ยวชาญสามารถมีส่วนร่วมในสาขาวิทยาศาสตร์ข้อมูลที่ไม่สามารถเข้าถึงได้

2. เรียนรู้วิธีใช้ซอฟต์แวร์ข่าวกรองธุรกิจพร้อมคุณสมบัติการวิเคราะห์ขั้นสูงและการค้นพบข้อมูลอัจฉริยะ

เมื่อคุณมีแหล่งข้อมูลใหม่สำหรับข้อมูลเชิงลึกใหม่ๆ แล้ว คุณจะต้องรู้วิธีใช้เครื่องมือที่ทำให้วิทยาศาสตร์ข้อมูลระดับสูงเป็นไปได้สำหรับผู้ที่ไม่มีปริญญาวิทยาศาสตร์ข้อมูลหรือสถิติ

คุณควรมองหาคุณลักษณะประเภทใดในซอฟต์แวร์ที่สามารถช่วยให้คุณเป็นนักวิทยาศาสตร์ข้อมูลพลเมืองได้

  • การเตรียมข้อมูลแบบบริการตนเองขั้นสูง
  • การวิเคราะห์พฤติกรรม
  • การวิเคราะห์กราฟ
  • การวิเคราะห์ตำแหน่ง
  • การวิเคราะห์เว็บ
  • การค้นพบข้อมูลอย่างชาญฉลาด

การเตรียมข้อมูลแบบบริการตนเองขั้นสูงช่วยให้เซียร์เปลี่ยนนักวิเคราะห์ระบบธุรกิจอัจฉริยะเป็นนักวิทยาศาสตร์ข้อมูลพลเมืองได้แล้ว เซียร์ลงทุนในโซลูชันซอฟต์แวร์ค้นหาข้อมูลขนาดใหญ่ของ Platfora โดยให้สิทธิ์เข้าถึงนักวิเคราะห์ 400 คน ด้วยเหตุนี้ นักวิเคราะห์จึงสามารถใช้การแบ่งกลุ่มลูกค้า—โดยปกติคือการดำเนินการด้านวิทยาศาสตร์ข้อมูลขั้นสูง—เพื่อปรับปรุงคำแนะนำผลิตภัณฑ์สำหรับลูกค้าบนเว็บไซต์เซียร์

ผู้จำหน่ายข่าวกรองธุรกิจ Alteryx เสนอเครื่องมือภาพที่ใช้งานง่ายเพื่อผสมข้อมูลที่ซับซ้อน แทนที่จะต้องสร้างชุดข้อมูลใหม่เพื่อรวมข้อมูลประเภทต่างๆ (เช่น ไฟล์ Excel และไฟล์ Oracle) คุณสามารถใช้ฟังก์ชันลากแล้ววางของ Alteryx เพื่อลดงานด้านวิทยาศาสตร์ข้อมูลที่มีความยาวนั้นให้เหลือเพียงไม่กี่คลิก หนู.

เช่นเดียวกับ Platfora และ Alteryx ซอฟต์แวร์ของ Paxata ทำให้การวิเคราะห์ข้อมูลขั้นสูงเป็นจริง ฉันได้พูดคุยกับ Farnaz Erfan แห่ง Paxata ซึ่งอธิบายว่าลูกค้ารายหนึ่งของพวกเขาซึ่งเป็นบริษัทสินค้าอุปโภคบริโภคได้นำกิจกรรมระดับปริญญาเอกมาสู่นักวิเคราะห์ได้อย่างไร

Paxata ได้สร้าง “กระบวนทัศน์การบริการตนเองที่สมบูรณ์สำหรับนักวิเคราะห์” ซึ่งไม่ต้องการความช่วยเหลือจากนักวิทยาศาสตร์ด้านข้อมูล บริษัทใช้โซลูชันแบบบริการตนเองเพื่อปรับปรุงสินค้าคงคลัง การจัดหาและการตลาด ตัวอย่างเช่น การใช้ Paxata “ได้ลดเวลาที่นักวิเคราะห์ธุรกิจต้องใช้ในการเตรียมข้อมูลเวลาขนส่งจากห้าชั่วโมงต่อเดือนเหลือน้อยกว่าหนึ่งชั่วโมง” แหล่งเงินออมอีกแหล่งหนึ่งคือความสามารถในการ "ตรวจจับการฉ้อโกงคูปองด้วยการระบุและจับคู่ที่อยู่อีเมลที่ไม่เหมาะสม"

แม้ว่าการเรียนรู้การใช้การวิเคราะห์ขั้นสูงจะมีประโยชน์มากมาย แต่ก็จะมีช่วงการเรียนรู้ด้วยเช่นกัน ที่กล่าวว่าไม่ได้มากเกินไป: ตามการประเมินของ Gartner จะใช้เวลาเพียงหนึ่งถึงสองสัปดาห์ในการดำเนินการให้เร็วขึ้น ผู้ค้าส่วนใหญ่เสนอการฝึกอบรม บทช่วยสอน และฟอรัมชุมชนพร้อมคำตอบสำหรับคำถามทั่วไป

3. ตรวจสอบให้แน่ใจว่ามีการจัดตั้งการกำกับดูแล

Mo' access, mo' (การจัดการข้อมูล) ปัญหา หรือ อาจ เป็นกรณีนี้ เว้นแต่คุณจะให้ความสำคัญกับการกำกับดูแล เมื่อนักวิทยาศาสตร์ข้อมูลพลเมืองเข้าถึงชุดข้อมูลมากขึ้น ก็มีโอกาสมากขึ้นที่ข้อมูลจะตกไปอยู่ในมือของคนผิด

“การกำกับดูแลข้อมูลเป็นกุญแจสำคัญอย่างยิ่ง” เวอร์เนอร์ เครบส์ CEO ของบริษัทที่ปรึกษาด้านวิทยาศาสตร์ข้อมูล Acculation อธิบาย “คุณต้องฝึกอบรมพนักงานของคุณให้เข้าใจว่าข้อมูลมีค่า และช่วยจัดหาเครื่องมือและกรอบการทำงานเพื่อช่วยให้พวกเขารวบรวมได้” เขากล่าวต่อ โชคดีที่มีหลายเฟรมเวิร์กสำหรับการจัดระเบียบข้อมูลนั้น ตั้งแต่การจัดการคุณภาพโดยรวมไปจนถึง ISO 9001 ไปจนถึง "เฟรมเวิร์กซิกส์ซิกม่าต่างๆ"

Gartner ให้ความสำคัญกับการกำกับดูแลข้อมูลในลักษณะเดียวกัน: “การกำกับดูแลที่เหมาะสมเป็นสิ่งสำคัญ เช่นเดียวกับแนวทางในการทำความเข้าใจข้อมูล ความสัมพันธ์ และการใช้งานที่เหมาะสม”

การให้ผู้คนเข้าถึงข้อมูลมากขึ้นมีประโยชน์มากมาย แต่คนเหล่านั้นจำเป็นต้องเข้าใจวิธีการเข้าถึงและวิธีรักษาความปลอดภัย (อย่าไปอ่านเอกสารที่ละเอียดอ่อนในบริเวณที่มี Wi-Fi สาธารณะที่ไม่ปลอดภัย เป็นต้น ).

4. ตรวจสอบให้แน่ใจว่าองค์กรของคุณมี “ผู้ปกครอง” ที่ดูแลวิธีที่คุณใช้ข้อมูลของคุณ

บทบาทใหม่เช่นนักวิทยาศาสตร์ข้อมูลพลเมืองต้องการกฎและบทบาทใหม่ในการจัดการ ประโยชน์ที่คุณจะได้รับจากการเตรียมข้อมูลขั้นสูงนั้นคุ้มค่ากับการทบทวนและปรับโครงสร้างองค์กรทั่วทั้งธุรกิจ ที่กล่าวว่าคุณไม่ต้องการกำจัดบทบาทการจัดการข้อมูลเก่า

กฎข้อหนึ่งสำหรับการจัดการข้อมูลในยุคของนักวิทยาศาสตร์ข้อมูลพลเมืองถูกสรุปโดยเพลง Girl Scout ฉบับเก่า: หาเพื่อนใหม่ แต่รักษาความเก่าไว้ กล่าวคือ รักษาบทบาทเช่นผู้ดูแลข้อมูลและผู้ดูแลระบบฐานข้อมูล แต่ยังเพิ่มบทบาทใหม่ เช่น ความคิดของการ์ตเนอร์เกี่ยวกับผู้ปกครอง เพื่อให้แน่ใจว่านักวิทยาศาสตร์ข้อมูลพลเมืองสามารถใช้สิ่งที่พวกเขาต้องการอย่างมีความรับผิดชอบ

Gartner กำหนดบทบาท "ผู้พิทักษ์" ว่าเป็นคนที่ "รับรองว่าข้อมูลสามารถนำไปใช้ในเชิงอุตสาหกรรม ปลอดภัย และปรับขนาดได้" กล่าวอีกนัยหนึ่งคือ พวกเขาคือผู้ดูแลความปลอดภัยของข้อมูล และเห็นว่าอินสแตนซ์ที่ประสบความสำเร็จของวิทยาศาสตร์ข้อมูลพลเมือง สามารถนำมาใช้กับธุรกิจทั้งหมดได้ พวกเขายังเชื่อมช่องว่างระหว่างบทบาทการจัดการข้อมูลแบบดั้งเดิม (Gartner เรียกพวกเขาว่า "ผู้ปฏิบัติงาน") และนักวิทยาศาสตร์ข้อมูลพลเมืองที่ใช้ข้อมูลในรูปแบบใหม่ ("ผู้สร้างนวัตกรรม")

คุณใช้วิทยาศาสตร์ข้อมูลพลเมืองอย่างไร

คุณเล่นบทบาทของนักวิทยาศาสตร์ข้อมูลพลเมืองหรือไม่? คุณเคยใช้การวิเคราะห์ข้อมูลขั้นสูงเพื่อช่วยให้ธุรกิจของคุณประหยัดเงินหรือสร้างรายได้หรือไม่? ถ้าเป็นเช่นนั้นแจ้งให้เราทราบในความคิดเห็นด้านล่าง!