成為公民數據科學家的 4 個簡單步驟

已發表: 2022-05-07

什麼是公民數據科學家?

無需數據科學家培訓即可完成(某些)數據科學家級別工作的人。

可以使用商業智能軟件進行聚類、分割和高級數據混合的工作者,即使他們沒有統計學博士學位。

換句話說? 公民數據科學家是每個企業友好的鄰里獨角獸。

如果您想要一個正式的定義,Gartner 將公民數據科學家 (CDS) 定義為“創建或生成使用高級診斷分析或預測和規範能力的模型的人,但其主要工作職能不在統計和分析領域。 ”

在許多情況下,“在統計和分析領域之外”意味著 CDS 是一名業務分析師——一位業務分析師,他學會了從各種主動性的混合物中製作這些高級模型(如果我能找出變量 x,我可以增加我們的收入)和需求(我們的數據科學家就像沒有計劃期的老師一樣負擔過重)。

隨著數據科學家越來越多地被要求使業務更加數據驅動,公民數據科學家可以通過兩種關鍵方式幫助他們的業務:

  • 他們可以通過使用正確的商業智能軟件來完成更簡單的數據科學任務,從而減輕數據科學家的負擔。
  • 他們可以為數據科學帶來局外人的業務視角。

幸運的是,成為公民數據科學家不需要學位,甚至不需要一整年的培訓。 它確實需要工作,但好處使這項工作值得。 如果您有興趣成為一名公民數據科學家,以下四個步驟可以幫助您踏上這條道路。

1. 要求訪問更多的新數據源。

如果您厭倦了處理來自相同舊報告的相同舊數據,那麼您已經讓公民數據科學家心癢癢了,可能是時候要求您的主管訪問您的正常報告中未包含的數據和信息。

當您向非數據科學家開放數據訪問權限時,您可以看到公民數據科學帶來的優勢和好處。 通過將數據擴展到一個非常獨特的公民數據科學家群體,IBM 將 2016 年溫布爾登錦標賽變成了一個信息庫。 這家計算機巨頭授權網球專業人士使用他們的數據分析程序 Watson Analytics。 結果是對球員表現的前所未有的洞察力。 Watson Analytics 能夠使用小到球落地位置的數據點來確定球員的風格是否發生了變化。

擴大對沒有數據科學學位的人的訪問也非常容易——實際上,培訓職業運動員使用數據科學軟件比培訓數據科學家了解專業網球的複雜性要容易得多。 更好的是,這意味著一群擁有專家級知識的人能夠為原本無法進入的數據科學領域做出貢獻。

2. 了解如何使用具有高級分析功能和智能數據發現的商業智能軟件。

一旦您獲得了新的數據來源以獲得新的見解,您將需要知道如何使用這些工具,讓沒有數據科學或統計學博士學位的人能夠使用高級數據科學。

作為公民數據科學家,您應該在軟件中尋找什麼樣的功能?

  • 高級自助數據準備
  • 行為分析
  • 圖分析
  • 位置分析
  • 網絡分析
  • 智能數據發現

高級自助數據準備已經幫助 Sears 將其商業智能分析師轉變為公民數據科學家。 Sears 投資了 Platfora 的大數據發現軟件解決方案,授予 400 名分析師訪問權限。 因此,分析師能夠使用客戶細分(通常是一種高級數據科學操作)來改進 Sears 網站上為客戶提供的產品推薦。

商業智能供應商 Alteryx 提供了一個易於使用的可視化工具來進行複雜的數據混合。 無需創建新數據集來合併不同類型的數據(例如,Excel 文件和 Oracle 文件),您可以使用 Alteryx 的拖放功能將冗長的數據科學任務減少到單擊幾下鼠。

與 Platfora 和 Alteryx 一樣,Paxata 的軟件使高級數據分析成為現實。 我與 Paxata 的 Farnaz Erfan 進行了交談,他描述了他們的一位客戶,一家消費品公司,如何將博士級別的活動帶給分析師。

Paxata 為分析師創建了“一個完整的自助服務範式”,不需要數據科學家的幫助。 該公司使用自助服務解決方案來改善庫存、供應和營銷。 例如,使用 Paxata “已將業務分析師準備運輸時間數據的時間從每月 5 小時減少到不到 1 小時。” 另一個節省的來源是“通過識別和匹配違規電子郵件地址來檢測優惠券欺詐”的能力。

雖然學習使用高級分析有很多好處,但也會有一個學習曲線。 話雖如此,這並不算太難:根據 Gartner 的估計,應該只需要一到兩週的時間就可以加快速度。 大多數供應商都提供培訓、教程和社區論壇,並提供常見問題的答案。

3. 確保建立治理

Mo'訪問,mo'(數據治理)問題。 或者可能是這種情況,除非您將治理作為優先事項。 隨著更多公民數據科學家訪問更多數據集,數據有更多機會落入壞人之手。

“數據治理絕對是關鍵,”數據科學諮詢公司 Acculation 的首席執行官 Werner Krebs 解釋道。 “你必須培訓你的員工了解數據的價值,並幫助他們提供工具和框架來幫助他們收集數據,”他繼續說道。 幸運的是,有多種框架可以組織這些數據,從全面質量管理到 ISO 9001 再到“各種六西格瑪框架”。

Gartner 對數據治理也同樣強調:“適當的治理至關重要,就如何理解數據、數據的關係和適當的使用提供指導也是如此。”

讓更多人訪問更多數據有很多價值,但這些人需要了解如何訪問數據,以及如何確保數據安全(例如,不要在公共 Wi-Fi 不安全的區域閱讀敏感文檔)。

4. 確保您的組織有“監護人”監督您如何使用數據

像公民數據科學家這樣的新角色需要新的規則和角色來管理它。 您可以從高級數據準備中獲得的好處絕對值得在整個企業範圍內重新思考和重組。 也就是說,您不想擺脫舊的數據管理角色。

舊的女童子軍歌曲總結了公民數據科學家時代數據管理的一條經驗法則:結交新朋友,但保留舊朋友。 換句話說,保留像數據管理員和數據庫管理員這樣的角色,但也要增加新的角色,比如 Gartner 的守護者理念,以確保公民數據科學家能夠負責任地使用他們需要的東西。

Gartner 將“監護人”角色定義為“確保數據可以工業化、安全和可擴展”的人。 換句話說,他們是監督數據安全的人,並且還要確保公民數據科學的成功實例可以被整個企業採用。 他們還彌合了傳統數據管理角色(Gartner 稱其為“運營商”)和以新方式使用數據的公民數據科學家(“創新者”)之間的差距。

您如何使用公民數據科學?

你扮演公民數據科學家的角色嗎? 您是否使用高級數據分析來幫助您的企業省錢或賺錢? 如果是這樣,請在下面的評論中告訴我!