什麼是機器學習? 您的基本商業智能詞彙表

已發表: 2022-05-07

我一直認為春季大掃除太少,太晚。 對我來說,一月是你訂購、優先考慮並開始回答來年問題的時候。 這就是為什麼我選擇一月份來回答一個你可能已經有一段時間的問題:什麼是機器學習?

我會回答這個問題,並定義一些您需要了解的其他術語,以保持在 2017 年的領先地位。如果您對商業智能軟件可以為您做什麼感興趣,您需要先了解這些基本術語.

我將機器學習放在首位,因為它是 Gartner 的2017 年十大戰略技術趨勢之一,但其餘條目按字母順序排列。

機器學習

在機器學習之前,必須告訴(編程)計算機如何思考。 通過機器學習,計算機可以(某種程度上)自己思考。

我最近與 BI 軟件公司AnswerRocket的機器學習主管 Michael Finley 進行了交談,他幫助詳細說明了這一點。 在機器學習之前,大多數軟件“按照編程的方式運行:人們將指令轉化為計算機代碼,然後計算機按照代碼的指示去做。” 一個非常簡單的例子是計算器:你輸入計算器數字,告訴它要做什麼(加,減),然後計算器給你結果。 然而,通過機器學習,軟件可以適應。 Finley 繼續說道:“具有機器學習功能的軟件在您安裝它的當天所執行的操作與您運行它的第十天或第一百天執行的操作不同。” 如果輸入計算機的值發生變化,軟件將適應這些值。 具有機器學習功能的計算機學習如何整合它們。

由令人敬畏的 Andre Pinto 和 Anthill Comics 提供

Finley 將機器學習描述為知道如何處理“喜歡”概念的軟件,例如“我想听一首我剛剛聽到的最後一首歌曲”。 這個概念對人來說很容易,但對計算機來說卻很難。 Finley 解釋說,計算機擅長理解哪些數字更大或更小,以及匹配數字和名稱,但它們在相似性的概念上遇到了困難。 機器學習幫助計算機理解為什麼一件事與另一件事“相似”。 機器學習對相似性的掌握在預測客戶需求方面特別有幫助。

機器學習是您在 Pandora 上聽到的下一首歌曲或 Netflix 推薦的電影的幕後推手。 Pandora 和 Netflix 的機器學習算法會“提供”您的選擇(在 Pandora 的案例中是實際的“喜歡”),並使用它來預測您可能喜歡哪些類似的歌曲或節目。

為這些機器學習算法提供不同的數據,它們會做出不同的反應。 如果您通常的恐怖電影飲食突然莫名其妙地包含浪漫喜劇,Netflix 的 ML 算法將對該數據做出反應,並開始推薦其他浪漫喜劇或恐怖浪漫。

撇開電影品味下降不談,為什麼機器學習對中小企業很重要? 它可以幫助他們與更大的競爭對手競爭。 每次刷新時,具有機器學習功能的 BI 軟件都會獲取新的數字。 您不是基於年度報告的數字制定戰略,而是基於近乎實時的信息以及知道如何適應不斷變化的數據的算法。 Finley 解釋說,企業擴展業務規模的傳統、同質方式可以通過 ML 徹底改變:

“我可能已經制定了最佳實踐並希望重複流程。 但是,如果您每天都可以製定最佳實踐,如果您有信息可以每天更改它們並重新制定策略,那會怎樣? 由於機器學習可以每天重寫策略,您可以獲得數據,這就是中小型企業真正吃大公司午餐的方式。”

對於對敏捷業務戰略感興趣的中小型企業來說,機器學習可能不僅僅是一種維持生計的方式。 這可能是開始佔據老牌企業部分市場份額的一種方式。

  • 即席分析
  • 即席查詢
  • 高級分析
  • 人工智能
  • 大數據
  • 上下文數據
  • 數據點
  • 數據質量
  • 數據可視化
  • 數據倉庫
  • 數據庫
  • 儀表板
  • 向下鑽取
  • ETL
  • 元數據
  • 指標
  • 現代商業智能
  • 傳統商業智能
  • SaaS/雲軟件
  • 切片法
  • SQL
  • 你想知道的術語……

即席分析

即席分析是在您需要時進行的分析,其水平非 IT、非專家可以理解。

如果可訪問的商業智能似乎是一件顯而易見的事情,它並不總是可以實現的。 長期以來,BI 專業人員必須能夠“說計算機”(即用編碼語言編寫)來查詢商業智能程序。 不知道如何使用 SQL、R 或 Python 編寫代碼? 問問 IT 部門的人。 然後等待。 然後等待商業智能程序運行,然後再等待分析。

值得慶幸的是,BI 終於成熟到了即席分析。 :使用此系統,您無需等待 IT 人員,也無需等待較慢的傳統報告生成速度,即可獲得必要的數據。 它使您和他們的工作更輕鬆,壓力更小。

如果您沒有 IT 人員,即席分析可以解決這個問題。 即席分析還可以縮短獲得洞察的時間(這是您可能會看到的另一個流行詞;這意味著獲得所需信息需要更短的時間)。

即席查詢

“查詢”是您可能要求您的商業智能軟件回答的問題。 例如,您可能會要求您的 BI 軟件按字母順序列出自 1970 年以來出生的所有棕色眼睛客戶。您可以很容易地將查詢稱為問題,但您在對話中說出“查詢”的頻率是多少?

即席查詢是您可以在需要時提出的查詢。 與舊的業務分析一樣,舊的查詢需要 IT 人員來詢問。 查詢也往往作為您每月或每年獲得的定期報告的一部分進行。 使用較舊的 BI 軟件,您必須使用編程語言提出該查詢。 SQL 是商業智能的一項長期標準。 現在,R 和 Python 很流行。

您可以將包括 BI 在內的計算機程序視為官僚機構的分支,從 DOJ 到 HHS。 他們在技術上是為了完成事情,但每個人都有自己的語言,並以自己特定的方式工作。 程序員就像會說語言並且知道如何導航每個程序/部門的官僚。

高級分析

這個術語實際上超越了商業智能。 “商業智能”傳統上用於分析發生的事情。 高級分析更進一步,無論是預測未來會發生什麼,還是分析通常與商業智能無關的細節和因素。 高級分析的一些示例是數據和文本挖掘預測分析預測位置分析情緒分析和機器學習。

人工智能

機器學習是人工智能的一部分,但人工智能是一個更大的概念。 人工智能包括任何你可以稱之為“機器展示的智能”的東西 人工智能意義上的“智能”是指完成某事的能力。 因此,將“智能”理解為僅僅知道很多東西並不是人工智能中的那種智能。

人工智能可以完成的“事情”已經多種多樣。 例如, Daisy Intelligence使用人工智能檢查零售商的數據,然後提出他們聲稱可以“將銷售額增長 5% 或更多”的建議。 如果您像我一樣喜歡在 DMV 等候,那麼像Amy這樣可以根據與會者的喜好安排會議的虛擬助手可能是您最好的新朋友。

大數據

大數據是極其龐大的數據集。 儘管我通常同意斯蒂芬金的觀點,“通往地獄的道路是用副詞鋪成的”,但“非常”是有道理的。 例如,少量數據將是一本短書。 第一部《哈利波特》書籍的 PDF 大約是 1 兆字節 (MB)。

大數據類似於 PB 的數據。 繼續本書的示例,自記錄歷史開始以來,所寫的所有內容都是 50 PB 像谷歌這樣的大型公司是那種處理 PB 的公司。 谷歌的 Mesa 系統監控谷歌的廣告流量,跟踪 PB 級的數據。

上下文數據

上下文數據是關於人、地點或事件(在 dataspeak 中稱為“實體”)的附加數據。 上下文數據有助於完善企業對潛在客戶的了解,甚至預測他們可能想要什麼。

儘管這不是一門生意,但英格蘭曼徹斯特大學在其招生過程中使用上下文數據來“全面全面地了解你的成就和潛力”。 除了學生的錄取表格外,UM 還會考慮候選人的郵政編碼、您參加考試的學校的質量以及“您是否被照顧或照顧超過三個月”等因素。

對於企業而言,上下文數據可能有助於銷售。 舉一個非常廣泛的例子,過去客戶的上下文數據,基於他們所在位置的天氣,可以增加收入。明尼蘇達州國際瀑布市的顧客相比,亞利桑那州圖斯康的顧客更有可能在 10 月份購買冰棒

數據點

數據點是單個數據片段。 數據點是您跟踪的數據中的任何獨立單元或數據。 單個數據點可以是從“投資規模”到單擊您在 Google 上購買的廣告的任何內容。 在 Uber 的例子中,位置是一個重要的數據點——一個非常重要的數據點,他們在你的乘車完成後實際上會跟踪它

如果您熟悉關鍵績效指標,那麼您就熟悉數據點。 KPI 衡量某些類型的數據點,例如收入或完成項目所需的時間。

數據質量

數據質量是衡量數據有用性的指標。 高質量的數據是乾淨的、有組織的和可用的。 如果圖書館的數據就是它的書籍,那麼擁有高質量數據的圖書館就會將人們想要和需要的書籍保存在正確的位置,而且狀況良好。

數據質量有六個維度:

  • 完整性
  • 獨特性
  • 有效性
  • 時效性
  • 一致性
  • 準確性

數據可視化

數據可視化是顯示數據的任何圖像、視覺對像或圖形。 餅圖和條形圖將是最常見的類型。 不過,那裡有更廣泛的可視化。 Gartner 的2016 年商業智能和分析平台評估標準(受付費牆保護;值得)將更高級的圖表類型列為在您的 BI 解決方案中尋找的“首選”項目。 要尋找的一些更高質量的首選圖表類型是:

  • Marimekko 圖表
  • X/Y 圖表
  • 網絡圖
  • 帕累托圖
  • 詞云

數據倉庫

數據倉庫是保存和組織來自各種數據庫和事務系統的數據的計算機系統。 您經常會在前面看到帶有“企業”的術語,因為您需要大量的企業級數據才能需要數據倉庫。

數據庫

數據庫是經過組織的數據,因此您可以輕鬆獲得所需的內容。 去過IMDB嗎? 你當然有。 那是一個數據庫:電影、演員、導演、製片人,所有這些都是為了便於搜索而組織起來的,就像你需要在凱文培根六度遊戲中作弊時一樣

儀表板

該圖片在此說明之前,因為它更容易顯示儀表板的外觀。

對於正式定義:儀表板是您正在跟踪的數據的可視化表示。 您的 BI 程序絕對需要有一個儀表板。 你不會買沒有儀表板的汽車。 BI 軟件也是如此。

當您購買 BI 軟件時,請確保您的程序儀表板具有Gartner 推薦的這兩個基準標準(受付費牆保護;值得):

  • “無需第三方選項、編碼或腳本,即可設計具有至少基本圖表類型(包括表格、條形圖、折線圖、面積圖和餅圖)的儀表板的能力。”
  • “所見即所得 (WYSIWYG) 設計”,即在不知道如何編碼的情況下設計儀表板和分析數據的能力。

向下鑽取

向下鑽取是指獲取一般信息(如年度銷售數據)並按月、週甚至天向下鑽取的能力。 “向下鑽取”意味著您可以從一般情況縮小到通常在信息和洞察力之間產生差異的細節。 深入研究有點像那部古老的“十的力量”電影的商業智能版本。

ETL

ETL(或提取、轉換、加載)發生在數據收集和將數據放入數據倉庫之間。

“提取”的需求來自這樣一個事實,即數據在進入數據倉庫之前就已在數據庫或ERP 軟件中收集。 轉換的需要來自於這樣一個事實,即這些多個數據源通常具有不同的格式,並且需要轉換為適當的格式以便在數據倉庫中存儲和搜索。 加載的需要是不言自明的; 您必須先將其放入數據倉庫,然後才能搜索並比較一個數據源與另一個數據源。

元數據

元數據是關於數據的數據。 如果這聽起來,元,它是​​......它是元數據

不過實話說。

元數據是關於您的數據的信息。 分為三類:

  • 技術:關於您的數據的技術細節,例如其模型、格式和度量。
  • 業務:以用戶友好的術語(即簡單的英語)對數據進行描述
  • 過程:數據告訴你對哪些數據做了什麼,什麼時候做的。

指標

“公制”只是您測量的任何事物的一個花哨的詞。

你在跟踪你的淨利潤嗎? 那是一個指標。 密切關注貴公司有多少人在使用 BI 軟件? 這也是一個指標。 密切關注對話率? 這也是一個指標。 指標的訣竅是選擇最適合您公司的指標。 每個公司都有不同的需求,在選擇指標時考慮您的需求和優先級是個好主意

現代商業智能

現代商業智能一詞來自Gartner ,他這樣定義它

現代 BI 平台支持支持 IT 的分析內容開發。 它由一個獨立的架構定義,使非技術用戶能夠自主執行從數據訪問、攝取和準備到交互式分析和協作共享見解的全方位分析工作流程。

簡而言之,現代 BI 將業務用戶放在首位。 您不需要依賴 IT 部門的人,或者您需要更少地依賴他們來使用現代 BI 程序。 例如,在傳統的、較舊的 BI 程序設置為僅允許 IT 人員創作內容的情況下,現代 BI 程序使業務用戶可以輕鬆地自己創建內容。

傳統商業智能

傳統的商業智能計劃嚴重依賴 IT 人員。 他們通常要求用戶了解 SQL(一種編程語言,見下文),並且獲得答案需要更長的時間,因為您必須手動輸入該語言的多個查詢。 因此,它們的敏捷性要低得多,像Gartner 這樣的專家建議買家轉而尋找現代 BI 程序中的那種功能

SaaS/雲軟件

軟件即服務是一種購買者購買許可證來使用軟件的模式,而不是購買和安裝它。 大多數 SaaS 軟件是通過互聯網(即在雲中)完成的,這降低了購買和安裝的前期成本。 它還消除了監視軟件所在服務器的需要; SaaS 公司會跟踪任何潛在的中斷。

切片法

對大型數據集進行切片和切塊,以便從不同的角度查看數據,或者更詳細地查看某些部分。 例如,切片和切塊功能允許您按週檢查數據,然後按月檢查,然後按天檢查。 無需等待報告,切片和骰子可讓您主動並在需要時檢查特定數據。

SQL

SQL 發音為“sequel”,是一種用於從數據庫獲取信息的通用編程語言。 如果你說英語,數據庫會說 SQL,它只知道如何回答以這種方式表達的問題。 當然,除非您的商業智能軟件具有自然語言查詢 (NLQ),它可以讓您以與搜索引擎相同的方式提問。

你想知道的術語……

或者你認為這會讓這份名單的讀者受益嗎? 在下面的評論中讓我知道它們。 理想情況下,評論部分可以成為人們請求定義並由我提供定義的另一個地方。

如果您想了解這些條款如何更好地幫助您,請查看 Capterra商業智能軟件目錄中的選項之一,並與供應商聯繫。