什么是机器学习? 您的基本商业智能词汇表
已发表: 2022-05-07我一直认为春季大扫除太少,太晚。 对我来说,一月是你订购、优先考虑并开始回答来年问题的时候。 这就是为什么我选择一月份来回答一个你可能已经有一段时间的问题:什么是机器学习?
我会回答这个问题,并定义一些您需要了解的其他术语,以保持在 2017 年的领先地位。如果您对商业智能软件可以为您做什么感兴趣,您需要先了解这些基本术语.
我将机器学习放在首位,因为它是 Gartner 的2017 年十大战略技术趋势之一,但其余条目按字母顺序排列。
机器学习
在机器学习之前,必须告诉(编程)计算机如何思考。 通过机器学习,计算机可以(某种程度上)自己思考。
我最近与 BI 软件公司AnswerRocket的机器学习主管 Michael Finley 进行了交谈,他帮助详细说明了这一点。 在机器学习之前,大多数软件“按照编程的方式运行:人们将指令转化为计算机代码,然后计算机按照代码的指示去做。” 一个非常简单的例子是计算器:你输入计算器数字,告诉它要做什么(加,减),然后计算器给你结果。 然而,通过机器学习,软件可以适应。 Finley 继续说道:“具有机器学习功能的软件在您安装它的当天所执行的操作与您运行它的第十天或第一百天执行的操作不同。” 如果输入计算机的值发生变化,软件将适应这些值。 具有机器学习功能的计算机学习如何整合它们。
Finley 将机器学习描述为知道如何处理“喜欢”概念的软件,例如“我想听一首我刚刚听到的最后一首歌曲”。 这个概念对人来说很容易,但对计算机来说却很难。 Finley 解释说,计算机擅长理解哪些数字更大或更小,以及匹配数字和名称,但它们在相似性的概念上遇到了困难。 机器学习帮助计算机理解为什么一件事与另一件事“相似”。 机器学习对相似性的掌握在预测客户需求方面特别有帮助。
机器学习是您在 Pandora 上听到的下一首歌曲或 Netflix 推荐的电影的幕后推手。 Pandora 和 Netflix 的机器学习算法会“提供”您的选择(在 Pandora 的案例中是实际的“喜欢”),并使用它来预测您可能喜欢哪些类似的歌曲或节目。
为这些机器学习算法提供不同的数据,它们会做出不同的反应。 如果您通常的恐怖电影饮食突然莫名其妙地包含浪漫喜剧,Netflix 的 ML 算法将对该数据做出反应,并开始推荐其他浪漫喜剧或恐怖浪漫。
撇开电影品味下降不谈,为什么机器学习对中小企业很重要? 它可以帮助他们与更大的竞争对手竞争。 每次刷新时,具有机器学习功能的 BI 软件都会获取新的数字。 您不是基于年度报告的数字制定战略,而是基于近乎实时的信息以及知道如何适应不断变化的数据的算法。 Finley 解释说,企业扩展业务规模的传统、同质方式可以通过 ML 彻底改变:
“我可能已经制定了最佳实践并希望重复流程。 但是,如果您每天都可以制定最佳实践,如果您有信息可以每天更改它们并重新制定策略,那会怎样? 由于机器学习可以每天重写策略,您可以获得数据,这就是中小型企业真正吃大公司午餐的方式。”
对于对敏捷业务战略感兴趣的中小型企业来说,机器学习可能不仅仅是一种维持生计的方式。 这可能是开始占据老牌企业部分市场份额的一种方式。
- 即席分析
- 即席查询
- 高级分析
- 人工智能
- 大数据
- 上下文数据
- 数据点
- 数据质量
- 数据可视化
- 数据仓库
- 数据库
- 仪表板
- 向下钻取
- ETL
- 元数据
- 指标
- 现代商业智能
- 传统商业智能
- SaaS/云软件
- 切片法
- SQL
- 你想知道的术语……
即席分析
即席分析是在您需要时进行的分析,其水平非 IT、非专家可以理解。
如果可访问的商业智能似乎是一件显而易见的事情,它并不总是可以实现的。 长期以来,BI 专业人员必须能够“说计算机”(即用编码语言编写)来查询商业智能程序。 不知道如何使用 SQL、R 或 Python 编写代码? 问问 IT 部门的人。 然后等待。 然后等待商业智能程序运行,然后再等待分析。
值得庆幸的是,BI 终于成熟到了即席分析。 :使用此系统,您无需等待 IT 人员,也无需等待较慢的传统报告生成速度,即可获得必要的数据。 它使您和他们的工作更轻松,压力更小。
如果您没有 IT 人员,即席分析可以解决这个问题。 即席分析还可以缩短获得洞察的时间(这是您可能会看到的另一个流行词;这意味着获得所需信息需要更短的时间)。
即席查询
“查询”是您可能要求您的商业智能软件回答的问题。 例如,您可能会要求您的 BI 软件按字母顺序列出自 1970 年以来出生的所有棕色眼睛客户。您可以很容易地将查询称为问题,但您在对话中说出“查询”的频率是多少?
即席查询是您可以在需要时提出的查询。 与旧的业务分析一样,旧的查询需要 IT 人员来询问。 查询也往往作为您每月或每年获得的定期报告的一部分进行。 使用较旧的 BI 软件,您必须使用编程语言提出该查询。 SQL 是商业智能的一项长期标准。 现在,R 和 Python 很流行。
您可以将包括 BI 在内的计算机程序视为官僚机构的分支,从 DOJ 到 HHS。 他们在技术上是为了完成事情,但每个人都有自己的语言,并以自己特定的方式工作。 程序员就像会说语言并且知道如何导航每个程序/部门的官僚。
高级分析
这个术语实际上超越了商业智能。 “商业智能”传统上用于分析发生的事情。 高级分析更进一步,无论是预测未来会发生什么,还是分析通常与商业智能无关的细节和因素。 高级分析的一些示例是数据和文本挖掘、预测分析、预测、位置分析、情绪分析和机器学习。
人工智能
机器学习是人工智能的一部分,但人工智能是一个更大的概念。 人工智能包括任何你可以称之为“机器展示的智能”的东西。 人工智能意义上的“智能”是指完成某事的能力。 因此,将“智能”理解为仅仅知道很多东西并不是人工智能中的那种智能。
人工智能可以完成的“事情”已经多种多样。 例如, Daisy Intelligence使用人工智能检查零售商的数据,然后提出他们声称可以“将销售额增长 5% 或更多”的建议。 如果您像我一样喜欢在 DMV 等候,那么像Amy这样可以根据与会者的喜好安排会议的虚拟助手可能是您最好的新朋友。
大数据
大数据是极其庞大的数据集。 尽管我通常同意斯蒂芬金的观点,“通往地狱的道路是用副词铺成的”,但“非常”是有道理的。 例如,少量数据将是一本短书。 第一部《哈利波特》书籍的 PDF 大约是 1 兆字节 (MB)。
大数据类似于 PB 的数据。 继续本书的示例,自记录历史开始以来,所写的所有内容都是 50 PB 。 像谷歌这样的大型公司是那种处理 PB 的公司。 谷歌的 Mesa 系统监控谷歌的广告流量,跟踪 PB 级的数据。
上下文数据
上下文数据是关于人、地点或事件(在 dataspeak 中称为“实体”)的附加数据。 上下文数据有助于完善企业对潜在客户的了解,甚至预测他们可能想要什么。
尽管这不是一门生意,但英格兰曼彻斯特大学在其招生过程中使用上下文数据来“全面全面地了解你的成就和潜力”。 除了学生的录取表格,UM 还会考虑候选人的邮政编码、您参加考试的学校的质量以及“您是否已经被照顾或照顾超过三个月”等因素。
对于企业而言,上下文数据可能有助于销售。 举一个非常广泛的例子,过去客户的上下文数据,基于他们所在位置的天气,可以增加收入。 与明尼苏达州国际瀑布市的顾客相比,亚利桑那州图斯康的顾客更有可能在 10 月份购买冰棒。
数据点
数据点是单个数据片段。 数据点是您跟踪的数据中的任何独立单元或数据。 单个数据点可以是从“投资规模”到单击您在 Google 上购买的广告的任何内容。 在 Uber 的例子中,位置是一个重要的数据点——一个非常重要的数据点,他们在你的乘车完成后实际上会跟踪它。
如果您熟悉关键绩效指标,那么您就熟悉数据点。 KPI 衡量某些类型的数据点,例如收入或完成项目所需的时间。
数据质量
数据质量是衡量数据有用性的指标。 高质量的数据是干净的、有组织的和可用的。 如果图书馆的数据就是它的书籍,那么拥有高质量数据的图书馆就会将人们想要和需要的书籍保存在正确的位置,而且状况良好。
数据质量有六个维度:
- 完整性
- 独特性
- 有效性
- 时效性
- 一致性
- 准确性
数据可视化
数据可视化是显示数据的任何图像、视觉对象或图形。 饼图和条形图将是最常见的类型。 不过,那里有更广泛的可视化。 Gartner 的2016 年商业智能和分析平台评估标准(受付费墙保护;值得)将更高级的图表类型列为在您的 BI 解决方案中寻找的“首选”项目。 要寻找的一些更高质量的首选图表类型是:
- Marimekko 图表
- X/Y 图表
- 网络图
- 帕累托图
- 词云
数据仓库
数据仓库是保存和组织来自各种数据库和事务系统的数据的计算机系统。 您经常会在前面看到带有“企业”的术语,因为您需要大量的企业级数据才能需要数据仓库。
数据库
数据库是经过组织的数据,因此您可以轻松获得所需的内容。 去过IMDB吗? 你当然有。 那是一个数据库:电影、演员、导演、制片人,所有这些都是为了便于搜索而组织起来的,就像你需要在凯文培根六度游戏中作弊时一样。
仪表板
该图片在此说明之前,因为它更容易显示仪表板的外观。
对于正式定义:仪表板是您正在跟踪的数据的可视化表示。 您的 BI 程序绝对需要有一个仪表板。 你不会买没有仪表板的汽车。 BI 软件也是如此。
当您购买 BI 软件时,请确保您的程序仪表板具有Gartner 推荐的这两个基准标准(受付费墙保护;值得):
- “无需第三方选项、编码或脚本,即可设计具有至少基本图表类型(包括表格、条形图、折线图、面积图和饼图)的仪表板的能力。”
- “所见即所得 (WYSIWYG) 设计”,即在不知道如何编码的情况下设计仪表板和分析数据的能力。
向下钻取
向下钻取是指获取一般信息(如年度销售数据)并按月、周甚至天向下钻取的能力。 “向下钻取”意味着您可以从一般情况缩小到通常在信息和洞察力之间产生差异的细节。 深入研究有点像那部古老的“十的力量”电影的商业智能版本。
ETL
ETL(或提取、转换、加载)发生在数据收集和将数据放入数据仓库之间。
“提取”的需求来自这样一个事实,即数据在进入数据仓库之前就已在数据库或ERP 软件中收集。 转换的需要来自于这样一个事实,即这些多个数据源通常具有不同的格式,并且需要转换为适当的格式以便在数据仓库中存储和搜索。 加载的需要是不言自明的; 您必须先将其放入数据仓库,然后才能搜索并比较一个数据源与另一个数据源。
元数据
元数据是关于数据的数据。 如果这听起来,元,它是......它是元数据!
不过实话说。
元数据是关于您的数据的信息。 分为三类:
- 技术:关于您的数据的技术细节,例如其模型、格式和度量。
- 业务:以用户友好的术语(即简单的英语)对数据进行描述
- 过程:数据告诉你对哪些数据做了什么,什么时候做的。
指标
“公制”只是您测量的任何事物的一个花哨的词。
你在跟踪你的净利润吗? 那是一个指标。 密切关注贵公司有多少人在使用 BI 软件? 这也是一个指标。 密切关注对话率? 这也是一个指标。 指标的诀窍是选择最适合您公司的指标。 每个公司都有不同的需求,在选择指标时考虑您的需求和优先级是个好主意。
现代商业智能
现代商业智能一词来自Gartner ,他这样定义它:
现代 BI 平台支持支持 IT 的分析内容开发。 它由一个独立的架构定义,使非技术用户能够自主执行从数据访问、摄取和准备到交互式分析和协作共享见解的全方位分析工作流程。
简而言之,现代 BI 将业务用户放在首位。 您不需要依赖 IT 部门的人,或者您需要更少地依赖他们来使用现代 BI 程序。 例如,在传统的、较旧的 BI 程序设置为仅允许 IT 人员创作内容的情况下,现代 BI 程序使业务用户可以轻松地自己创建内容。
传统商业智能
传统的商业智能计划严重依赖 IT 人员。 他们通常要求用户了解 SQL(一种编程语言,见下文),并且获得答案需要更长的时间,因为您必须手动输入该语言的多个查询。 因此,它们的敏捷性要低得多,像Gartner 这样的专家建议买家转而寻找现代 BI 程序中的那种功能。
SaaS/云软件
软件即服务是一种购买者购买许可证来使用软件的模式,而不是购买和安装它。 大多数 SaaS 软件是通过互联网(即在云中)完成的,这降低了购买和安装的前期成本。 它还消除了监视软件所在服务器的需要; SaaS 公司会跟踪任何潜在的中断。
切片法
对大型数据集进行切片和切块,以便从不同的角度查看数据,或者更详细地查看某些部分。 例如,切片和切块功能允许您按周检查数据,然后按月检查,然后按天检查。 无需等待报告,切片和骰子可让您主动并在需要时检查特定数据。
SQL
SQL 发音为“sequel”,是一种用于从数据库获取信息的通用编程语言。 如果你说英语,数据库会说 SQL,它只知道如何回答以这种方式表达的问题。 当然,除非您的商业智能软件具有自然语言查询 (NLQ),它可以让您以与搜索引擎相同的方式提问。
你想知道的术语……
或者你认为这会让这份名单的读者受益吗? 在下面的评论中让我知道它们。 理想情况下,评论部分可以成为人们请求定义并由我提供定义的另一个地方。
如果您想了解这些条款如何更好地帮助您,请查看 Capterra商业智能软件目录中的选项之一,并与供应商联系。