成为公民数据科学家的 4 个简单步骤
已发表: 2022-05-07什么是公民数据科学家?
无需数据科学家培训即可完成(某些)数据科学家级别工作的人。
可以使用商业智能软件进行聚类、分割和高级数据混合的工作者,即使他们没有统计学博士学位。
换句话说? 公民数据科学家是每个企业友好的邻里独角兽。
如果您想要一个正式的定义,Gartner 将公民数据科学家 (CDS) 定义为“创建或生成使用高级诊断分析或预测和规范能力的模型的人,但其主要工作职能不在统计和分析领域。 ”
在许多情况下,“在统计和分析领域之外”意味着 CDS 是一名业务分析师——一位业务分析师,他学会了从各种主动性的混合物中制作这些高级模型(如果我能找出变量 x,我可以增加我们的收入)和需求(我们的数据科学家就像没有计划期的老师一样负担过重)。
随着数据科学家越来越多地被要求使业务更加数据驱动,公民数据科学家可以通过两种关键方式帮助他们的业务:
- 他们可以通过使用正确的商业智能软件来完成更简单的数据科学任务,从而减轻数据科学家的负担。
- 他们可以为数据科学带来局外人的业务视角。
幸运的是,成为公民数据科学家不需要学位,甚至不需要一整年的培训。 它确实需要工作,但好处使这项工作值得。 如果您有兴趣成为一名公民数据科学家,以下四个步骤可以帮助您踏上这条道路。
1. 要求访问更多的新数据源。
如果您厌倦了处理来自相同旧报告的相同旧数据,那么您已经让公民数据科学家心痒痒了,可能是时候要求您的主管访问您的正常报告中未包含的数据和信息。
当您向非数据科学家开放数据访问权限时,您可以看到公民数据科学带来的优势和好处。 通过将数据扩展到一个非常独特的公民数据科学家群体,IBM 将 2016 年温布尔登锦标赛变成了一个信息库。 这家计算机巨头授权网球专业人士使用他们的数据分析程序 Watson Analytics。 结果是对球员表现的前所未有的洞察力。 Watson Analytics 能够使用小到球落地位置的数据点来确定球员的风格是否发生了变化。
扩大对没有数据科学学位的人的访问也非常容易——实际上,培训职业运动员使用数据科学软件比培训数据科学家了解专业网球的复杂性要容易得多。 更好的是,这意味着一群拥有专家级知识的人能够为原本无法进入的数据科学领域做出贡献。
2. 了解如何使用具有高级分析功能和智能数据发现的商业智能软件。
一旦您获得了新的数据来源以获得新的见解,您将需要知道如何使用这些工具,让没有数据科学或统计学博士学位的人能够使用高级数据科学。
作为公民数据科学家,您应该在软件中寻找什么样的功能?
- 高级自助数据准备
- 行为分析
- 图分析
- 位置分析
- 网络分析
- 智能数据发现
高级自助数据准备已经帮助 Sears 将其商业智能分析师转变为公民数据科学家。 Sears 投资了 Platfora 的大数据发现软件解决方案,授予 400 名分析师访问权限。 因此,分析师能够使用客户细分(通常是一种高级数据科学操作)来改进 Sears 网站上为客户提供的产品推荐。
商业智能供应商 Alteryx 提供了一个易于使用的可视化工具来进行复杂的数据混合。 无需创建新数据集来合并不同类型的数据(例如,Excel 文件和 Oracle 文件),您可以使用 Alteryx 的拖放功能将冗长的数据科学任务减少到单击几下鼠。
与 Platfora 和 Alteryx 一样,Paxata 的软件使高级数据分析成为现实。 我与 Paxata 的 Farnaz Erfan 进行了交谈,他描述了他们的一位客户,一家消费品公司,如何将博士级别的活动带给分析师。
Paxata 为分析师创建了“一个完整的自助服务范式”,不需要数据科学家的帮助。 该公司使用自助服务解决方案来改善库存、供应和营销。 例如,使用 Paxata “已将业务分析师准备运输时间数据的时间从每月 5 小时减少到不到 1 小时。” 另一个节省的来源是“通过识别和匹配违规电子邮件地址来检测优惠券欺诈”的能力。
虽然学习使用高级分析有很多好处,但也会有一个学习曲线。 话虽如此,这并不算太难:根据 Gartner 的估计,应该只需要一到两周的时间就可以加快速度。 大多数供应商都提供培训、教程和社区论坛,并提供常见问题的答案。
3. 确保建立治理
Mo'访问,mo'(数据治理)问题。 或者可能是这种情况,除非您将治理作为优先事项。 随着更多公民数据科学家访问更多数据集,数据有更多机会落入坏人之手。
“数据治理绝对是关键,”数据科学咨询公司 Acculation 的首席执行官 Werner Krebs 解释道。 “你必须培训你的员工了解数据的价值,并帮助他们提供工具和框架来帮助他们收集数据,”他继续说道。 幸运的是,有多种框架可以组织这些数据,从全面质量管理到 ISO 9001 再到“各种六西格玛框架”。
Gartner 对数据治理也同样强调:“适当的治理至关重要,就如何理解数据、数据的关系和适当的使用提供指导也是如此。”
让更多人访问更多数据有很多价值,但这些人需要了解如何访问数据,以及如何确保数据安全(例如,不要在公共 Wi-Fi 不安全的区域阅读敏感文档)。
4. 确保您的组织有“监护人”监督您如何使用数据
像公民数据科学家这样的新角色需要新的规则和角色来管理它。 您可以从高级数据准备中获得的好处绝对值得在整个企业范围内重新思考和重组。 也就是说,您不想摆脱旧的数据管理角色。
旧的女童子军歌曲总结了公民数据科学家时代数据管理的一条经验法则:结交新朋友,但保留旧朋友。 换句话说,保留像数据管理员和数据库管理员这样的角色,但也要增加新的角色,比如 Gartner 的守护者理念,以确保公民数据科学家能够负责任地使用他们需要的东西。
Gartner 将“监护人”角色定义为“确保数据可以工业化、安全和可扩展”的人。 换句话说,他们是监督数据安全的人,并且还要确保公民数据科学的成功实例可以被整个企业采用。 他们还弥合了传统数据管理角色(Gartner 称其为“运营商”)和以新方式使用数据的公民数据科学家(“创新者”)之间的差距。
您如何使用公民数据科学?
你扮演公民数据科学家的角色吗? 您是否使用高级数据分析来帮助您的企业省钱或赚钱? 如果是这样,请在下面的评论中告诉我!