市民データサイエンティストになるための4つの簡単なステップ

公開: 2022-05-07

市民データサイエンティストとは何ですか?

データサイエンティストのトレーニングなしで、(一部の)データサイエンティストレベルの作業を行うことができる人。

ビジネスインテリジェンスソフトウェアを使用して、統計学博士号を持っていなくても、クラスタリング、セグメンテーション、および高度なデータブレンディングを実行できるワーカー。

言い換えると? 市民データサイエンティストは、すべての企業の友好的な近所のユニコーンです。

正式な定義が必要な場合、Gartnerは、市民データサイエンティスト(CDS)を「高度な診断分析または予測および処方機能を使用するモデルを作成または生成するが、その主な職務は統計および分析の分野外である人」と定義しています。 」

多くの場合、「統計と分析の分野外」とは、CDSがビジネスアナリストであることを意味します。つまり、イニシアチブの組み合わせからこれらの高レベルのモデルを作成することを学んだビジネスアナリストです(変数xを見つけることができれば、私たちの収入を増やすことができます)そして必要性(私たちのデータサイエンティストは計画期間なしで教師と同じくらい過大な負担をかけられます)。

データサイエンティストは、ビジネスをよりデータ主導型にするという要求にますます課税されるようになっているため、市民データサイエンティストは、次の2つの重要な方法でビジネスを支援できます。

  • 適切なビジネスインテリジェンスソフトウェアを使用してより単純なデータサイエンスタスクを実行することにより、データサイエンティストの負荷を軽減できます。
  • 彼らは、データサイエンスに部外者のビジネス側の視点をもたらすことができます。

幸いなことに、市民データサイエンティストになるには、学位は必要ありません。また、1年間のトレーニングも必要ありません。 それは仕事を必要とします、しかし利点は仕事を価値のあるものにします。 市民データサイエンティストになることに興味がある場合は、次の4つのステップでその道を歩み始めることができます。

1.より多くの新しいデータソースへのアクセスを要求します。

同じ古いレポートから同じ古いデータを処理することにうんざりしている場合は、市民データサイエンティストのかゆみがあり、通常のレポートに含まれていないデータへのアクセスを上司に依頼する時期かもしれません。と情報。

データサイエンティスト以外の人にデータへのアクセスを開放すると、市民データサイエンスから得られる強みと利点を確認できます。 IBMは、データを非常にユニークな市民データサイエンティストのグループに拡大することで、2016年のウィンブルドントーナメントを情報のライブラリに変えました。 コンピューターの巨人は、テニスの専門家がデータ分析プログラムであるWatsonAnalyticsを使用できるようにしました。 その結果、プレーヤーのパフォーマンスに対する前例のない洞察が得られました。 Watson Analyticsは、ボールが着地した場所と同じくらい小さいデータポイントを使用して、プレーヤーのスタイルが変更されたかどうかを判断することができました。

データサイエンスの学位を持たない人々へのアクセスを拡大することも驚くほど簡単でした。実際、プロレベルのテニスの複雑さを理解するためにデータサイエンティストをトレーニングするよりも、プロのアスリートにデータサイエンスソフトウェアを使用するようにトレーニングする方が簡単でした。 さらに良いことに、それは専門家レベルの知識を持つ人々のグループが、他の方法ではアクセスできないデータサイエンスの分野に貢献できることを意味しました。

2.高度な分析機能とスマートデータ検出を備えたビジネスインテリジェンスソフトウェアの使用方法を学びます。

新しい洞察を得るための新しいデータソースを入手したら、データサイエンスや統計学の博士号を持たない人が高レベルのデータサイエンスを可能にするツールの使用方法を知る必要があります。

市民データサイエンティストとしてあなたを可能にするソフトウェアにどのような機能を探すべきですか?

  • 高度なセルフサービスデータの準備
  • 行動分析
  • グラフ分析
  • ロケーション分析
  • Web分析
  • スマートデータディスカバリー

高度なセルフサービスデータの準備は、シアーズがビジネスインテリジェンスアナリストを市民データサイエンティストに変えるのにすでに役立っています。 シアーズは、Platforaのビッグデータ検出ソフトウェアソリューションに投資し、400人のアナリストへのアクセスを許可しました。 その結果、アナリストは顧客セグメンテーション(通常は高度なデータサイエンスアクション)を使用して、SearsWebサイトでの顧客向けの製品推奨を改善することができました。

ビジネスインテリジェンスベンダーのAlteryxは、複雑なデータブレンディングを行うための使いやすいビジュアルツールを提供しています。 さまざまなタイプのデータ(たとえば、ExcelファイルとOracleファイル)を組み込むために新しいデータセットを作成する必要はなく、Alteryxのドラッグアンドドロップ機能を使用して、その長いデータサイエンスタスクを数回のクリックに減らすことができます。ねずみ。

PlatforaやAlteryxと同様に、Paxataのソフトウェアは高度なデータ分析を実現します。 PaxataのFarnazErfanと話をしました。彼は、顧客の1人である消費者向けパッケージ商品会社がどのようにしてPhDレベルの活動をアナリストにもたらしたかについて説明しました。

Paxataは、データサイエンティストの助けを必要としない、「アナリスト向けの完全なセルフサービスパラダイム」を作成しました。 同社はセルフサービスソリューションを使用して、在庫、供給、およびマーケティングを改善しました。 たとえば、Paxataを使用すると、「ビジネスアナリストが通過時間データを準備するのにかかる時間が月に5時間から1時間未満に短縮されました」。 もう1つの節約の源は、「問題のある電子メールアドレスを特定して照合することでクーポン詐欺を検出する」機能です。

高度な分析の使用法を学ぶことには多くの利点がありますが、学習曲線もあります。 とはいえ、それほど圧倒的ではありません。Gartnerの見積もりによると、速度を上げるのに1〜2週間しかかからないはずです。 ほとんどのベンダーは、一般的な質問への回答を含むトレーニング、チュートリアル、およびコミュニティフォーラムを提供しています。

3.ガバナンスが設定されていることを確認します

Mo'アクセス、mo'(データガバナンス)の問題。 または、ガバナンスを優先しない限り、そうなる可能性があります。 より多くの市民データサイエンティストがより多くのデータセットにアクセスするようになると、データが悪意のある人の手に渡る機会が増えます。

「データガバナンスは絶対に重要です」と、データサイエンスコンサルタント会社AcculationのCEOであるWernerKrebsは説明します。 「データが価値があることを理解し、データを収集するためのツールとフレームワークを提供できるように、従業員をトレーニングする必要があります」と彼は続けます。 幸い、総合品質管理からISO 9001、「さまざまなシックスシグマフレームワーク」まで、そのデータを整理するための複数のフレームワークがあります。

ガートナーは、データガバナンスにも同様の重点を置いています。「データ、その関係、および適切な使用法を理解する方法に関するガイダンスと同様に、適切なガバナンスが重要です。」

より多くの人がより多くのデータにアクセスできるようにすることには多くの価値がありますが、それらの人はデータにアクセスする方法とデータを安全に保つ方法を理解する必要があります(たとえば、セキュリティで保護されていないパブリックWi-Fiがあるエリアで機密文書を読みに行かないでください) )。

4.データの使用方法を監視する「保護者」が組織にいることを確認します

市民データサイエンティストのような新しい役割には、それを管理するための新しいルールと役割が必要です。 高度なデータ準備から得られるメリットは、ビジネス全体で再考および再編成する価値があります。 とはいえ、古いデータ管理の役割を取り除きたくはありません。

市民データサイエンティストの時代のデータ管理の経験則の1つは、古いガールスカウトの歌に要約されています。新しい友達を作りますが、古いものは維持します。 つまり、データスチュワードやデータベース管理者などの役割を維持するだけでなく、ガートナーの保護者の考え方などの新しい役割を追加して、市民のデータサイエンティストが必要なものを責任を持って使用できるようにします。

ガートナーは、「保護者」の役割を「データが工業化され、安全でスケーラブルであることを保証する」人々と定義しています。 言い換えれば、彼らはデータセキュリティを監督し、市民データサイエンスの成功例をビジネス全体で採用できることを認識している人々です。 また、従来のデータ管理の役割(Gartnerでは「オペレーター」と呼ばれます)と、新しい方法でデータを使用する市民データサイエンティスト(「イノベーター」)との間のギャップを埋めます。

市民データサイエンスをどのように使用しましたか?

あなたは市民データサイエンティストの役割を果たしていますか? 高度なデータ分析を使用して、ビジネスでお金を節約したり、お金を稼いだりしましたか? もしそうなら、下のコメントで知らせてください!