機械学習とは何ですか? エッセンシャルビジネスインテリジェンスの用語集

公開: 2022-05-07

私はいつも春の大掃除が少なすぎて遅すぎるのを見てきました。 私にとって、1月はあなたが注文し、優先順位を付け、そして来年の質問に答え始める時です。 だから私はあなたがしばらく持っていたかもしれない質問に答えるために1月を選んだのです:機械学習とは何ですか?

私はそれに答えます。また、2017年のトップを維持するために知っておく必要のある他のいくつかの用語を定義します。ビジネスインテリジェンスソフトウェアで何ができるかに興味がある場合は、最初にこれらの基本的な用語を知っておく必要があります。 。

ガートナーの2017年の戦略的テクノロジートレンドのトップ10の1つであるため、機械学習を最優先しましたが、残りのエントリはアルファベット順に並べられています。

機械学習

機械学習の前に、コンピューターに考え方を教える(プログラムする)必要がありました。 機械学習を使用すると、コンピューターは自分で(ある種の)考えることができます。

私は最近、BIソフトウェア会社AnswerRocketの機械学習の責任者であるMichaelFinleyと話をしました。 機械学習の前は、ほとんどのソフトウェアは「プログラムされた方法で実行されていました。人々は命令をコンピューターコードに変換し、コンピューターはそのコードが指示したとおりに実行しました」。 非常に簡単な例は電卓です。電卓の数値を入力し、何をするか(加算、減算)を指示すると、電卓から結果が得られます。 ただし、機械学習を使用すると、ソフトウェアを適応させることができます。 Finley氏は続けます。「機械学習を備えたソフトウェアは、インストールした日と、実行した10日目または100日目と同じことをしません。」 コンピュータに入力される値が変更された場合、ソフトウェアはそれらの値に適応します。 機械学習を備えたコンピューターは、それらを組み込む方法を学習します。

素晴らしいアンドレピントとアントヒルコミックの礼儀

Finleyは、機械学習を、「最後に聞いたような曲を聞きたい」のように、「いいね」の概念に対処する方法を知っているソフトウェアとして特徴づけています。 コンセプトは人にとっては簡単ですが、コンピューターにとっては難しいものです。 Finleyは、コンピューターはどの数字が大きいか小さいかを理解し、数字と名前を一致させるのは得意であるが、類似性の概念に苦労していると説明しました。 機械学習は、あるものが別のものに「似ている」理由をコンピューターが理解するのに役立ちます。 機械学習による類似性の把握は、顧客の要望を予測するのに特に役立ちます。

機械学習は、Pandoraで聞く次の曲、またはNetflixが提案する映画の背後にあります。 PandoraとNetflixの機械学習アルゴリズムは、あなたの選択(およびPandoraの場合は実際の「いいね」)を「供給」し、それを使用して、似たような曲やショーを楽しむことができるかどうかを予測します。

それらの機械学習アルゴリズムに異なるデータをフィードすると、反応が異なります。 ホラー映画の通常の食事に突然、不可解にロマンチックコメディが含まれている場合、NetflixのMLアルゴリズムはそのデータに反応し、他のロマンチックコメディまたはホラーロマンスを提案し始めます。

映画の趣味の低下はさておき、なぜ機械学習がSMBにとって重要なのですか? それは彼らがより大きな競争相手と競争するのを助けることができます。 機械学習を備えたBIソフトウェアは、更新するたびに新しい数値を取り込みます。 戦略は年次レポートの数値に基づいているのではなく、ほぼリアルタイムの情報と、その変化するデータに適応する方法を知っているアルゴリズムに基づいています。 Finleyは、ビジネスが何をするにしても、従来の均質な方法でMLを使用して革命を起こすことができると説明しています。

「私はベストプラクティスを提示し、プロセスを繰り返したいと思ったかもしれません。 しかし、ベストプラクティスを毎日レイアウトでき、それらを変更して戦略を毎日再構築するための情報があればどうなるでしょうか。 MLのおかげで、毎日戦略を書き直すことができるデータが得られます。それが、SMBが実際に大物の昼食を食べている方法です。」

アジャイルビジネス戦略に関心のあるSMBにとって、機械学習は生き続けるための方法以上のものかもしれません。 それは、確立されたプレーヤーの市場シェアの一部を取り始める方法かもしれません。

  • アドホック分析
  • アドホッククエリ
  • 高度な分析
  • 人工知能
  • ビッグデータ
  • コンテキストデータ
  • データポイント
  • データ品質
  • データの視覚化
  • データウェアハウス
  • データベース
  • ダッシュボード
  • ドリルダウン
  • ETL
  • メタデータ
  • 指標
  • 現代のBI
  • 従来のBI
  • SaaS/クラウドソフトウェア
  • スライスアンドダイス
  • SQL
  • 知りたい用語…

アドホック分析

アドホック分析は、ITや専門家以外の人が理解できるレベルで、必要なときに分析することです。

アクセス可能なビジネスインテリジェンスが必要なのは明らかなことのように思われる場合、それが常に達成可能であるとは限りませんでした。 長い間、BIの専門家は、ビジネスインテリジェンスプログラムを照会するために「コンピューターを話す」(つまり、コーディング言語で書く)ことができなければなりませんでした。 SQL、R、またはPythonでコーディングする方法を知りませんでしたか? ITの誰かに聞いてください。 その後、待ちます。 次に、ビジネスインテリジェンスプログラムが機能するのを待ってから、分析をもう少し待ちます。

ありがたいことに、BIはついにアドホック分析に成熟しました。 :このシステムを使用すると、必要なデータを取得するために、ITを待つ必要がなく、従来のレポートを作成するペースが遅くなります。 それはあなたの仕事と彼らの仕事をより簡単でストレスの少ないものにします。

ITスタッフがいない場合は、アドホック分析によってその問題を解決できます。 アドホック分析はまた、洞察までの時間を短縮します(これは、表示される可能性のある別の流行語です。つまり、必要な情報を取得するのにかかる時間が短くなります)。

アドホッククエリ

「クエリ」は、ビジネスインテリジェンスソフトウェアに回答を求める可能性のある質問です。 たとえば、BIソフトウェアに、1970年以降に生まれたすべての茶色の目の顧客のアルファベット順のリストを要求する場合があります。クエリを簡単に質問と呼ぶこともできますが、会話で「クエリ」と言う頻度はどれくらいですか。

アドホッククエリは、必要なときに要求できるクエリです。 古いビジネス分析と同様に、古いクエリではIT部門の誰かが質問する必要がありました。 クエリは、月次または年次ベースで取得する定期的なレポートの一部として行われる傾向もありました。 古いBIソフトウェアでは、プログラミング言語でそのクエリを実行する必要があります。 SQLは、ビジネスインテリジェンスの長年の標準の1つでした。 最近はRとPythonが人気です。

司法省からHHSまで、官僚機構の支部として、BIを含むコンピュータープログラムを見ることができます。 彼らは技術的には物事を成し遂げるためにそこにいますが、それぞれが独自の言語を持っており、独自の方法で機能します。 プログラマーは、言語を話し、各プログラム/部門をナビゲートする方法を知っている官僚のようなものです。

高度な分析

この用語は、実際にはビジネスインテリジェンスを超えています。 「ビジネスインテリジェンス」は、伝統的に何が起こったかを分析することを扱ってきました。 高度な分析は、将来何が起こるかを予測する場合でも、ビジネスインテリジェンスに一般的に関連付けられていない詳細や要因を分析する場合でも、さらに進んでいます。 高度な分析の例としては、データとテキストマイニング予測分析予測場所分析感情分析、機械学習などがあります。

人工知能

機械学習はAIの一部ですが、AIははるかに大きな概念です。 AIには、「機械が示す知能」と呼べるものがすべて含まれています AIの意味での「インテリジェンス」とは、何かを成し遂げる能力を意味します。 したがって、「インテリジェンス」をよく知っているという一般的な理解は、AIに見られるようなインテリジェンスではありません。

AIが実行できる「何か」はすでにさまざまです。 たとえば、デイジーインテリジェンスは、AIを使用して小売業者のデータを調べ、「売上を5%以上増やす」ことができると彼らが主張する推奨事項を作成します。 私のように、DMVで待つのと同じくらいスケジュールを楽しんでいる場合は、出席者の好みに基づいて会議をスケジュールできるAmyのような仮想アシスタントがあなたの最高の新しい架空の友達になる可能性があります。

ビッグデータ

ビッグデータは非常に大きなデータセットです。 私は通常、「地獄への道は副詞で舗装されている」というスティーブン・キングに同意しますが、「非常に」それは正当化されます。 少量のデータは、たとえば、短い本になります。 最初のハリーポッターの本のPDFは約1メガバイト(MB)です。

ビッグデータは、ペタバイトのデータのようなものになります。 本の例を続けると、記録された歴史の始まり以来、書かれたすべては50ペタバイトです。 グーグルのようなメガ企業は、ペタバイトを扱う種類です。 Googleの広告トラフィックを監視するGoogleのMesaシステムは、ペタバイト単位のデータを追跡します。

コンテキストデータ

コンテキストデータは、人、場所、またはイベントに関する追加データです(データスピークでは「エンティティ」と呼ばれます)。 コンテキストデータは、企業が潜在的な顧客について知っていることをまとめ、さらには彼らが何を望んでいるかを予測するのに役立ちます。

それはビジネスではありませんが、英国のマンチェスター大学は、入学プロセスでコンテキストデータを使用してあなたの成果と可能性の完全で丸みを帯びたビューを構築します」。 UMは、学生の入学許可書に加えて、候補者の郵便番号、試験を受けた学校の質、「 3か月以上世話をされているか世話をされているか」などの要素を考慮します。

ビジネスの場合、コンテキストデータが販売に役立つ可能性があります。 非常に広い例として、過去の顧客に関するコンテキストデータは、その場所の天気に基づいて、収益を促進する可能性があります。 アリゾナ州ツーソンの顧客は、ミネソタ州インターナショナルフォールズの顧客よりも10月にアイスキャンディーを購入する可能性が高くなります。

データポイント

データポイントは、データの1つのスクラップです。 データポイントは、追跡するデータの中の自己完結型のユニットまたはデータです。 単一のデータポイントは、「投資の規模」から、Googleで購入した広告のシングルクリックまで、何でもかまいません。 Uberの場合、場所は重要なデータポイントです。つまり、乗車後に実際に追跡することが非常に重要です。

主要業績評価指標精通している場合は、データポイントに精通しています。 KPIは、収益やプロジェクトの完了にかかる時間など、特定の種類のデータポイントを測定します。

データ品質

データ品質は、データの有用性の尺度です。 高品質のデータはクリーンで整理されており、利用できます。 図書館のデータがその本である場合、高品質のデータを備えた図書館には、人口が必要としている本が、良好な状態で適切な場所に保管されています。

データ品質には6つの側面があります。

  • 完全
  • 独自性
  • 有効
  • 適時性
  • 一貫性
  • 正確さ

データの視覚化

データの視覚化とは、データを表示する画像、ビジュアル、またはグラフィックのことです。 円グラフと棒グラフが最も一般的な種類です。 ただし、視覚化の範囲ははるかに広くなっています。 2016年のビジネスインテリジェンスおよび分析プラットフォームに関するGartnerの評価基準(ペイウォールで保護されている、それだけの価値がある)は、BIソリューションで探すべき「優先」アイテムとしてより高度なチャートタイプを評価します。 探すべき高品質で好ましいチャートタイプのいくつかは次のとおりです。

  • マリメッコチャート
  • X/Yチャート
  • ネットワークチャート
  • パレート図
  • ワードクラウド

データウェアハウス

データウェアハウスは、さまざまなデータベースやトランザクションシステムからのデータが保持および整理されるコンピュータシステムです。 データウェアハウスを必要とするためには大量のエンタープライズサイズのデータ​​が必要になるため、前面に「エンタープライズ」が付いた用語がよく見られます。

データベース

データベースはデータであり、必要なものを簡単に入手できるように編成されています。 IMDBに行ったことはありますか? もちろんあります。 それはデータベースです:映画、俳優、監督、プロデューサー、すべてが簡単に検索できるように編成されています。たとえば、六次の隔たりのゲームでカンニングをする必要がある場合などです

ダッシュボード

ダッシュボードがどのように見えるかを示すのが簡単なので、その写真はこの説明の前にあります。

正式な定義の場合:ダッシュボードは、追跡しているデータを視覚的に表したものです。 BIプログラムには、ダッシュボードが絶対に必要です。 ダッシュボードなしで車を買うことはありません。 同じことがBIソフトウェアにも当てはまります。

BIソフトウェアを購入するときは、プログラムのダッシュボードに、Gartnerが推奨する次の2つのベースライン基準があることを確認してください(ペイウォールで保護されています。価値があります)。

  • 「サードパーティのオプション、コーディング、スクリプトを必要とせずに、少なくとも、表、棒グラフ、折れ線グラフ、面グラフ、円グラフなどの基本的なグラフタイプを使用してダッシュボードを設計する機能。」
  • 「表示されるのは、取得したもの(WYSIWYG)の設計です」。これは、コーディング方法を知らなくても、ダッシュボードを設計してデータを分析する機能です。

ドリルダウン

ドリルダウンとは、年間売上高などの一般的な情報を取得し、月、週、または日ごとにドリルダウンする機能を指します。 「ドリルダウン」とは、情報と洞察を区別することが多い一般的なものから詳細なものに絞り込むことができることを意味します。 ドリルダウンは、その古い「PowersofTen」フィルムのビジネスインテリジェンスバージョンのようなものです。

ETL

ETL(または抽出、変換、読み込み)は、データ収集とそのデータのデータウェアハウスへの配置の間に行われます。

「抽出」する必要があるのは、データがデータウェアハウスに到達する前にデータベースまたはERPソフトウェア収集されるという事実にあります。 変換の必要性は、これらの複数のデータソースが多くの場合異なる形式であり、データウェアハウスに保存および検索するために適切な形式に変換する必要があるという事実から生じます。 ロードする必要性は自明です。 あるデータソースを別のデータソースと検索して比較する前に、データウェアハウスに配置する必要があります。

メタデータ

メタデータはデータに関するデータです。 それが聞こえるなら、メタ、それは…それはメタデータです!

しかし、真剣に。

メタデータは、データに関する情報です。 3つのカテゴリがあります。

  • 技術:モデル、形式、メジャーなど、データに関する技術的な詳細。
  • ビジネス:ユーザーフレンドリーな用語でのデータの説明(つまり、平易な英語)
  • プロセス:どのデータで何がいつ行われたかを示すデータ。

指標

「メートル法」は、あなたが測定しているものが何であれ、単なる空想の言葉です。

純利益を追跡していますか? それは指標です。 あなたの会社でBIソフトウェアを使用している人の数に注目していますか? これも指標です。 その会話率に注目していますか? これも指標です。 指標の秘訣は、会社に最適な指標を選択することです。 企業ごとにニーズは異なります。指標を選択する際には、ニーズと優先順位を考慮することをお勧めします

現代のBI

現代のビジネスインテリジェンスという用語は、 Gartnerから来てます。Gartnerはそれを次のように定義しています

最新のBIプラットフォームは、IT対応の分析コンテンツ開発をサポートします。 これは、技術者以外のユーザーがデータアクセス、取り込み、準備からインタラクティブな分析、洞察の共同共有まで、フルスペクトルの分析ワークフローを自律的に実行できるようにする自己完結型のアーキテクチャによって定義されます。

簡単に言えば、最新のBIはビジネスユーザーを第一に考えています。 最新のBIプログラムを使用するために、ITの誰かに依存する必要はありません。または、ITの誰かに依存する必要ははるかに少なくなります。 従来の古いBIプログラムは、IT担当者のみがコンテンツを作成できるように設定されていましたが、たとえば、最新のBIプログラムでは、ビジネスユーザーが自分でコンテンツを簡単に作成できます。

従来のBI

従来のビジネスインテリジェンスプログラムは、IT担当者に大きく依存しています。 通常、ユーザーはSQL(プログラミング言語、以下を参照)を知っている必要があり、その言語で複数のクエリを手動で入力する必要があるため、回答を得るのにはるかに長い時間がかかります。 そのため、アジャイル性ははるかに低く、 Gartnerのような専門家は、購入者が代わりに最新のBIプログラムに見られる種類の機能を探すことを提案しています

SaaS/クラウドソフトウェア

サービスとしてのソフトウェアは、購入者がソフトウェアを購入してインストールするのではなく、ソフトウェアを使用するためのライセンスを購入するモデルです。 ほとんどのSaaSソフトウェアは、インターネット(つまり、クラウド)を介して実行されるため、購入とインストールの初期費用が削減されます。 また、ソフトウェアが保管されているサーバーを監視する必要もなくなります。 SaaS会社は、潜在的な停止を追跡します。

スライスアンドダイス

大規模なデータセットをスライスおよびダイシングして、さまざまな視点からデータを確認するか、特定の部分をより詳細に確認します。 スライスおよびダイス機能は、たとえば、週、月、および個々の日ごとにデータをチェックできるようにする機能です。 レポートを待つ代わりに、スライスアンドダイスを使用すると、主導権を握り、必要なときに特定のデータをチェックアウトできます。

SQL

「続編」と発音されるSQLは、データベースから情報を取得するために使用される一般的なプログラミング言語です。 あなたが英語を話す場合、データベースはSQLを話し、そのように表現された質問に答える方法しか知りません。 もちろん、ビジネスインテリジェンスソフトウェアに自然言語クエリ(NLQ)がない限り、検索エンジンと同じように質問をすることができます。

知りたい用語…

それとも、このリストの読者に利益をもたらすと思いますか? 以下のコメントでそれらを知らせてください。 理想的には、コメントセクションは、人々が定義を要求し、私がそれらを提供するための別の場所になる可能性があります。

これらの用語がどのように役立つかを知りたい場合は、Capterraのビジネスインテリジェンスソフトウェアディレクトリにあるオプションの1つを確認して、ベンダーに連絡してください。