教師なし学習と教師なし学習:どの機械学習モデルがあなたに適していますか?

公開: 2022-05-07

機械学習は神秘的である必要はありません。 この記事では、最も一般的な2つのタイプとそのユースケースを分類します。

互いにデータを共有する人と機械

ビジネスリーダーとして、新しいテクノロジーを採用することで問題点を軽減し、ビジネスの競争力を高めることができることをご存知でしょう。 そのため、1年間の混乱の中で、多くの企業がデジタルトランスフォーメーションを利用して成功を収めました。

また、機械学習など、ビジネスを将来にわたって利用できるようにする可能性のある新しいテクノロジーの可能性を認識している場合もあります。 ただし、購入者は注意してください。機械学習のアプリケーションを理解していないと、使用できない結果にお金を浪費するリスクがあります。 以下の例を見て、私たちの意味を確認してください。

この記事を書く準備をするために、自然言語生成(NLG)ツールを使用して、教師なし学習と教師なし学習を最適に分類する方法を理解しました。 これは、NLGの対応物からの抜粋です。

「教師なし学習モデルはそれぞれ、相関係数、誤検出応答、統計的に有用なデータが非常に少ない(またはそれに大きく依存している)ことに基づいて事前のテンソロン行列を提供し、グラフとツリーを使用して独自の限界データポイントを生成する次元削減に使用されます。」

混乱している? 私たちも。 しかし、NLGツールの文の構文が途方に暮れているにもかかわらず、人工知能(AI)を使ったこの実験は完全に役に立たなかったわけではありません。 AIから最高の結果を得るには、適切なアプリケーションを見つけることが重要であることに気づきました。そのため、このガイドを作成しました。

Fast DataScienceのデータサイエンスコンサルタントであるThomasWoodと話をしました。彼は、わかりやすい言葉でトピックを分類するのを手伝いました。 Woodの助けを借りて、2つの一般的な機械学習方法、教師なし学習と教師なし学習の違い、およびそれぞれの方法に最適なユースケースについて説明します。

機械学習は初めてですか? この記事の残りの部分に飛び込む前に、これらの重要な概念を確認してください。

  • 機械学習(ML)は、アルゴリズムと統計モデルを使用して問題を解決し、データから知識を抽出する人工知能(AI)のサブセットです。 大まかに言えば、すべての機械学習モデルは、教師なし学習と教師なし学習に分類できます。
  • 機械学習のアルゴリズムは、データに対して実行されて機械学習モデルを作成する手順です。
  • 機械学習のモデルは、データに対して実行される機械学習アルゴリズムの出力です。 つまり、モデルは機械学習アルゴリズムによって学習されたものを表します。

教師なし学習と教師なし学習の主な違いは何ですか?

要約すると、次のようになります。教師あり学習と教師なし学習の主な違いは、教師あり学習ではラベル付きデータを使用して結果を予測しますが、教師なし学習では使用しないことです。

ただし、2つのアプローチの間には追加のニュアンスがあり、状況に最適なアプローチを選択できるように、引き続き明確にします。

教師あり機械学習の仕組み

上で述べたように、教師あり学習はラベル付けされたデータを使用してモデルをトレーニングします。 しかし、それは理論的にはどういう意味ですか? いくつかの例を見ていきましょう。

教師あり学習では、モデルに入力と対応する出力の両方が提供されます。 さまざまな種類の果物を識別して分類するためにモデルをトレーニングしているとします。 この例では、果物のいくつかの写真を、その形状、サイズ、色、およびフレーバープロファイルとともに入力として提供します。 次に、出力として各果物の名前をモデルに提供します。

最終的に、アルゴリズムは果物の特性(入力)とその名前(出力)の間のパターンを取得します。 これが発生すると、モデルに新しい入力を提供でき、出力が予測されます。 分類と呼ばれるこの種の教師あり学習は、最も一般的です。

教師なし機械学習の仕組み

逆に、教師なし学習は、ラベルのないデータからモデル自体(したがって教師なし)を識別するようにモデルを教えることによって機能します。 これは、入力は提供されますが、出力は提供されないことを意味します。

これがどのように機能するかを理解するために、上記の果物の例を続けましょう。 教師なし学習では、モデルに入力データセット(果物の写真とその特性)を提供しますが、出力(果物の名前)は提供しません。

モデルは、適切なアルゴリズムを使用して、果物をそれらの間の最も類似した特徴に従って異なるグループに分割するようにトレーニングします。 クラスタリングと呼ばれるこの種の教師なし学習は、最も一般的です。

2つの機械学習モデルをもう一度実行する必要がありますか? 高レベルの説明については、この短いビデオをチェックしてください。

教師あり学習と教師なし学習はいつ使用する必要がありますか?

教師なし学習を使用するか、教師なし学習を使用するかは、目標と、利用可能なデータの構造と量によって異なります。 決定を下す前に、データサイエンティストに次のことを評価してもらいます。

  • 入力データはラベルなしまたはラベル付きのデータセットですか? ラベルが付いていない場合、チームは追加のラベルをサポートできますか?
  • あなたが達成したい目標は何ですか? 繰り返し発生する明確に定義された問題を処理していますか、それともアルゴリズムが新しい問題を予測する必要がありますか?
  • データの量と構造をサポートするアルゴリズムはありますか? それらはあなたが必要とする同じ次元(特徴または属性の数)を持っていますか?

教師あり機械学習を使用する場合

Gartnerによると、教師あり学習は、ビジネスシナリオで最も人気があり、最も頻繁に使用されるタイプの機械学習です。 これは、ビッグデータの分類が教師あり学習では実際の課題になる可能性があるものの、結果は非常に正確で信頼できるものであるためと考えられます(クライアントは完全なソースを利用できます)。

教師あり学習のユースケースの例を次に示します。 業界固有のものもあれば、どの組織にも適用できるものもあります。

  • 病気の危険因子を特定し、予防策を計画する
  • 電子メールがスパムであるかどうかの分類
  • 住宅価格の予測
  • 顧客離れの予測
  • 降雨と気象条件の予測
  • ローン申請者が低リスクか高リスクかを調べる
  • 自動車エンジンの機械部品の故障の予測
  • ソーシャルメディアのシェアスコアとパフォーマンススコアの予測

ウッドは、クライアントの受信メール用のトリアージシステムを構築するために、教師あり学習をどのように使用したかの例を私たちと共有しました。 CRMシステムの助けを借りて、電子メールは一般的なクエリ(たとえば、顧客の住所変更、苦情)を表すグループに分類されました。 次に、Woodはこれらのカテゴリを使用してモデルをトレーニングし、新しい受信メールを受信したときに、そのメールを割り当てるカテゴリを認識できるようにしました。 彼は言う:

「この場合、モデルをトレーニングするための一連の「ラベル」を提供するCRMシステムが存在するため、教師あり学習が可能でした。 これらがなければ、教師なし学習しかできなかったでしょう。」

受信トレイをクリーンアップしたいですか? CRMソフトウェアを使い始めましょう。

教師なし機械学習を使用する場合

教師あり学習とは対照的に、教師なし学習は大量のデータをリアルタイムで処理できます。 また、モデルはデータの構造を自動的に識別(分類)するため、人間が自分でデータ内の傾向を見つけるのに苦労する場合に役立ちます。

たとえば、マーケティングの目的で潜在的な消費者をグループに分割しようとしている場合、教師なしクラスタリング手法は優れた出発点になります。

教師なし学習のユースケースの例を次に示します。

  • 購入行動による顧客のグループ化
  • 顧客データの相関関係を見つける(たとえば、特定のスタイルのバッグを購入する人は、特定のスタイルの靴にも興味があるかもしれません)
  • 購入履歴によるデータのセグメント化
  • さまざまな興味に基づいて人々を分類する
  • 製造および販売指標による在庫のグループ化

ウッドは、かつて世界中に製造施設を持つ製薬会社で働いていたと説明しました。 同社が施設で発生したエラーを記録するために使用したソフトウェアには、一般的なエラーオプションを選択できるドロップダウンメニューがありませんでした。

このため、工場労働者はエラーをプレーンテキスト(英語または現地の言語)で文書化しました。 同社は、一般的な製造上の問題の原因を知りたいと考えていましたが、エラーの分類がなければ、データの統計分析を実行することはできませんでした。

Woodは、教師なし学習アルゴリズムを使用して、エラーの共通点を発見しました。 彼は最大のテーマを特定し、会社の一般的な製造問題の円グラフの内訳などの統計を作成することができました。 ウッドは言う:

「これにより、会社は、さもなければかなりの手作業を必要とするであろう彼らのビジネスにおける問題の概要を一目で知ることができました。」

スマートな未来に備える:機械学習を受け入れる

機械学習は、ビジネス上の問題を解決し、データに基づいた意思決定を行うのに役立つ強力なツールです。 この記事が、教師なしまたは教師なしの機械学習を組織でどのように実装できるかについてのアイデアを提供してくれることを願っています。

機械学習テクノロジーを採用する準備ができている場合、次のステップは、現在のソフトウェアスタックの機能を評価することです。 次に、機械学習を使用するアプリケーションに対応する、業界の他のクライアントのユースケースをベンダーに問い合わせます。

学ぶべきことがもっとあるように感じますか? Capterraからのこれらの関連する読みをチェックしてください:

  • 機械学習とは何ですか? エッセンシャルビジネスインテリジェンスの用語集
  • 機械学習と人工知能に関する知識豊富なスモールビジネスガイド
  • 中小企業のための人工知能のトップアプリケーション

また、Capterraの機械学習ソフトウェアディレクトリをチェックしてください。ここでは、実際のユーザーからのレビューを読んだり、ツールを価格や機能でフィルタリングしたりできます。