機械学習とは?
仕組みや活用例までわかりやすく解説

機械学習とは、AIの発達を支えている重要な技術のひとつです。この記事では機械学習の仕組みやAI・ディープラーニングとの違い、代表的なアルゴリズム、機械学習の活用事例などについて解説します。

目次

1.機械学習とは?

  • AIと機械学習の違い
  • ディープラーニングと機械学習の違い
  • 機械学習が発展するとどうなるのか

2.機械学習の3つの学習方法とその仕組み

  • 教師あり学習
  • 教師なし学習
  • 強化学習

3.機械学習のアルゴリズム・手法

  • ニューラルネットワーク
  • k近傍法
  • 決定木+ランダムフォレスト
  • サポートベクターマシン

4.機械学習の活用事例3選

  • 売り上げの需要予測・回帰分析
  • 画像・音声データの認識
  • 業務の自動化

5.機械学習 まとめ

1. 機械学習とは?

機械学習とは、コンピューターが自動的に学習を行い、複数のデータ間に見られるルールやパターンを分析する技術のことです。

まずは、機械学習と混同されやすい用語であるAIやディープラーニングとの違いについて解説します。

AIと機械学習の違い

AIとは「Artificial Intelligence」の頭文字を取った略称で、日本語では人工知能と訳されます。人間が行う認識や思考といった知的活動を、コンピューターで再現した技術の総称としてAIと呼ばれており、柔軟なデータ分析機能や文章生成機能などを持つシステムとして、様々なAIが開発・実用化されています。

一方、機械学習は、用意したサンプルデータ等に対しコンピューターが自動的に試行錯誤を重ね、トレーニングを行う技術です。AIを開発するために用いられている技術であり、AIの精度を高めるために活用されています。

AIの詳細については、AI(人工知能)とは?仕組み・使い方・ビジネスの活用事例を解説ご覧ください。

ディープラーニングと機械学習の違い

ディープラーニングとは、機械学習を行う手法の一種です。そのため、ディープラーニングは機械学習と同様に、AIを開発するための技術のひとつとして捉えられます。

機械学習の中には、与えられたデータのどこに着目してパターンを学習するかを、人間が指定するものもあります。一方、ディープラーニングでは着目すべき特徴量(データやパターン)をコンピューター自身が自動的に判別することが可能です。

ディープラーニングでは、人間の脳の神経回路を模したニューラルネットワークという仕組みが用いられます。複数の層からなるニューラルネットワークを使った学習によってAIモデル(機械学習モデル)の精度を高め、人間が気づかなかった特徴を発見できることがディープラーニングの特徴です。

ディープラーニングについて詳しくは、「ディープラーニングとは?仕組みや活用例をわかりやすく解説」をご覧ください。

ニューラルネットワークについては本記事の機械学習のアルゴリズム・手法で解説しています。

機械学習が発展するとどうなるのか

機械学習が発展すると、計算や分析などの事務作業から芸術などの創造分野にまで応用されるようになります。すでに実用化されているSiriなどのAIも、音声認識や自然言語処理の分野における機械学習が発展した結果、誕生したサービスです。

機械学習の技術を活用した生成AIについて詳しくは、「生成AI(ジェネレーティブAI)とは?種類・仕組み・活用例を解説」をご覧ください。

2. 機械学習の3つの学習方法とその仕組み

コンピューターが機械学習を行う方法は、大きく分けて3種類に分類できます。主な機械学習の方法と仕組みは「教師あり学習」「教師なし学習」「強化学習」の3つです。

教師あり学習

教師あり学習とは、学習対象として予め正解が用意されているデータを用いる機械学習の手法です。複数の入力データに対して、ラベルと呼ばれるコンピューターが出力すべき正解のデータを与え、入力から正しい出力が行えるように学習します。

教師あり学習は、正解が用意されている問いに対して、正しいかどうかを判別するのに効果的な手法です。教師あり学習が活用される代表的なアルゴリズムとして、「回帰」と「分類」の2種類が挙げられます。

回帰とは、連続的な値を持つ正解データを導き出すアルゴリズムのことです。例えば、日別の売上や株価の変動、気温などの変化を予測するタスクが回帰に含まれます。

一方、分類は離散的な値の正解データを導き出すアルゴリズムです。画像内に表示されている動物を判別して猫や犬などに分けるタスクなどが、分類の例です。

教師あり学習の仕組みを用いると、回帰や分類のタスクを高精度で実行するAIを開発できます。

教師なし学習

教師なし学習は、教師あり学習とは対照的に、目的となる正解が用意されていないデータをもとに学習を行う機械学習の手法です。

教師なし学習では、入力された複数のデータについて、規則や法則性を見つけられます。データの持つ特徴を数値化し、類似するデータをグループ分けすることが可能です。人間が気づかないような相関関係や隠れたルールも、教師なし学習なら見つけられる場合があります。

教師なし学習によって実現できる代表的なタスクは、複数のデータを類似度に基づいてグループ分けする「クラスタリング」です。分け方の正解が予め用意されている「分類」と異なり、クラスタリングではデータ自体が持つ特徴をもとにグループ分けができます。

強化学習

強化学習とは、学習に必要なデータを与えるのではなく、コンピューター自身が試行錯誤することによって学習を進める手法です。解決すべき課題のみを設定し、行動と結果の評価を繰り返すことで、最も効率的な行動パターンを導き出します。

例えば、将棋やチェスなどでプロ棋士に勝利したAIには、強化学習の手法が使われています。また、産業用ロボットや自動運転車などの開発も、強化学習が活用されている分野です。

より精度を高める方法として、強化学習とディープラーニングを組み合わせた「深層強化学習」という手法も考案されています。深層強化学習では、コンピューターが行動選択をするプロセスで、後ほど解説するニューラルネットワークを使用し、より適切な行動を見つけることが可能です。

3. 機械学習のアルゴリズム・手法

機械学習を実現するためのアルゴリズムには、様々な種類があります。代表的なアルゴリズムの仕組みや特徴は次の通りです。

ニューラルネットワーク

ニューラルネットワークは、人間の脳に存在する神経回路であるニューロンを参考にして作られたアルゴリズムです。

ニューラルネットワークは入力層、隠れ層、出力層と呼ばれる3つの層で構成されています。入力層に入力されたデータは、隠れ層へと受け渡され、さらに出力層へと伝えられていきます。各層でデータ伝播するプロセスの中で、重みづけと呼ばれる計算処理が行われることが、ニューラルネットワークの特徴です。

ニューラルネットワークでは、入力データから正しい出力結果が得られるように、各層で重みが調整されます。多くの学習データをニューラルネットワークに入力することで、重みづけの精度を高めることが可能です。

ニューラルネットワークのうち、隠れ層の数を増やした仕組みがディープラーニングと呼ばれます。

k近傍法 (k-Nearest Neighbour/k-NN)

k近傍法とは、データ同士の類似度を「距離」という概念を用いて判定するアルゴリズムです。機械学習では、教師あり学習を行うための手法としてk近傍法が用いられます。

一般的に、データはいくつかの特徴量で表現することが可能です。例えば、果物であれば「色」と「重さ」などの特徴量で表現できます。機械学習k近傍法では、データの特徴量を数値化し、座標として取り扱います。

用意された正解データの座標を記憶し、新たに入力されたデータの座標との距離を計算することが、k近傍法の基本的な仕組みです。正解データの中で、距離が近いものの数を数えることで、新たに入力したデータがどれに近いかを判定できます。このようなプロセスで、データを分類することが可能です。

決定木とランダムフォレスト

決定木は、二者択一の条件を複数用いてデータを選別し、予測や判別などの正解を導きだすアルゴリズムです。

条件分岐をフローチャートとして視覚化すると枝分かれした木のように見えることから、決定木と呼ばれます。

例えば、自社の商品を購入した顧客のデータを決定木で機械学習する場合、性別や年齢、購入回数が何回以上といった条件で分類していきます。分類された結果から購入金額の高いグループの特徴を判別し、優良顧客の属性やパターンを見出すことが可能です。

ただし、決定木だけでは学習データの偏りや条件設定の間違いなどによる判別ミスが起きる可能性があります。この決定木の弱点を補い、より精度を高めるアルゴリズムとしてランダムフォレストが考案されました。ランダムフォレストでは、複数の決定木の結果を多数決のように処理し、より高精度な学習モデルを構築できます。

サポートベクターマシン

サポートベクターマシンは、教師あり学習に使用されるアルゴリズムです。データをいくつかの特徴量で表現した上で、最も離れているデータ同士が対照になるように境界線を設定します。その線を基準として、データを分類することがサポートベクターマシンの特徴です。

サポートベクターマシンは、データを2つのグループに分類する際に用いられます。ディープラーニングが登場する以前は、主流なアルゴリズムとして活用されていました。

4. 機械学習の活用事例3選

機械学習は、様々な分野のタスクで応用されています。機械学習の主な活用事例は次の通りです。

売り上げの需要予測・回帰分析

機械学習による回帰分析を活用すると、商品の売上を予測できます。予測の精度を高めるためには、様々なデータを用意した上で機械学習を行うことがポイントです。

学習対象のデータとして、過去に店舗に訪れた人の数や購入者の性別、年齢などの情報が挙げられます。また、購入された商品の種類や購入された日の天気、曜日などの情報も重要なデータです。これらのデータを回帰分析のアルゴリズムで学習することで、どの商品がどれだけ売れるかという需要を予測できます。

売上の予測だけでなく、WebサイトやSNSのユーザーが興味を持ちそうな商品を提案する仕組みにも、回帰分析が応用されています。

機械学習を活用したデータマイニングについて詳しくは、「データマイニングとは?概要や手法、活用事例をわかりやすく解説」をご覧ください。

画像・音声データの認識

画像データや音声データの認識も、機械学習が活用されている分野です。スマートフォンの顔認証やGoogle翻訳の画像認識機能、楽曲の検索機能など身近なツールで画像・音声データの認識技術が使われています。

また、店舗内に設置されたカメラの情報をもとにした売上予測や、自動運転におけるカメラ映像の分析処理なども、機械学習が利用される例のひとつです。

業務の自動化

問い合わせ業務を自動化するチャットボットや音声ガイドなどのシステムも、機械学習を応用して作られています。想定される問い合わせ内容のデータを用いて機械学習を行うことで、回答の精度を高めることが可能です。

ChatGPTなど、文章を自動で生成する機能を持ったAIには、機械学習を発展させた自然言語処理モデルと呼ばれる技術が使われています。また、自動運転や自動操縦の機能を持つロボットも、機械学習で業務を自動化する仕組みのひとつです。

5. 機械学習 まとめ

機械学習とはコンピューターが対象のデータを分析し、分類や予測などを自動的に行えるようにする技術です。AIの精度を高める技術のひとつとして、機械学習が活用されてきました。

機械学習には、教師あり学習や教師なし学習、強化学習など複数の手法があり、学習対象によって最適な手法が用いられます。機械学習はAIによる売上予測や画像認識など様々な分野で活用される分野のため、AIに興味がある方はぜひ機械学習への理解を深めましょう。

【監修者】酒井 麻里子

ITライター/新技術ウォッチャー。XR、ジェネレーティブAIなどの新しいテクノロジーや企業のDX取材、技術者・経営者へのインタビュー、技術解説記事などを執筆。ビジネスを軸にしたXRと最新テクノロジーのWEBマガジン『TechComm-R』運営。Yahoo!ニュース公式コメンテーター(ITジャンル)。株式会社ウレルブン代表。

TOPページへ戻る

目次

1.機械学習とは?

2.機械学習の3つの学習方法とその仕組み

3.機械学習のアルゴリズム・手法

4.機械学習の活用事例3選

5.機械学習 まとめ