目次
機械学習には4つの種類がある
人工知能を学ぶ上で「機械学習(Machine Learning)」は避けては通れない、今現在最も注目されている技術です。
アーサー・サミュエルの定義によれば、機械学習とは「明示的にプログラムしなくても学習する能力をコンピューターに与える研究分野」です。
この機械学習には、4つの種類が存在しています。
教師あり学習
教師なし学習
半教師あり学習
強化学習
それぞれに特徴や得意科目があります。
今回は「教師あり学習」について学習していきましょう。
教師あり学習
「教師あり学習」は入力データと出力データに正解データを与えることで、機械学習のモデルを学習させていくことです。
機械にモデルを学習させることで、与えられたデータを元に予測や識別ができます。
教師あり学習には2つの種類があります。
回帰問題
分類問題
教師あり学習での上記の2つの種類を簡単に解説していきます。
回帰問題
「回帰問題」は、入力データと出力データを元に、連続した値を予測します。
回帰問題によって、将来の数値を予測できるのです。
例えば、過去の売り上げを元に将来の売り上げを予測することも可能です。
企業のマーケティングやセールスには、有効なモデルだと言えます。
分類問題
分類問題は入力データと出力データを元に、画像の種類を識別します。
例えば、動物の画像データを入力と出力することによって、画像が猫なのか犬なのか正解を出せるようになります。
この分類問題を発展させることで、スマホの画像認証などのセキュリティー対策も強化されています。
教師あり学習の手法
教師あり学習の種類を簡単に解説してきたところで、その具体的な手法も解説しておきましょう。
教師あり学習には以下の手法があります。
線形回帰
ロジスティック回帰
サポートベクトルマシン
決定木
アンサンブル学習
ニューラルネットワーク
ベイジアン学習
クラスタリング
それぞれの具体的な手法ではどのようなことができるのか解説しましょう。
線形回帰
線形回帰は、教師あり学習の中でも特に有名です。
複数の説明変数(目的の予測数値の原因となっている変数)を使用して、目的となる予測数値を出すための手法です。
1つの目的変数を求める方法を単回帰分析、複数以上の説明変数から求める方法は重回帰分析と言います。
単回帰分析の例
単回帰分析の例として、身長と体重のデータを入力して線形回帰モデルを作成します。
個人によって身長も体重もまちまちですが、データを多く揃えることでその傾向が見えてきます。
データが多ければ、この傾向は正確になっていきます。
身長と体重の関係を入力して、目的変数(身長)=y、説明変数(体重)=xとすると「y=x+〇」の一次関数で表すことができます。
そこで導き出された関数が「y=0.5x+138」だとすると、一般的に体重が70kgの人の身長は173cmだと予測できます。
こういったモデルが線形回帰モデルであり、オーソドックスな手法です。
重回帰分析の例
重回帰分析では、単回帰分析よりもより複雑な変数がある場合にもモデルを作成することができる手法です。
この手法には、さまざまな手法があります。
「ロジスティック回帰」「サポートベクトルマシン」「決定木」「アンサンブル学習」「ニューラルネットワーク」「ベイジアン学習」「クラスタリング」に関しては、次回のブログで解説していきます。
あまりにも難解なので、「G検定のための学習3日目!機械学習の基礎(教師あり学習)を学ぶ②」に委ねます。
2日目に学習したテキストとテスト結果
ここで一日目におこなった学習とテストの結果を備忘録として記述しておきましょう。
・「徹底攻略 ディープラーニング G検定 ジェネラリスト問題集」
第2章 機械学習の基礎
32問中16問正解(正答率50%)
⇒合格点は7~8割なのでまだまだ勉強が必要
・「ディープラーニング G検定 要点整理テキスト&問題集」
第3章 機械学習
34問中11問正解(正答率32%)
⇒今回も話にならない(泣)