教師あり学習とは機械学習の手法のひとつで、事前に与えられたデータを「教師からの助言」とみなして、それをガイドとして学習していきます。
入力と出力のセットを教師事例として与えて学習させます。その結果、出力が未知である入力事例に対して、正しい出力を予測させることができるようになります。
教師あり学習では学習させるデータが正解が付いているため、訓練データのことを「ラベルあり」と呼び、一方で教師なし学習では正解が付いていないため「ラベルなし」と呼ぶことがあります。
教師あり学習には、入力事例から直接的に出力事例を予測する回帰問題と、クラスと呼ばれるグループに分ける分類問題があります。
いずれの問題についても、入力と出力の数多くのデータセットをプロットして、それらの関係性を示す関数を見出します。
このような関数について、回帰問題であれば回帰曲線、そして分類問題であれば分類器などと呼ばれています。
回帰問題とは、出力が実際の値である問題のことです。たとえば、ある上場企業の株価かが明日には「いくら」になるかを予測するような問題です。
一方、分類問題は出力があるカテゴリでる問題のことです。たとえば、ある上場企業の株価が明日には「上がる」または「下がる」のいずれかを予測するような問題です。
教師あり学習でよく利用されるアルゴリズムの例としては、線形回帰やランダムフォレスト、サポートベクトルマシンなどが挙げられます。
出典・参考