教師なし学習とは、機械学習の手法のひとつ。「教師あり学習」では入力と出力のセットを教師事例として与えて学習しますが、一方で教師なし学習では、あらかじめ「出力すべきもの」が与えられません。
そのため教師なし学習では、データの中に存在する本質的な構造を探し出して抽出するために用いられる手法となります。
このように、教師なし学習では「正解がない」事象について予測したり分析する分野で活用され、膨大なデータの中から何らかの特徴を発見させるために用いられます。
教師あり学習では学習させるデータが正解が付いているため、訓練データのことを「ラベルあり」と呼び、一方で教師なし学習では正解が付いていないため「ラベルなし」と呼ぶことがあります。
教師なし学習では、画像や音声あるいは数値などの膨大なデータを読み込ませて、それらのデータに含まれる「特徴量」を求めます。そしてその特徴量にしたがってさまざまなカテゴリーに分類したり、規則性や相関性、傾向などを分析したりします。
膨大な過去のデータから有用な有用な情報を抽出する企業のデータマイニングなど、未知のデータの特徴を発見したり予測する分野では教師なし学習の手法が活用されます。
教師なし学習の代表的な手法には、クラスタリング、主成分分析、自己組織化マップ、ベクトル量子化などがあります。
出典・参考