【G 検定】機械学習・深層学習
G 検定シラバス 2021 に基づき,機械学習,ニューラルネットワーク,ディープラーニングの研究と歴史,それぞれの関係について学ぶ。
データの増加と機械学習
機械学習とは,人工知能のプログラム自身が学習する仕組みである。コンピュータは与えられたサンプルデータを通してデータに潜むパターンを学習する。サンプルデータの数が多ければ多いほど,望ましい学習結果が得られる。
機械学習を実用的な精度に押し上げるには十分なデータが必要になる。1990 年にインターネット上にウェブページが初めて作られるが,その爆発的な増加とともにさまざまなデータが蓄積されるようになり,機械学習はそれらのデータを利用できるようになる。2000 年以降,機械学習はビッグデータ(インターネットの成長とともに蓄積された大量のデータ)というキーワードと共に注目を集めるようになった。
膨大なサンプルデータを利用できるようになった機械学習によって実用化されたアプリ―ケーションには,レコメンデーションエンジンやスパムフィルターがある。
レコメンデーションエンジン
ユーザの好みを推測する。
スパムフィルター
迷惑メールを検出する。
機械学習と統計的自然言語処理
インターネット上のウェブページの爆発的な増加は,自然言語処理を利用したウェブページ上の文字を扱う研究を加速し,その結果,統計的自然言語処理と呼ばれる分野の研究が急速に進展した。統計的自然言語処理を使った翻訳では,従来のように文法構造や意味構造を分析して単語単位で訳を割り当てるのではなく,複数の単語をひとまとまりにした単位(句または文単位)で用意された膨大な量の対訳データをもとに,最も正確である確率が高い訳を選択する。
ニューラルネットワーク
ニューラルネットワークは機械学習の 1 つで,人間の神経回路を真似することで学習を実現しようとするものである。
ニューラルネットワークの元祖は,米国の心理学者フランク・ローゼンブラットが 1958 年に提案した単純パーセプトロンというニューラルネットワークである。
ディープラーニング
ニューラルネットワークを多層にしたものがディープラーニング(深層学習)である。