【G 検定】知識表現
G 検定シラバス 2021 に基づき,第2次ブームで中心的な役割を果たした知識表現の研究とエキスパートシステムを学ぶ。
人工無脳
人工無能は,チャットボット,おしゃべりボットなどと呼ばれているコンピュータプログラムである。特定のルール・手順に沿って会話を機械的に処理するだけで,実際は会話の内容を理解しているわけではないので人工無能と呼ばれている。
イライザ(ELIZA)
人工無能の元祖はイライザ(ELIZA)と呼ばれるコンピュータプログラムで,1964 年から 1966 年にかけてジョセフ・ワイゼンバウムによって開発された。このプログラムは,相手の発言をあらかじめ用意されたパターンと比較し,パターンに合致した発言があると,そのパターンに応じた発言をする仕組みになっている。
知識ベースの構築とエキスパートシステム
ある専門分野の知識を取り込み,その分野のエキスパート(専門家)のように振る舞うプログラムをエキスパートシステムと呼ぶ。
マイシン(MYCIN)
初期のエキスパートシステムとして最も影響力が大きかったのは,1970 年代にスタンフォード大学で開発されたマイシン(MYCIN)である。
マイシンは血液中のバクテリアの診断支援をするルールベースのプログラムである。500 のルールがあらかじめ用意されており,質問に順番に答えていくと,感染した細菌を特定し,それに合った抗生物質を処方することができるという,あたかも感染症の専門医のように振る舞うことができた。
DENDRAL
スタンフォード大学で実用志向の AI を推進してきたエドワード・ファイゲンバウムは 1960 年代に未知の有機化合物を特定する DENDRAL というエキスパートシステムを既に開発しており,1977 年に実世界の問題に対する技術を重視した「知識工学」を提唱した。
知識獲得のボトルネック(エキスパートシステムの限界)
知識ベースを構築するためには,専門家,ドキュメント,事例などから知識を獲得する必要がある。ドキュメントや事例から知識を獲得するためには,自然言語処理や機械学習という技術を利用することができるが,最大の知識源である人間の専門家からの知識獲得は困難であった。専門家の持つ知識の多くは経験的なものであり,また,その知識が豊富であればあるほど暗黙的であるため,それを自発的に述べてもらうことはほとんど不可能であり,上手にヒアリングで取り出さなければならなかったからだ。
さらに,知識ベースの構築において,獲得した知識の数が数千,数万となると,お互いに矛盾していたり,一貫していないものが出てきたりして,知識ベースを保守するのが困難になることも分かった。
意味ネットワーク
意味ネットワーク (semantic network) は,もともと認知心理学における長期記憶の構造モデルとして考案されたものである。現在では,人工知能においても重要な知識表現の方法の 1 つとなっている。
オントロジー
オントロジー (ontology) は,エキスパートシステムのための知識ベースの開発と保守にはコストがかかるという問題に端を発している。知識の共有と再利用に貢献する学問として知識工学が期待されるようになり,その中心的な研究として注目を集めた。
オントロジーは,本来は哲学用語で存在論(存在に関する体系的理論)という意味である。人工知能の用語としては,トム・グルーパーによる「概念化の明示的な仕様」という定義が広く受け入れられている。
Cyc プロジェクト
エキスパートシステムのような知識ベースのシステムが柔軟な能力を発揮するには膨大な知識が必要になる。そのようなシステムで人間のように柔軟な知的能力を実現するには,広い範囲に及ぶ常識が必要になるということが広く認識されるようになり,この課題に挑戦するため,すべての一般常識をコンピュータに取り込もうという Cyc プロジェクトがダグラス・レナートによって 1984 年からスタートした。
Cyc プロジェクトは,驚くべきことに 30 年以上経っても続けられている。
概念間の関係(is-a と part-of の関係)
オントロジーにおいて,概念間の関係を表す「is-a」の関係(「である」の関係)と「part-of」の関係(「一部である」の関係)は特に重要である。
「is-a」の関係
「is-a」の関係(「である」の関係)は,上位概念と下位概念の関係を表すが,その関係には推移律が成立する。推移律とは A と B に関係が成り立っており,B と C に関係が成り立っていれば,A と C にも自動的に関係が成り立つというものである。
「part-of」の関係
「part-of」の関係(「一部である」の関係)は,全体と部分の関係を表している。
オントロジーの構築
オントロジーの研究が進み,知識を記述することの難しさが明らかになってくると,次の 2 つの流れが生まれる。
- 対象世界の知識をどのように記述すべきかを哲学的にしっかり考えて行うもの。
- 効率を重視し,とにかくコンピュータにデータを読み込ませてできる限り自動的に行うもの。
それぞれ,ヘビーウェイトオントロジー(重量オントロジー),ライトウェイトオントロジー(軽量オントロジー)という 2 つの分類にほぼ対応している。
ワトソン
IBM が開発したワトソン (Watson) は,2011 年にアメリカのクイズ番組ジョパディーに出演し,歴代の人間チャンピオンと対戦して勝利したことで一躍有名になった。ワトソンは,基本的には Question-Answering(質問応答)という研究分野の成果であるが,ウィキペディアの情報をもとにライトウェイト・オントロジーを生成して,それを解答に使っている。
東ロボくん
日本では,東大入試合格を目指す人工知能,「東ロボくん」というプロジェクトが 2011 年にスタートし,2016 年まで続けられた。2016 年 6 月の進研模試では偏差値 57.8 をマークし,ほとんどの私立大学に合格できるレベルに達した。しかし,「東ロボくん」は質問の意味を理解しているわけではないので,読解力に問題があり,何らかの技術的なブレイクスルーがない限り,東大合格は不可能という理由から 2016 年に開発が凍結されている。