マルレク第三回「パーソナル・アシスタント・システムと 人工知能」に参加してきた。 興味深いトピックまとめ

マルレク第三回「パーソナル・アシスタント・システムと 人工知能」に参加してきた。
自然言語処理については詳しくなかったため、とても参考になった。
過去から現在に至るまでの潮流を理解するためには最適だったと思う。

あえて言うならば、概論であったため、もう少し深い部分に突っ込んで欲しかった気もする。
ここで知ったことを元に自分で勉強すべき、といえばその通り。
あとで感想を追記する。

マルレク2016開催概要 - 丸山事務所(デジタルらいふ)



以下、興味深かった内容について述べる。
ほぼ自分用メモになっているけれど・・・・

興味深い言葉

GOOGLE amazon facebook等に類する企業が日本にはないが中国にはある。
しかも中国では大きな企業として成長してきている。

ボイスアシスタント

現在のボイスアシスタントはBOT的なもの。人工知能と検索技術との組み合わせ。
→想像ほど現実は進んでいないが、これでも充分活用できる。

IBM Watson(クイズように開発された昔のもの)における質問に対する回答の流れ
1.Focus 意図を抽出する
2.Lat 質問の型を見る
3.候補のリストアップ
4.証拠の検索と絞り込み

↑本来はこうあるべきだと考えられるが、現状使用されているAPIは、人間が考えられるパターンを全て書きだし、そこからパターンマッチングしているだけ。
 現状一般的に使われているものはLatすら抽出できていない

Bengioの意見

ボットを作ることは簡単だが、組み合わせの呪いがあなたに噛み付くだろう。
ボットの作り方は二つある。ルールと機械学習
機械学習を行うためには膨大な数のデータセットが必要。
逆に、ルール方式であれば、ある程度までのデモは実装できるが、そのうち組み合わせの呪いが出てくる。

botの作り方、まずはStoryで少量のデータで機械学習、オーバーフィットさせる。(機械学習と言いつつルールベースの挙動をする)
データが増えてきたら機械学習の効果が発揮される。
とにかくやってっみて、ログが溜まったらそのログを元に再学習させれば良い。

多分実現不可能なのでは?というのが彼のblogの意見。

各社の人工知能API比較

GOOGLE API
80言語対応
リアルタイムストリーミングに対応

GOOGLE VISION API
顔、ロゴ、ラベル、言語認識等のAPIがある
顔検出という意味では、Facebookが圧倒的優位

MicrosoftAPI
Microsoft cognitive Services
speech/language/knowledge/search APIがある
画像を与えるとキャプションを出してくれる・・・が、まだまだ精度はでていない。ビジネスに使えるレベルではない。
LUIS 言語理解API 最近日本語化された

AIと検索と広告

21世紀初頭のIT技術として最も一般的なものは上記の組み合わせの成功である
広告とパーソナルアシスタントを切り分けることは難しい、突き詰めると同義になりうる
DeepLearningが(現在は)苦手としている自然言語処理がパーソナルアシスタントシステムに必要になる
googlenowはかなり進んでいる、シナリオベースの動作だけではない
(何故??)→根っこが検索に直結しているから

過去からの検索技術の動向

2000年代 GOOGLE WEBクローリングによるランク付け
2010年代 Facebook等 SMSの台頭によるリアルタイム検索性の向上の必要性
データの量への注目から、質的なグラフ構造への注目へ
facebook open graph
google caffeine
apache giraph
google knowledge graph
facebook search graph
microsoft satori
...

例えば、アインシュタインの誕生日を検索する場合・・・
昔、アインシュタインを検索し、その中から誕生日の情報をさらに検索する
データがグラフ化してあれば、アインシュタインのプロパティのbirthdayを見れば良い
ただし、アインシュタインの競争相手は?と聞いても答えは返ってこない
→プロバティに登録されていないから・・・・
 ノード検索は、プロバティにないものは検索できない
 →我々の望むものには遠い

schema.orgの取り組み

オープンソースにエンティティを作成する流れ
以下のように、階層化されたデータを持つ
thing > creative > book
thing > event
thing > person

上記流れはまだまだチープ
すでに膨大なボキャブラリを持つが、人間の言語世界はさらに広い。

ノードグラフを使うことで、ある程度有効なシステムを作ることはできるが、自然言語理解を完全に代替することはできない。

自然言語のグラフ化

未だ自然言語をグラフとして完全に理解させることはできていない。
これまでの名刺の世界のグラフ化(同氏は属性として扱う)から、動詞を中心としたグラフ化への移行

まとめ

世界の全ての情報をグラフ化することは可能か
次元の呪いで不可能
そもそもそんなものは必要ない??
個人及び個人的なグループでしか価値のない情報は必要か
→おそらく不要
全てを知っているシステムが最高のシステムか?
→分散型のシステムに比べると弱い
 
グローバルに共有すべき情報とは、wikipedia程度ではないか。ワンチップに入る情報ではないか。
全ての答えがネットにあるわけではない、我々は「謎」に囲まれて生きているのではないか。
つまり、スカイネット的な人工知能は必要ではなく、パーソナルアシスタント程度のものが望まれている人工知能ではないか。

パーソナルアシスタントの能力は、人間の能力と言えるのか・・・・?

まずは自然言語理解からの言語翻訳によるパラダイムシフトが起きるのではないか。


自然言語を脅威と捉えるのではなく、自分自身の中に還元していくことが必要ではないか。