【de:code2018 AI12】人工知能を用いた魅力工学の研究とMicrosoft Azureの教育・研究現場での活用事例
de:code2018で参加したセッションの内容をまとめていこうと思います。
ちらほら一部のセッションの登壇者が資料をアップロードし始めていますが、基調講演も含む動画やセッション資料が後日公開されるようなので、それまでのつなぎだと思ってください。
もともと自社にフィードバックするために書き留めているだけなのですが、何かの参考になれば幸いです。
人工知能を用いた魅力工学の研究とMicrosoft Azureの教育・研究現場での活用事例
decode1日目の最後に受けたセッションです。東京大学の山崎さんによるセッションです。
企業の開発事例はよく聞きますが、教育機関で学生がどんなものを作っているのかって実はあまり知らないので、「教育」の現場での活用方法を聞きたくてこのセッションを選びました。
自己紹介
この研究室では「魅力」というもの定量化し予測、解析、強化などの行う研究をしているようです。
そもそも受け手によってかなりばらつきのあるものを1つのデータとしてどう扱っているのか非常に興味がそそられます。
このスライドで上がっている例
- プレゼンの印象解析
- 視聴率、利用者予測
- CMの「刺さる」度解析
- SNSの人気度予測と教科
- 婚活
- 妊活
- 子育て・保育
- ファッション・化粧
- 不動産情報
- Iotセンシングによる魅力定量化
- 旅行・写真撮影支援
私は知らなかったのですが、SNSの人気度についてはニュースとしても取り上げられていたようです。
教育現場でのAzure活用について
教育現場でのAzureのDeep Learning Virtual Machineの活用について紹介されました。
予算が限られている教育の現場では、1研究室が設備に対して多大な投資をすることが難しいため、Azureのような環境が非常にコスパが良いとのことです。
たしかに、仮にオンプレミスでDeep Learningをやろうと思うと、性能の良いGPUを含め、サーバやネットワークにかける金額がかなり大きいですね。ハードをそろえるだけでもハードルが高い上に、管理・保守していくうえでかかってくる必要も馬鹿になりません。Azureの場合は必要に応じでVMを立ち上げて計算が終わったら切って、不要になったらリソースごと抹消すればかなり安価に使えますね。
先日とある勉強会で高専の先生と話をしましたが、高専の場合は年々予算が1%ずつ減っているらしいです。おそらく大学も同じなのでしょうね。
ちなみに、Azureは学生向けのプランもありVMはDeep Learningに必要なセットがまとめて入っているため、かなりお手軽に環境を整えることが可能です。AzureのML以外にもChainerやTensrflowなども含まれていてケチケチしていないところがまたいいですね。
学生の研究(3事例)
そんなAzureの環境を使用して学生がどんな研究をしているのか、3つの事例が紹介されました。
1つ目:質疑応答タスクにおける文法情報と意味情報の埋め込み強化
これは正直初見では難しすぎて詳しくはわかりませんでしたが、自然言語処理を使用して文章から自動でQAを作成するというものらしいです。
自然言語のトップの国際会議に投稿中とのことで、大学3年生が出すのは珍しいとこことです。
2つ目:DCGANを用いた画像生成
次はDCGANを使って美人を生成するというもの。DCGANは「Deep Convolutional Generative Adversarial Networks」の略ですね。
生成された画像が美人かどうかを評価する必要があるのですが、諸事情により公開は控えるよう言われているのでここでは載せることができませんが、最近の若者らしいツールを使っていました。一応それなりに美人と判断されたようですよ。
3つ目:Deep LearningでFX
お金に興味がある学生がFXのバイナリオプションの予測を行った例です。通貨ペアに関してある時点から上がるか下がるかを予想するものですね。accuracy0.8なのでかなりいいモデルではないでしょうか。私もぜひ欲しい。為替は過去のデータが残っているので、Deep Learningやりやすい題材でしょう。実際に予測ツールを作っている方もおられますし。
研究室の研究内容の紹介
SNSで人気者になりたい
冒頭でもニュースのリンクを張っていましたが、SNSでの人気度の予測についての研究です。これは「人気度」を「魅力」と位置付けて、画像とタグのセットで「いいね」がどれくらい貰えるか予測するものです。
画像とタグをインプットに与えて予測していますが、画像のみより、画像とタグのセットのほうが良い結果になっています。基本的に相関係数が0.7を超えると強い相関関係があると言ってよいです。
これはタグによる検索のヒット率の違いについての紹介です。
この画像に対して下記のタグセットをつけた場合、2番目のタグセットの方がヒット率が4倍近く高かったことから、画像につけるタグの重要性を示すものです。
- bw、ポルトガル
- bw、スモーキング
ただし、タグ付けというのはセンスに強く依存します。良いタグをみんながみんな付けられるわけではありません。というわけで、AIを使って効果的な良いタグを推薦してくれるものを作ってみたそうです。
結果としては人がつけたもの(一番下)より、システム(一番上)が2倍近いスコアを出しているようです。(間は別の一般的なモデルを使用したもの)
さらにAzureのComputer Visionと組み合わせた例も。一番上が作成したシステムで、一番下が人間なので一目瞭然ですね。
スライドデザインの向上支援
スライドを作ったことのない人に対して、エジソンについて説明してくださいという題材です。
一番左上が最初に出来上がったものです。予想通り文章いっぱいという感じです。
この内容をVIM(visual importance mpa)にかけます。そうすると、人間の目がどこに行きやすいかを視覚化してくれます。
このVIMの結果だけ渡して修正してもらいます。できたものが真ん中の一番上のスライドです。
ここで作成したシステムの登場です。100点満点で何点かスコアかしてくれます。結果は57点。さらに改善すべきところに色を付けてくれます。真っ赤になっているところは修正ポイントです。
さらに修正してもらって最終的にできたものが一番右上のスライドです。写真も入ってぱっと見ても見やすそうに感じますし、実際にスコアも上がっています。
このように全くの素人でも良いスライドを作る支援をしてくれるというものです。ちなみにスコア化に関しては、良いと感じるスライドと悪いと感じるスライドの例を用意して学習させて作成したようです。
モデルの評価についてもAzure上にアンケートシステムを構築して使用したようです。
1日で済んだようなので、これもわずか数百円で済んだそうです。やはりAzureは「チョットダケ使いたい」に強い見方ですね。
刺さる広告
ちょっと写真がぼけてしまっていますが、スライドの時と同じように、「良いと感じた広告」1万枚と「悪いと感じた広告」1万枚を用意して学習させた結果のようです。これもニュースに乗ったようですね。
結果としては人間が評価して52%の正答率(一番左)。システムで70%という精度結果でした。これによって、評価が悪かった場合、どこが悪いかわからないけど変えるべきという判断ができるようになるとのことです。
ちなみに、どこが悪いかという部分は現在研究中のようです。AIは相関関係は得意でも因果関係は不得意ですからね。
顔の「魅力度」予測
これは単純に美人かどうかをスコア化したものですね。1~5でラベル付けして学習させた結果のようです。これだけだと何も面白くないので、魅力度を上げるためにAIに化粧を施すことを許可して魅力度を上げることまで考えます。
テスト方法は、「本人に化粧してもらった顔」と「すっぴんをAIに渡して化粧を施してもらった顔」をABテストで評価したものです。(どっちが美人に見えるか?というテストですね)
結果は明らかにAIの方が良いという結果になったようです。上方変わってるじゃないかという指摘があるかもしれませんが、一度すっぴんになったときにどうしても変わってしまったようです。
というわけで、最初にすっぴんの写真を取って、その後自分で化粧を施した写真と、AIが提案する化粧を施した写真を使って評価しました。髪型も変わっていません。総じてAIの方がポイントが高かったですが、左下のようにうまくいかない事例もあったようです。
実際に学園祭で出展してみたところ、非常に高評価だったようです。AIが化粧を施した顔を写真として持って帰れるようで、特におばちゃんたちが喜々として持ち帰っていったようです。
まとめ
魅力というのはデータ化して解析・予測できるものである。今までは個人の感覚に寄っていたものが定量化して扱うことができるようになりました。
ただし、現在のAIは「WHAT」の認識だけです。
- これは犬です
- これは良いプレゼンです
という感じでWHATを認識できるだけで、将棋やチェスなどでも次の一手がわかるのみ。なので、これから「HOW」や「WHY」を認識できるようになることが課題であるとのことです。
実際に広告の評価でも「良い」か「悪い」かはわかっても「なぜ良いのか」「なぜ悪いのか」はわからないため、今後はこの部分の研究も進めていくということでした。