プレイヤーがコレクションしたカードを使って行う、対戦型のトレーディングカードゲーム(TCG)で遊んだ経験がある人も多いでしょう。私もこのゲームが好きで、よく友人との対戦を楽しんでいました。卒業研究に取りかかる時点で大学院への進学を決めており、新美先生に相談したところ「3年間ずっと考えられるテーマを」とのアドバイスをいただきました。データマイニングを利用して価格の予測や分析を行う研究にも興味があったので、趣味のTCGと組み合わせて、「トレーディングカードゲーム市場の中古価格予測」を卒業研究のテーマにしました。
新品のTCGのカードは書店やインターネットなどで販売されていますが、その中古取引での価格は株価のように変動しています。販売年度や希少性、性能などによって価格が変わるカードは投機の対象にもなっていて、中には1枚のカードが数千万円で落札されたという事例もあります。カードの中古市場においてどのような要素が価格に影響するのか、それを調べるのが私の研究のポイントです。世界中にプレイヤーがいる最も有名なTCGの4万枚のカードに関するデータと、入手可能な14万件の販売価格というビッグデータから分析し、新しいカードの価格を予測できるようにしたいと考えました。
カードのデータは、海外の有志が作成してオンライン上に公開されているものを使用したのですが、データ自体が特殊な構造だったことや、今回の研究では対象外となる特殊なカードなども網羅されていたため、分析を行う前のデータ加工処理に予想外に手間がかかりました。先生からは「データマイニングはデータの前処理がすごく大変だ」と聞いていたのですが、本当に地味で大変な作業でした。最終的には、研究室の先輩の助けを借りながら、自分でプログラムを作って分析を行いました。知識不足と見通しの甘さを痛感したことも、いい経験になったと思います。
今後は大学院で、よりデータマイニングの知識を深めていくつもりです。また、トレーディングカードの中古価格の研究をやっている人は、私の知る限りでは他にいないので、この分野で第一人者になるという目標もあります。将来的な就職先として考えているのはゲーム制作会社です。近年のオンラインゲームでは、ログや課金率などを把握してユーザごとの宣伝戦略を変えるなど、データを利用した運営を行っています。専門分野のデータマイニングを活用して新しい展開を図り、たくさんのユーザを楽しませることができればと考えています。
私の専門分野のデータマイニングは、大量のデータの中から意味ある情報を抜き出す技術です。研究室の中であれば完全に均一なデータを作ることができるのですが、現実の社会にはそのようなデータはありません。アルゴリズムを研究するために性質の分かったきれいなデータを対象にするか、あるいは現実に使える手法を研究するために現実世界のデータを対象にするか、そこも研究材料です。COVID-19を例に取ると、現在は人口に比べると感染者数は非常に少ないので、データ上は全員陽性者ではないと判断するシステムを作ったとすると99.9%以上の確率で正解する判定ツールができますが、それでは感染者を見つけることは出来ませんので、そのようなツールに意味はないです。私の最近の研究では、このようにデータの偏りがあってもうまく判定できるような方法を考えています。
写真:COVID-19の感染状況とTwitter上のつぶやきの関係を分析
私の研究室では配属後に学生にテーマを自分で考えてもらうのですが、中でも宍戸さんの研究はユニークです。研究対象にしているTCG中古市場はほとんどが0.1USDのカードですが、ごく一部超高額カードが存在しています。どういう要素で値段が決まっているのかというのが彼の研究のポイントですが、非常に偏りのある価格データを含めて研究対象として面白いと思いました。卒業研究は、自分で決めた研究テーマに取り組む中で、いろいろな方法を試しながら研究のやり方を身につけ、研究テーマにふさわしい解決策を提案するというのが目的です。たまには失敗を恐れず、どんどん失敗して、その失敗の中から何が悪かったのか、どうすればよいかをとことん考えることが大事になります。成長は小さな失敗を積み重ねた先にあるのです。
データ分析やデータサイエンスは万能ではありません。データがあれば、AIなら何でもできると思われがちです。しかし、データがなかったり、もともと分析を目的として集めたデータではない場合は、使えるように準備するまでが大変です。私の研究室では実社会のデータを扱うことも多いので、学生には最初に「実験に入るまでの前処理が大事」と話すのですが、自分で体験してみないと実感できないことでもあります。将来は、専門家任せではなく、誰もが共通の知識を持ってデータをうまく利用できる社会にしていなかければなりません。みんなのデータサイエンスに関する理解をもっと深めるために、未来大のデータサイエンスオープンプログラムなどで貢献できればと考えています。
写真:オンラインで参加した国際会議の様子
「ベアリング」という部品を知っているという人は多くはないでしょう。しかしベアリングは、自動車や航空機、冷蔵庫やパソコンなど、ほとんどの機械に使用されています。回転する軸と回転を支える部分には必ず摩擦が発生します。この回転軸と回転を支える部分の間で働き、摩擦を少なくし、回転をなめらかにして騒音やエネルギー消費量を少なくするのがベアリングの役割です。外側と内側の大小2つのリングの間に複数個の鋼球が挟まれた仕組みで、私の卒業研究のテーマである「鋼球の画像検査」で対象にしているのが、このベアリングに使われている鋼球です。
この鋼球には「丸さ、硬さ、丈夫さ」が求められます。その品質管理のため、AIが画像分析を行うための学習手法「畳み込みニューラルネットワーク」を使用した画像検査装置を製造工場に導入して、鋼球の検査を自動化することが最終的な目標です。検査では表面の傷の有無を調べるのですが、そのためには直径がわずか2ミリの小さな鋼球の画像を撮影しなければなりません。カメラとレンズの選定に頭を悩ませて、なかなか合わないカメラのピントにも苦心しました。試行錯誤を重ねて、だんだん上手くいくようになった時はうれしかったですね。
もともとはボイスチェンジャーを研究テーマにしようと考えていましたが、世界の大企業が注力している分野で、新しい研究の余地が非常に少ないこともあって、先生から紹介された現在の研究に取り組みました。まったく知らない領域でしたし、先行研究例もなく、撮影環境から考える必要がありました。4年次の半分以上は、鋼球を撮影するための方法ばかりを考えていて、大学院入試の面接では「君はハードウェアがやりたいの?」と訊かれたほど。想定していなかった領域を学ぶうちに新しい繋がりが見えて、それが自分の視野を広げてくれました。
研究の現状は、鋼球を転がして、止めて、ピントを合わせて撮るという段階です。鋼球の下に紙を敷いて、その紙を動かすことで鋼球を回し、すべての面で傷を探して撮影できるようにしています。地道でアナログな作業ですが、この方法はたぶん誰もやっていないと思うので、オンリーワンの研究になるかもしれません。今はまだ静止での撮影ですが、将来はベルトコンベアで流れてくる鋼球を撮影できるようにするのが目標です。そのためにも、常に調べたり勉強したり、少しずつ知識を身につけて少しずつ進む、その感覚を大事にしながら研究を続けていきたいです。
高度ICTコースでは、実社会でも役に立つ情報システムを設計・開発できるスキルの習得を目指しており、実際の利用イメージを持った開発演習も行っています。私の専門分野の画像認識や画像計測でも、豆類の等級判別や養殖アワビの大きさ計測など、地場産業と密接に関わる研究が進んでいます。濱口さんが取り組んでいる鋼球の画像検査も、私のところに来ていた共同研究の案件を紹介したものです。もともとは声質変換がやりたいと言っていたのですが、すでに先行研究が盛んに行われている分野で、学生が今から研究しても得るものは多くないだろうと判断しました。
テーマが明快なので、卒業研究としては何らかの形になるだろうと考えていましたが、出した成果は想像以上と言っていいでしょう。これも濱口さんの努力の賜物だと思います。最初のうちは1枚の画像を撮るのに90分もかかっていたのが、今では10秒以内に傷を発見できるようになりましたから。実際に鋼球を製造しているメーカーに行ってデモを見せたところ、非常に反応が良くて。デモをしていたときに、メーカーの担当者から「これ、見えますか」と傷入りの鋼球を渡されたのですが、彼がものの数秒でその傷を見つけたら、みなさん目を丸くしていました。
研究して論文を書くだけなら自分の好きにやれるのですが、相手がある場合は先方の要望に応える必要があります。そういう研究には難しさがあると同時にチャレンジする面白さがあります。ニッチではあるが需要は必ずある分野では、大企業や大手の研究機関が簡単に参入できないからこそ、未来大のような小回りの効く大学が役に立てるというわけです。これからの時代には、手順と答えが決まっているようなものには何の意味もありません。私たちは、まだ世の中にない新しいものを作り続けていかなければならないのです。そのための学びが高度ICTコースにはあります。
写真:タコ漁の漁具にタコがかかったところ。漁具にカメラを取り付け、実際にタコがどのようにかかるか撮影したもの。
写真:デマンドバス向けの省電力知的バス停。利用者が少ない状況で、バス停の消費電力を減らす方法についての研究。
3年次のプロジェクト学習で、ARマーカーを印刷した透明なフィルムを重ねて遊ぶ知育玩具を考案したことで、カード型教材というアイデアが浮かびました。それを卒業研究として、デジタル技術を記載したカードを制作しました。カードの表面にデジタル技術の概要、裏面にはその活用方法を記載したもので、限られたスペースにどんな情報を入れるかに苦心しました。プロトタイプでは25種類のカードを作りましたが、他にもたくさんの技術がありますし、デジタル技術も常にアップデートしています。そこで、カードデータを管理するシステムを同時に開発しています。
カードの数の追加や内容の変更などをWeb上で管理して、そのデータを蓄積するようなシステムで、カスタマイズしたカードを印刷できる機能や、カードデータの検索機能も持たせようと考えています。美馬のゆり先生のアドバイスのもと、アナログカードとデジタルデータのメリットを融合させる方法を模索したところ、このような形になりました。地域のまちづくりワークショップや企業の企画会議など、ワークシートと組み合わせながら活用してもらうことにより、問題解決のためにデジタル技術を取り入れた画期的なアイデアの創造につなげることを目指すものです。
アナログカードという形態をとっているのは、ワークシートとの組み合わせのほかに、ランダムで数枚のカードを取ってその技術を使ってどんなサービスができるかを考えるなど、いろいろな使い方をしてほしいからです。実際にこのカードでプログラミングができるようになるわけではありませんが、デジタル技術とその用途についてはざっくりと理解できます。手に持ってあれこれ考えられるアイテムを介することで、たとえば「この企画にVRを投入したら?」など、思考の幅を広げたり新しい発想が生まれたりするきっかけになると考えています。
カードはワークショップで使うことを想定して作ったので、コロナ禍でそれができなかったことはとても残念でした。実際に使ってもらっての評価検証が今後の課題です。今回の卒業研究は、後輩が引き続き進められるようデータとして研究室に残していくつもりです。私自身は教育系総合出版社への就職が決まったので、デジタル部門でさまざまなスキルを高めながら、このカードのような教材制作に関わることが将来の目標の一つになりました。プロジェクト学習から卒業研究、就職先まで、教育という軸ですべてがつながったことで、自分の大学生活にはとても満足しています。
友人の研究者が理想的な研究空間を作ろうとしたときの話です。余計なものは一切置かず、壁やテーブルをすべてホワイトボードのような素材で作り、思いついたアイデアをどこにでも書ける、誰かが後から自由に書き足すこともできる、それらはすべてデジタルデータとして保存でき、活用できる、そうすればアイデアは無尽蔵に出てきて、意見の交換が活発に行われるだろうと考えたそうです。ところが、完成してみると最初は使ってみたものの、その後誰もその部屋を好んで利用するようにはなりませんでした。無駄のないまっさらな空間では、アイデアを出さなくてはならないというプレッシャーを感じてしまうのです。同じように、何もなくて静かすぎる部屋では、かえって集中できずに勉強がはかどらなかったという経験がある人もいるでしょう。
私の専門分野の「学習環境デザイン」は、人が学ぶ上でどのような環境が適しているのか、人やモノ、空間の配置まで含めた学びのプロセスそのものを考える研究です。市岡さんが卒業研究のテーマに選んだ「デジタル技術カードとそのデータ管理システム」も、ワークショップという学びの場でいかに発想を豊かにするかを考えて作られています。卒業研究では方向性の決定に時間を要するものですが、彼の場合は3年次のプロジェクト学習が終わった段階からテーマを考え始め、議論に時間をかけて進めることができ、4年生の時には大学院の授業にも出席していたので、卒業研究としては非常にレベルの高い内容になっています。
小学校でもプログラミングが必修になりましたが、それよりも大事なのは、デジタル技術にはどのようなものがあり、それが世の中でどう役に立っているかを知り、どう役立てたいかを考えることです。それは大人も同様です。10年後のまちづくりや仕事のありようを考えるとき、デジタル技術を抜きには語れません。そういう学びの場に市岡さんの研究が活かされるわけで、これはまさに学習環境デザインです。彼が就職する教育系総合出版社は、私が長く共同研究などで関わってきた会社なのですが、今まで未来大から就職した学生はいませんでした。教育に興味を持つ未来大の学生にとって、出版社という選択肢が増えたことも大きな収穫です。
写真:年に数回の集中講義を担当している観光系の職業訓練校で実際にカードを使ってもらい、得られたフィードバックをもとに改良。
私の卒業研究のテーマは「主観に基づく文章分類処理とクチコミへの応用」です。従来のAIを活用した文章分類処理は、文体で分ける方法や、テーマによって分ける方法、文中の語句で分ける方法など、明確な基準が存在します。つまり、機械的に分けることができる客観的な分類で、誰がやっても同様の結果になるようなものですが、主観は人によって違います。たとえば「有用か否か」で分けるとすると、その人の価値観によって結果がまったく異なるわけです。主観という個人に依存する分類をAIでどれだけできるかということについて研究しています。
研究対象として、宿泊予約サイトのホテルへのクチコミを分類しています。たとえば、ホテルについて比喩などを用いてイメージしやすく書かれたものは良い、料理がおいしいとか接客がいいとか単なる印象を羅列したようなものは悪い、などと私の主観でクチコミの文章の良し悪しを判別しました。当初は1000件のデータを手作業で分類したのですが、後で見た時に「この文章は本当に質がいいのか?」と疑問に感じることも。主観は、その時のモチベーションや体調、感情などにも左右されるので、件数が多いとブレが生じやすくなることがわかりました。
そこで、対象とするクチコミを250件に厳選して、自分の主観として質の良し悪しをはっきりと言い切れるようなデータにしてみました。すると、1000件のときには70%だったAI分類の精度が85%にアップしたのです。軸がしっかりしていれば、主観という基準でもAIで分類することが可能なのではないかという推察ができたので、次のステップとして、いろいろな人の主観で分けることを考えています。将来的に実用化できれば、膨大な情報の中から自分の主観にぴったりと合うものが簡単にチョイスできるようになるかもしれません。
AIでほとんど扱われてこなかった主観を卒業研究のテーマにしたのも、難しいことに挑戦してみたかったからです。鈴木先生に相談したら「結果がどうなるかわからないのが面白いから、とにかくやってみよう」と言ってくださいました。思うような結果には至っていませんが、就職後も研究を続けていくつもりです。主観とは、言うなれば個人的な好き嫌いのことで、その人の個性を形成する大きな要素です。AIに主観という概念を学ばせることで、主観を持ったAI、つまり個性を持ったAIを生み出すことができれば、結果としては面白いと考えています。
小滝さんは、答えが出るかどうかもわからないテーマにチャレンジしました。古典的な方法だとだいたい結果は想像がつくのですが、今回ばかりは本当にどうなるか、指導する私にもわからない状態でした。卒業研究で重視されるのはプロセスですが、学生は結果を求めたがるものです。そんな中で「とにかくやってみよう」という姿勢は見事です。そもそも主観的分類というのは何を指しているのかというところからスタートして、どうやって証明するのかということも含めて、誰も解いたことのない問題に挑戦した彼の卒業研究は、学生としてはトップクラスではないかと思っています。
「困ったことはお互いにすぐ言おう」というのが私の研究室のモットーです。私の専門分野は人工知能(AI)ですが、植物工場で植物を作ったり、ドローンを飛ばしたり、マリンITに関わったり、函館市電のデータを分析したりと、とにかく研究フィールドが広い上に、私がよく無茶振りをするので、学生同士が、どうやったらいいか、使えるソフトウェアはないか、それをどうやって使うか、お互いによく相談し合っています。逆に言うと、一人で悩んでいても解決しないくらい先端的なことに取り組んでいるわけです。みんなで知恵を出し合うことは、お互いの成長にもつながりますし。
AIに関わる計算能力のレベルが上がったおかげで、これまで不可能だったことがどんどん可能になっています。そのスパンは加速度的に短くなっており、2045年にはAIの能力が人類を超える「シンギュラリティ」が起こると言われています。そこで重要なのが、AIには真似のできない発想力です。多彩な学びと刺激がある未来大は、その力を鍛えるには最適の環境です。その中でも特に研究分野が自由な複雑系コースで、無理だと思うようなことに挑戦する中で、AIを使いこなせる人材になってください。
写真:開発した自動飛行ドローンを使っての夜間飛行による撮影。未来大学から裏夜景と漁火が見える。
写真:人物写真を浮世絵風に変換する人工知能の開発。日本文化を理解する人工知能を目指している。
SNSやインターネット広告が普及するにつれて、社会の情報量は急激に増え続けています。情報過多の中、商品の特長やメッセージを端的に表現するキャッチコピーの需要は高まっていますが、その制作には高度なスキルや文章テクニックが必要です。また、実際のキャッチコピーではわかりやすい比喩が多く用いられています。そこで私が卒業研究のテーマに選んだのが「比喩的キャッチコピー生成システムの提案」です。キャッチコピー生成システムと比喩生成システムを組み合わせて、比喩表現を含むキャッチコピーを自動生成するシステムを開発しています。
具体的には、映画データベースサイトに掲載されている映画のあらすじをベースにして、対象語(キャッチコピーの対象となる語)、特徴語(対象語が持つ特徴や性質)、喩える語(対象語を喩える語)を抽出・生成し、この3つのキーワードを組み合わせてキャッチコピーを制作しようという試みです。対象語と特徴語は、映画のあらすじの文中から抽出します。たとえばギャンブルを扱った映画であれば、対象語は「ギャンブル」、特徴語は「興奮、一獲千金」などが考えられます。その対象語と特徴語から、喩える語を自動で生成するシステムを構築しました。
評価実験は、ジャンルの異なる5つの映画作品で行いました。どの作品でもまずまずの結果が得られましたが、サスペンスやコメディのように、テーマやシチュエーションが明快な映画のほうが、より対象語を抽出しやすい傾向がありました。現状では3つのキーワードが出てくる段階ですが、将来的にはキャッチコピーを自動で生成することを目標にしています。先行研究との比較ができなかったこともあって、自己採点するとすれば65点くらいでしょうか。それでも「情報処理北海道シンポジウム2020」で発表ができたことはとても良い経験になりました。
もともとは小説のキャッチコピー生成を考えていたのですが、寺井先生とも相談して、インターネット上であらすじのデータが多くアップされている映画を対象にすることにしました。ネックとしては、あらすじ自体が短かったり、ラストまで書かれていなかったりするので、観た人のレビュー情報も加えられると、より単語のバリエーションが増えた中から抽出できるのではないかと考えています。研究を進める中で取得した機械学習や自然言語処理の知識を活かし、大学院でもこの研究を進めて、自分自身が納得できる成果を出すことを目指します。
知能システムコースは人間の思考にさまざまなアプローチで取り組むコースなので、研究対象の幅が広いというのが大きな特徴です。認知心理学や自然言語、ロボット、人工知能まで多彩な研究をしている先生がいらっしゃいます。私の専門分野は認知科学で、人間が言語を用いて行う思考や言語表現に関わる創造的思考を対象に、人の思考メカニズムに関する研究を行っています。「薔薇のような生活」のように、「薔薇」と「生活」という異なる概念の組み合わせによって生じる創造的思考が、どのような条件で起こりやすいのかといったことについて明らかにすることが目標です。
キャッチコピーの生成は、文章要約を含めてよく行われている研究テーマで、中心となる対象やそれを表現する特徴を抽出する先行研究もあります。その中でも呉さんは、私の専門でもある比喩生成のメカニズムを取り入れた研究内容にしています。学会でのオンライン発表もうまく出来たと思いますが、システムのプロトタイプへの意見やコメントを集めるというのも参加の目的のひとつでした。多くの方から有意義なアドバイスを頂き、プロトタイプに修正を加えると精度も上がりました。今後は大学院で、実際にキャッチコピーとしてどのような形にしていくか検討していきます。
キャッチコピーの制作には創造的な思考が必要です。人がキャッチコピーを作る場合、表現するために最適なフレーズは何なのか、呉さんの研究はその発想支援のような形でも使えるのではないかと考えています。考える側からすると、一見関連のなさそうなワードのほうがインスピレーションを刺激されるということがあるかもしれません。そのあたりも検証していく必要があるでしょう。人間のような柔軟な思考や行動を可能とする人工知能の実現を目指す一方で、人間の知的創造をサポートするシステムも作る、そんな私たちのコースで、一緒に新しい「知能」について考えてみませんか。
写真:自然言語処理技術を応用し、人間の思考メカニズムを研究。
写真:2019年度卒業生による学会発表