Activity
2024-05-14

[Message for FUN]20年後の10万人と、いま目の前の10人を喜ばせる研究(平田圭二)

[Message for FUN]

前職のNTTの研究所から公立はこだて未来大学(以下、未来大)に移られた平田圭二先生。先生がこれまで研究してきた「音楽情報学」と「モビリティの研究」とでは、その対象の規模と研究スパンが両極端だと語ります。インタビューでは、着任の経緯や、ご自身の研究対象である音楽と人工知能に対する想い、さらに、次の世代の学生のみなさんに贈る言葉を語っていただきました。

インタビューに答える平田先生
インタビューに答える平田先生

着任の経緯と研究

期待と実態

前職のNTT研究所は定年が51歳だったので、僕はぎりぎりまでNTTに居て次は大学へ行きたいと行先を探していました。未来大には、すでに知り合いの先生がいっぱいおられました。今回、同時に定年退職を迎える大沢英一先生や、僕と同年齢の松原仁先生。また同じく東大出身の中島秀之先生(現、札幌市立大学理事長・学長)、NTT研究所の先輩である片桐恭弘先生などです。知り合いが楽しそうにやっているということもあり、未来大に決めました。

未来大に着任する前、他大学で客員教員として数名の修士課程の学生を指導したことがあったので、修士の学生たちと一緒に仕事して、研究会で1年間に1、2回発表して2年間に1本の論文を書いて、みたいなイメージを持って未来大に来ました。そこで、自分の研究室を立ち上げ、元気な学生に来てもらおうと。ところが、着任後数年間は1、2年生の教養の講義のみを担当していたので、学生に僕の専門分野が何かを知ってもらう機会は少なく、学生が卒業研究の研究室を選ぶ時に平田研究室がパッと思い浮かぶという風にはなりませんでした。講義を含めて、いろんな機会を使って学生に平田研究室をアピールした結果、平田という教員が「音楽情報学」という学問をやっているということが浸透していったと思います。

平田・竹川研の立ち上げ

僕は研究室の学生の数は多い方が良いと考えていたので、自分が所属する知能システムコースから卒研生を毎年5、6人、他コースからは3人程度を受け入れていました。さらに、できるだけ多くの卒研生が修士課程に進学するよう強く勧めました(説得しました)。

僕が着任した翌年の2012年に、竹川佳成先生が情報デザインコースに着任されました。その竹川先生との出会いは、竹川先生がまだ修士の学生だった頃に遡ります。竹川先生が、NTT研究所にいた僕のところに就活で訪問してきたのです。それ以来の付き合いですから、かれこれもう20年くらいになります。竹川先生も僕も、学生時代に所属した研究室が大所帯だったので、研究室とは大勢の学生がワイワイするところであり、それが理想的だと考えていました。さらに、竹川先生が未来大に着任した時、たまたま竹川先生に割り当てられた部屋が僕の部屋と大変近かったことも重なり、それなら研究室を共同運営して大所帯の研究室を作ろうということになったのです。

音楽情報学の講義

「人工知能基礎」という学部の専門講義と、「知能メディア特論」という大学院の講義を担当するようになって、僕の専門分野が音楽情報学や人工知能であることを、よりリアルに学生に認識してもらえるようになったと思います。

今から6年ほど前に未来大で講義できるのもあと5年と気付いた時があって、世界中で僕にしかできない講義をしたい(するべきだ)とふと感じました。僕が担当していた大学院講義「知能メディア特論」では、それまで、学部ではコマ不足で教えきれないけど未来大生が必ず学んでおくべき知識の1つとしてJavaScriptを取り上げ、そのプログラミング演習をやっていました。そこで、「知能メディア特論」のタイトルはそのままで、中身を音楽情報学に刷新して講義を組み立て直しました。世界中で僕にしかできない講義なので、用意したスライドを使ってひたすら話したいことを話すというスタイルを採りました。僕の話を面白いと思う人だけ聞きに来てくれればいいと言い放っていたのですが、意外にも30人を超える履修者がいて、大学院講義としては多い方だったのではないかと思っています。

研究について

音楽情報学

音楽のロジック

「音楽情報学」というのは、僕なりの定義では、音楽を題材に人工知能(AI)を研究するということです。人工知能の「知能」は、人がする判断や活動に対応して、学習、推論、記憶、認識、識別などに分解されますが、音楽を聴いたり音楽を作曲、演奏しているときも、そのような判断や活動が行われています。

音楽の中にも自然言語に負けず劣らずちゃんとしたロジック、論理的な構造があります。歌うとき、ここでこう歌うとメッセージが強調されるとか、1番と2番とで歌い方を変えるとか、意図を持って工夫しますよね。つまり、音楽には皆で共有できるような意味があって、我々は音楽を使って何らかの非言語的なメッセージを伝えたり受け取ったりしているのです。

AIがより人間の社会に浸透していったら、AIと相談して音楽を作ったり、AIにギターを教えてもらったりするようになるでしょう。しかし、AIが「この音はこう弾くのです」と文字列で表示しても(あるいは音声合成しても)人間にギター演奏を教えることできません。人間の先生がやるように、生徒と一緒に弾いたり、強調すべき音を指し示したり、人間が適切に演奏できていないところだけ識別したり、その人その場に合った教え方を選択し、編み出す必要があります。そのためには、音楽の中にある論理的な構造、意味、非言語的なメッセージなどが何なのかを解き明かさねばなりません。

今のAIは、自然言語ベース、あるいは視覚ベースで人間とやりとりしています。しかし、さらに人間フレンドリな、人間どうしのように自然なやりとりができるAIを実現しようとしたら、音楽の構造や意味をしっかりと分かっていないといけません。

自分だけのための音楽?

学生と卒業研究テーマを相談していると、学生はよく、「自分が感動するような曲を生成するシステムを作りたい」とか、「オレが感じるように曲同士の類似性を判断するコンピュータを作りたい」と言います。これは、音楽が非常に個人的な体験であるということが大前提になっているわけですが、僕はその大前提は本当かなと思っています。

例えば、1時間の曲を1秒で作曲できるAIがあるとすると、何万曲、何億曲がアッという間に生成されることになります。すると例えば、ある人がオギャーと生まれた瞬間から1日以内に、その人が一生を終えるまでに聴く曲(聴かされる曲)をすべて作曲することができてしまいます。このような世界は現在でも容易に実現できてしまうわけですが、この時、音楽は音楽として機能しているのでしょうか。自分しか聴かないような音楽を一生聴き続けても、その人は満足できるのか楽しめるのかということです。

音楽と社会性は密接に関連していると思います。この曲はこの人もあの人も聴いている。漠然と世の中で聴かれているから、私も聴く。あるいは、私が聴いて良かったので、あなたにも聴いてほしいと勧める。一方、自分しか聴かない音楽を聴き続けて、誰とも「この曲いいよね」などと言い合わない、そういう音楽聴取体験を一生(あるいは1年間でさえ)続けられるものでしょうか? 僕は、そんな音楽は音楽として機能していないのではないかと思うのです。

今、「フィルターバブル(自分の嗜好や観点に沿った情報だけが提示される環境)」という言葉があります。そういうフィルターバブルの中では、自らどんな曲が好きかを言う前に、機械が勝手に自分の好きな曲を教えてくれます。「おすすめ機能」の方が私よりも私をよく知っているという世界です。フィルターバブルという世界の中には自分しか存在しておらず、そのような世界にどっぷりと浸かってしまうと、人は、社会性のない音楽を当たり前だと思い、そのような音楽を聴き続けられると思い込んでしまうのかもしれません。でも僕は、しっかりと社会性のある音楽の作り方とか音楽のあり方、関係性を音楽の研究テーマに反映させるべきだと思っています。

音楽の構造を解き明かしたい

音楽の構造や意味を解き明かすことが重要です。自然言語にはボキャブラリ、文法、品詞などが存在して、文全体の意味は個々の単語や句の意味から構成されます。AやTheなどの冠詞やAppleなどの単語が存在するので、林檎を想像したり、コンピュータメーカを想像したりできます。しかし音楽には単語がありません。例えばドという音だけが鳴った時、ドという1音に意味はなくドという1音がそこで鳴っただけです。ドという1音とソという1音を比べると、そこに意味の違いはあるでしょうか? でも、音が「ドドドド」と繋がったり「ドミソ」と同時に鳴ったりすると、何か意味を持ち始めます。音はどう集まるとどんな意味を持つのでしょうか。音楽には自然言語のような名詞や動詞という概念がないのに、どうして音楽は構造や意味を持てるのかというところが不思議になってきませんか。

例えば、繰り返しという構造は不思議です。自然言語では「太郎は駅に歩いていった」を1回しか言わなくても、3回繰り返しても、情報を少し強調する違いが生じるだけでしょう。しかし音楽の場合には、同じフレーズや楽節を繰り返すと繰り返さないでは意味がまったく違ってきます。例えば、クラシックにはABAと呼ばれる形式がありますが、2回目のAを省略したら楽曲が成立しなくなってしまうこともあります。音楽における繰り返しの意味や役割を知りたいと思っています。

新しい科学的知見を得るために、新しい数学も要請されるというケースがあります。例えばニュートンが力学を作った際に微積分を必要としたように、アインシュタインが相対性理論を作った際に新しい幾何学を必要としたように。大げさかも知れませんが、音楽の構造や意味を明らかにして、コンピュータ上でシミュレーションするには、新しい数学が必要になるかも知れません。我々(平田が共同研究している仲間)は、その研究分野に「計算論的音楽学」(Computational Musicology)という名前を付けて、それに関する書籍を2冊執筆しました:『Music, Mathematics and Language』(Springer、2022)と『音楽・数学・言語~情報科学が拓く音楽の地平』(近代科学社、2017)。

モビリティの研究

環境が変わって新しいテーマを

未来大に着任する2011年当時、研究環境がガラッと変わるのをきっかけに、何か新しい研究テーマを持てるとよいなと漠然と考えていました。そこに、2010年からモビリティ(交通や輸送)のプロジェクトを立ち上げておられた中島秀之先生や松原仁先生が僕に声を掛けてくださいました。

音楽情報学は、20年後に10万人ぐらいがジワジワと喜んでくれるような間接的な研究です。ところが、モビリティの研究はその真逆なのです。実際にフィールド実験をすると、直ぐその場で、目の前で10人が激しく喜んでくれる直接的な研究です。研究者としてこの両極端の喜びを生み出せる幸せを味わってしまうと、もうこの両極端それぞれの研究の良さがより鮮明に分かってしまいます。これがモビリティ研究と音楽情報学研究の二足の草鞋を履くことになったきっかけです。

モビリティの抽象化と仮想化

コンピュータサイエンス(計算機科学、情報科学)の柱の1つは抽象化と仮想化です。コンピュータサイエンティストの習性として、物事を見ると、常にその本質的な機能や構造を抜き出して(抽象化、仮想化)プログラムとして実現することを考える、ということが挙げられます。今まで、モビリティ関連の技術は、現場をそのまま工学的に扱うように発展してきました。例えば、どこかで待機しているタクシーをある場所に呼び出すというサービスを、今までは、無線電話、専用端末、コールセンタ、運行記録などのさまざまな要素を社会レベルでボトムアップに積み上げることで実現してきました。その結果、提供するサービスとそのハードウェアと制度が分かちがたく結びついていました。だから、バスでタクシーのようなサービスはできないし、その逆もできません。

では、例えばバスとタクシーの両方の良さを持った中間の乗り物を作りたいとします。今までのやり方では、車両はどうする、呼び出しシステムはどうする、料金はどうするといった所からボトムアップに考え始めることになります。コンピュータサイエンスの概念があれば、バスとタクシーが持つサービスや機能を抽象化して、抽象レベルで混ぜ合わせて新しい乗り物の概念を作り出し、それを具体化して実装するというやり方になります。このようなコンピュータサイエンス的な考え方をモビリティ分野にも取り入れることで、社会の設計や実装を効率化できますし、新しいサービスも生まれやすくなります。

配車エンジン

我々のプロジェクトは今、「配車エンジン」というものを作っています。お客さんが、自分は何時にここからここに行きたいというリクエストをシステムに送ったとします。配車エンジンはそのリクエストを即座に処理して、そのお客さんにとって一番希望に沿った快適な状況で移動できるように車両を割り当て、移動経路を設定します。配車エンジンは、どんなに多数のお客さん、多数の車両があっても、すべてのお客さんに最も満足してもらえるような車両割当てと移動経路設定をします。しかもこの配車エンジンはとても汎用性が高くて、1つのパラメータを変えるだけで、バスからタクシーまで連続的にサービスを変えられるのです。バスは定時刻定路線(決まった時刻に決まった路線を運行)で、タクシーはオンデマンド(各利用者の要望に合わせて即座に運行)ですが、定路線だけど定時刻でなかったり、定時刻だけど定路線でなかったりといったサービスが提供できるのです。さらに、例えば座席数10のマイクロバスがあったなら、5席はバスとして使っているお客さんが乗り、残りはタクシーとして使っているお客さんが乗る。そんな、バスとタクシーの機能を自由自在に組み合わせることも可能です。

さらにさらに、人を運ぶだけではなく、「貨客混載」といって荷物を運ぶこともできます。例えば先ほどのマイクロバスのどこかに配達用の荷物を積んでおいて、もし(再)配達する場所に近づいた時に送り先の家が在宅だったら届ける、というようなサービスもパラメータを変えるだけで実現できるのです。さまざまな要素を柔軟に組み合わせることで、ユニークなサービスが生まれる。我々のプロジェクトはそんなことを半自動的に実現する世界を目指して、2016年に「未来シェア」というベンチャ企業を設立しました(https://www.miraishare.co.jp/)。

2023年8月オープンキャンパスにて
2023年8月オープンキャンパスにて

メッセージ

僕は、自分の大学時代の恩師のメッセージをそのまま次の世代に引き継ぎたいと思います。大学時代の恩師は2人おられて、1人は元岡達先生、もう1人は田中英彦先生です。

元岡先生からいただいたメッセージは、「計算機は雑学である」です。コンピュータは、人間と同じようにあるいは人間を超えて、現実世界の多種多様なモノやコトを扱えるはずだという意味です。僕の場合で言えば、取り組んでいる人が少なかった音楽を対象に選びました。タクシーよりコスパが良くバスより利便性の高い配車をAIで生成するという研究の奥底にも、このメッセージが流れています。

田中先生からは、Commencementという英単語1つをメッセージとしていただきました。僕が田中先生から学位を授かりNTT研究所に就職する際にかけてもらったメッセージなのですが、「どういう意味ですか?」と思わず質問してしまいました(笑)。これは「卒業式」という意味と「始まり」という意味を合わせ持った素晴らしいメッセージなのです。僕は、これまで平田・竹田研を巣立っていった学生たちにも、これら2つの言葉を伝えてきました。

未来大と学生の未来

未来大には未来を創ってほしいと期待します。世界に出ていく人材を数多く輩出するような大学になってほしい。未来大の学生たちには、視野の広さ、本質を見抜く目を身に付けてもらいたい。

僕は格言を作るのが趣味なのですが、学生には「インプットなくしてアウトプットなし」とよく言っています。「インプット」は学び、体験などを通して取り込むこと、「アウトプット」は結論や価値を形にすること、判断、行動などを意味します。ここで重要なのは、悩んでも答えが出ない時は悩むのではなく、インプットすればいいということです。

大学院への進学に迷っている未来大生がよく言う理由は、「私には特にやりたい研究がない」というものです。僕は、それは当然だろうと思うし、未来大生以外の学生さんの多くもそう考えていると思います。原因の1つは、それまでの学びがインプットになっていなかったからです。テストで良い点数を取るために勉強していたのですから、それはやりたい研究をアウトプットするためのインプットにはなっていません。

大学院に進学して、学問に触れ、研究活動を体験するというインプットをすれば、おのずとアウトプットは付いてきます。それが未来を創ることにつながると信じています。大学院に進学する意義は、そういうインプットしてアウトプットするを実体験することだと思っていますので、「インプットなくしてアウトプットなし」というのも、学生たちへのメッセージにしたいと思います。