教員紹介

竹之内 高志

准教授
TAKENOUCHI, Takashi

学生へのメッセージ

統計的機械学習は統計的手法を用いて、観測データから有用なルール・知識を抽出する方法です。楽しいですよ。

研究内容

機械学習,特にパターン認識に関する研究を行なっています.

機械学習

人間は知識・経験などの情報を基に学習し,自らの行動を良い方向に修正することができます.機械学習とは,学習を実現するための数理モデルや様々な統計処理を駆使して,世の中に溢れる大量のデータから有用な情報・構造を抽出し,機械に学習をさせることでその動作を向上させる研究で,様々な分野で用いられています.

パターン認識

パターン認識とは,与えられた情報(入力)を基にラベル(出力)を予測する様に機械を学習させる問題です. 予測の精度は高ければ高いほどよいのですが,予測精度を高めようとすれば,より複雑な学習機械が必要となり,学習させるのも大変になっていきます.このような問題に,そこそこの精度を持つ学習機械を沢山用意しておいて,それらを組み合わせることで高精度の予測を目指す,集団(アンサンブル)学習というアプローチを用いて取り組んでいます.これはいわば,「三人寄れば文殊の知恵」という諺を機械学習で実現していると捉えることもできます.

研究の魅力

機械学習/パターン認識の本質は, データから何らかの情報(例えば入出力の関係)を取り出すことにあります.規模の小さなデータであれば人間の目で関係を見つけることも可能ですが,データの規模が大きくなり複雑化すると人間がデータから直接情報を読み取ることは難しくなります.我々は,このような大規模で複雑なデータに対して有効な数理モデルを構築し,また構築した数理モデルがどのような性能を発揮するかを理論的に解析しています.数理モデルを用いることで人間の情報処理能力を超えた処理を達成することが出来るという点が機械学習研究の最も魅力的な点だと感じています.

実績

様々なパターン認識技術の開発と理論解析を行なっています.

  • 頑健化
    パターン認識ではラベル情報を用いて学習を行うが,このラベル情報は多くの場合, 人の手で付与されるため,ミスラベル(ラベル反転ノイズ)が生じることがある.このような問題に対し,ミスラベルがどのように生成されているのかを確率モデルで記述し,ノイズに対して頑健な判別手法を提案した.
  • AUC尺度に基づくパターン認識
    例えば医療分野等ではAUC尺度を最大にするような学習機械が求められるが,そのための手法の開発とその性能に関する理論解析を行った.

主な著作・論文

  • A novel boosting algorithm for multi-task learning based on the Itakura-Saito divergence.
    In Proceedings of Bayesian Inference And Maximum Entropy Methods In Science And Engineering (MAXENT 2014), pp. 230—237, 2014.
  • An extension of the Receiver Operating Characteristic curve and AUC-optimal classification.
    Neural computation, 24(10), pp. 2789-2824, 2012.
  • Ternary Bradley-Terry model-based decoding for multi-class classification and its extensions.
    Machine Learning, 85(3), pp.249-272, 2011.
  • A multi-class classification method based on decoding of binary classifiers.
    Neural Computation, 21(7), pp.2049-2081, 2009.
  • Robustifying AdaBoost by adding the naive error rate.
    Neural Computation, 16, pp.767-787, 2004.