セミナー開催一覧
HTML5
機能拡張技術と実現手法
クルマの電子化・
ICTの進展と次世代への
技術的アプローチ
ヘテロジニアス・
マルチコア・プロセッサの
基礎と応用技術
西久保靖彦のかくなる”失敗のススメ
西久保靖彦のB級サラリーマンの実践処世術
エッセイの広場
  機械学習入門 ビッグデータ解析の基礎理論・アルゴリズム・実装技術の習得を目指して  
 
 
 
第1回 10/ 7(月)  生成モデルに基づくパターン認識  最尤推定法(1)           終了
第2回 10/21(月)  最尤推定法(2)           終了
第3回 10/28(月)  ノンパラメトリック推定法      終了
第4回 11/18(月)  ベイズ推定法              終了
第5回 11/25(月)

お申込受付中!


 識別モデルに基づく機械学習

 回帰(1)                 終了
第6回 12/ 2(月)  回帰(2)                 終了
第7回 12/16(月)  分類(1)                 終了
第8回 1/20(月)  分類(2)
第9回 1/27(月)  データの前処理  線形次元削減
第10回 2/ 3(月)  非線形次元削減とクラスタリング
 
 
 
講 師:
東京工業大学 大学院情報理工学研究科 計算工学専攻
     准教授 杉山 将 氏
受講料:
全10回通し受講 194,000円(税込)
第1回〜第4回受講 99,000円(税込)
第5回〜第8回受講 99,000円(税込)
第9回、第10回 61,000円(税込)
  MATLAB有料オプションを希望する場合は別途料金がかかります。
教科書:
・「統計的機械学習 -生成モデルに基づくパターン認識」 (第1回〜4回で使用)
・「イラストで学ぶ機械学習 -最小二乗法による識別モデル学習を中心に」
 (9/18発売)
(第5回〜10回で使用)
  教科書代は受講料に含まれます。セミナー当日はテキストも配布します。
会 場:
 東京工業大学 大岡山キャンパス MAP
時 間:
 17:00〜20:30
特 典:
本講座にお申し込みいただくと
日経エレクトロニクス誌を最新号1冊+1年間(26冊)プレゼントします。
ご送本開始はセミナー開催後になります
 

 
 
■ 本講座の開催主旨 ■
インターネットやセンサーから多種多様なデータを容易に入手できるビッグデータ時代がやって来ました。これら大量のデータを適切に解析することにより新たな知見を獲得し、ビジネスチャンスにつなげようという機運が高まっています。このようなビッグデータの解析には、データの背後に潜む規則や知識を見つけ出す機械学習と呼ばれる統計技術が重要な働きをします。
機械学習の技術は、近年のコンピュータ性能の飛躍的な向上と相まって、目覚ましい速さで発展しています。回帰や分類など標準的なデータ解析タスクに対しては既に様々なソフトウェアが開発されていますので、それらの使い方を習得することにより定形のデータ解析を行うことができます。しかし、多くの実データ解析タスクでは、解析したいデータに合わせて学習アルゴリズムを拡張・修正する必要があるため、様々な機械学習手法の基礎となる数学的な考え方もきちんと把握しておくことが望まれます。
しかし、発展著しい機械学習分野の最先端のアルゴリズムは、統計学、確率論、最適化理論などの高度な数学を駆使して設計されているため、初学者が習得するのは困難です。
そこで本講座では、ビッグデータ解析のための機械学習の基礎技術習得を目指して、統計的学習の基礎理論から、実践的なアルゴリズム、および、それらの実装技術をわかりやすく解説します。
   
 
  ■ 講義の流れ
様々な機械学習タスクに対して、直感的な目的、数学的な定式化、具体的なアルゴリズム、実装技術を解説します。機械学習分野の性質上、アルゴリズムの説明に数式を使用しますが、できるだけ前提知識を仮定せず、その場で理解できるように配慮します。
 
  ■ 使用ツール
MATLAB(MATLABをインストールしたノートパソコンは、毎回各自でご用意ください)
※Matlabの用意が出来ない方には、 有料のオプションを20名様分用意していますので、
 お早めにお申込み下さい。
 
  ■ MATLAB演習で必要なスキル
MATLABを使用した経験があることが望ましいですが、プログラミングとしてはごく基礎的な知識・技術しか必要としませんので、C、Java、R、Pythonなど他の言語でのプログラミング経験があれば問題ありません。
 
  ■ 成果目標
機械学習アルゴリズムの実装技術だけでなく、様々な機械学習手法の基礎となる数学的な考え方も獲得することを目指します。実践的な機械学習技術を習得するためには、数学的知識と実データ解析技術の両方をバランスよく身につけることが重要です。
 
  ■ 事前知識
線形代数、微分積分、確率と統計の基礎知識、および、MATLAB、C、Java、R、 Pythonなどでの簡単なプログラミング経験
 
  ■ 受講対象
広くデータ解析に関わっているエンジニア、データサイエンティストの方々
 (画像認識分野/クルマのドライバ支援・インフォテインメント分野/次世代のIoTやM2Mのシステム
  開発分野/医療機器開発分野/音声やセンサーなどの信号処理分野/電力分野/製鉄・ガラス・
  化学プラント分野 )
 
   
 
カリキュラム

第1回 〜 第4回  生成モデルに基づくパターン認識
データが何らかのシステムを通して生成される時、そのシステムのモデルを活用することにより、有効に学習を行うことができます。
「生成モデルに基づくパターン認識」では、データを生成するシステムの確率モデル同定を通したパターン認識技術を紹介します。
この技術は、ヒトの声帯モデル、自然言語の文法モデル、ロボットの物理モデルの同定を通した音声認識、自然言語処理、ロボット制御などに用いられています。
今後は車のデザイン、医療画像処理、センサ解析などへの応用が期待されており、本講ではその基礎となる統計的パターン認識の技術を身につけていただきます。

第 1 回
生成モデルに基づくパターン認識:最尤推定法(1)
開催日 : 2013年 10月 7日(月)

1. パターン認識の概要
2. 識別関数のよさを測る規準
3. 最尤推定法
4. ガウス最尤推定によるパターン識別器の構成
5. 計算機実習


▲このページの上へ

第 2 回
生成モデルに基づくパターン認識:最尤推定法(2)
開催日 : 2013年 10月 21日(月)

1. 最尤推定法の理論的性質
2. 最尤推定法におけるモデル選択
3. ガウス混合モデル
4. EMアルゴリズム
5. 計算機実習


▲このページの上へ


第 3 回
生成モデルに基づくパターン認識:ノンパラメトリック推定法
開催日 : 2013年 10月28日(月)

1. カーネル密度推定法
2. 最近傍密度推定法
3. 最近傍識別器
4. 交差確認法
5. 計算機実習


▲このページの上へ



第 4 回
生成モデルに基づくパターン認識:ベイズ推定法
開催日 : 2013年 11月18日(月)

1. ベイズ推定法の枠組み
2. ベイズ推定法の数値計算法
3. ベイズ推定法の近似計算法
4. ベイズ推定法におけるモデル選択
5. 計算機実習


▲このページの上へ


第5回 〜 第8回  識別モデルに基づく機械学習
データの生成モデルを正しく同定することにより、あらゆるデータ解析が可能となります。
しかし、生成モデルに関する事前知識が得られない場合は、生成モデルの正確な同定は困難であり、その結果データ解析の精度が低下してしまいます。
「識別モデルに基づく機械学習」では、生成モデルの推定を経由せず、回帰や分類を直接行う機械学習手法を紹介します。
識別モデルに基づく機械学習は、ファイナンスデータ解析、一般画像認識、SNSデータ解析など物理的なモデル化が困難な問題に有効で、今後はビッグデータに基づく顧客情報分析,電力ネットワーク解析などへの応用が期待されています。
本講では、実用性の高い機械学習技術を身につけていただきます。

第 5 回
識別モデルに基づく機械学習:回帰(1)
開催日 : 2013年 11月 25日(月)

1. 学習モデル
2. 最小二乗回帰
3. 正則化回帰
4. オンライン回帰
5. 計算機実験


▲このページの上へ



第 6 回
識別モデルに基づく機械学習:回帰(2)
開催日 : 2013年 12月 2日(月)

1. スパース回帰
2. ロバスト回帰
3. 最適化アルゴリズム
4. 計算機実験


▲このページの上へ



第 7 回
識別モデルに基づく機械学習:分類(1)
開催日 : 2013年 12月16日(月)

1. 最小二乗分類
2. サポートベクトル分類
3. 半教師付き学習
4. 転移学習
5. 計算機実験


▲このページの上へ



第 8 回
識別モデルに基づく機械学習:分類(2)
開催日 : 2014年 1月20日(月)

1. アンサンブル分類
2. 確率的分類
3. マルチタスク分類
4. 系列データの分類
5. 計算機実験


▲このページの上へ


第9回、第10回  データの前処理
解析すべきデータが高次元の場合、次元の呪いとよばれる現象のため、多くの機械学習技術はその威力を十分に発揮することができません。
「データの前処理」では、高次元の冗長なデータから低次元の有益な表現を見つけ出すための次元削減手法と、データのグルーピングを、行うクラスタリング手法を紹介します。
次元削減やクラスタリングは、データの可視化にも用いられる手法であり、マーケティング戦略の決定などに用いられる重要な技術です。
本講では、次元削減とクラスタリングの標準的な技術を身につけていただきます。

第 9 回
データの前処理:線形次元削減
開催日 : 2014年 1月 27日(月)

1. 主成分分析
2. 局所性保存射影
3. フィッシャー判別分析
4. 局所フィッシャー判別分析
5. 半教師付き局所フィッシャー判別分析
6. 計算機実験


▲このページの上へ



第 10 回
データの前処理:非線形次元削減とクラスタリング
開催日 : 2014年 2月 3日(月)

1. カーネル主成分分析
2. ラプラス固有写像
3. K平均クラスタリング
4. スペクトル・クラスタリング
5. クラスタリングにおけるモデル選択
6. 計算機実験


▲このページの上へ

 
■ 講師 紹介 ■
杉山 将 氏
東京工業大学 大学院情報理工学研究科 計算工学専攻 准教授
2001年に東京工業大学より博士号を取得。
2001年より同大学の助手、2003年より助教授(2007年より准教授に改称)、現在に至る。
2003年から2004年に、アレキサンダー・フォン・フンボルト財団フェローとしてドイツ・ベルリンのフラウンホーファー研究所に
滞在。
2006年に、ヨーロッパ委員会エラスムス・ムンダス・フェローとして、英国・エディンバラのエディンバラ大学に滞在。
2007年に、非定常環境下での機械学習の研究に対してIBMよりFaculty Awardを受賞。
2011年に、密度比推定に基づく機械学習の研究に対して情報処理学会より長尾真記念特別賞を受賞。
機械学習とデータマイニングの理論研究とアルゴリズムの開発、および、その信号処理、画像処理,ロボット制御などへの
応用研究に従事。

*外部リンクプロフィール

 
お申し込みへ
 
機械学習入門