|
教員名 : 田村 仁
|
授業コード
520950
オムニバス
科目名
機械学習とロボット工学
科目名(英語)
Machine Learning and Robotics
配当学年
2年
単位数
2単位
年度学期
2025年度秋学期
曜日時限
金曜1限
対象学科
先_ロボ
コース
科目区分
専門科目
必選の別
選択科目
担当者
田村 仁
教室
1-303
実務家教員担当授業
授業の目的と進め方
本授業では、特に現代のロボット工学で使用される深層強化学習について修得する。本授業の講義と演習を通じて、機械学習によってロボットを制御できるようになる。
機械学習の概要および強化学習と深層強化学習についての講義と、強化学習や深層強化学習を用いて様々な演習を行う。 達成目標1
深層学習の概要と深層強化学習の概要について説明できるようになる(20%)
達成目標2
pythonのプログラムを実行できるようになる(20%)
達成目標3
強化学習によって演習問題を解くことができる(20%)
達成目標4
深層強化学習によって演習問題を解くことができる(20%)
達成目標5
OpenAI GymやVPythonやPyBulltなどのフレームワークの使い方を理解する(20%)
達成目標6
達成目標7
アクティブラーニング
ディスカッション
ディベート
グループワーク
プレゼンテーション
実習
○
フィールドワーク
その他課題解決型学習
授業計画
授業時間外課題(予習および復習を含む)
第1回
ガイダンス・機械学習と人工知能
ロボット工学における機械学習の概要について講義による説明を受ける 予習: テキスト8pまでを読んで調べておく(60分)
復習: テキスト8pまでのキーワードをまとめる(60分) 第2回
pythonとTensorflow
pythonプログラミングについて講義で説明を受け、演習を行って理解する (予習): pythonとAnacondaとTensorflowについてしらべておくこと(60分)
(復習): TensorFlowとTF-AgentsとOpenAI-Gymのインストールを完了させ、動作させる(60分) 第3回
深層学習
深層学習について講義を受け、実際に動作させる演習を行う 予習: テキストp38までを読んで調べておく(60分)
復習: TensorFlowによる学習を完了させる(60分) 第4回
深層学習の演習
畳み込みニューラルネットワークについての講義を受け、手書き文字認識の演習を行う 予習: テキストp60までを読んで調べておく(60分)
復習: TensorFlowを使って手書き文字認識をさせる(60分) 第5回
畳み込みニューラルネットワーク
実用的な畳み込みニューラルネットワークとして AlexNet、VGG、ResNetなどについて講義で説明を受け、実際に動作させて理解する 予習: AlexNet、VGG、ResNetについて調べておく(60分)
復習: 各モデルの事前学習モデルをロードして動作させてみる(60分) 第6回
強化学習
強化学習について講義を受け、Qラーニングの演習を行う 予習: テキストp94までを読んて調べておく(60分)
復習: ネズミ学習問題と倒立振子と迷路を完了させる(60分) 第7回
強化学習の演習
ネズミ学習問題と倒立振子と迷路探索をPythonを使った強化学習で解く演習を行う 予習: テキストp72まで読んで調べておく(60分)
復習: 状態遷移図について理解する(60分) 第8回
深層強化学習
深層強化学習について講義を受け、ネズミ学習問題へ応用する演習を行い、強化学習と深層強化学習の違いを理解する 予習: テキストp113まで読んで調べておく(60分)
復習: 深層強化学習でネズミ学習問題を完了させる(60分) 第9回
深層強化学習2
深層強化学習による迷路探索問題とOpenAI Gymを用いて倒立振子を深層強化学習で解く演習を行う 予習: テキストp124までを読んで調べておく(60分)
復習: 迷路と倒立振子を完了させておく(60分) 第10回
深層強化学習の演習
OpenAI Gymによるスペースインベーダーとリフティング問題を解く演習と、VPythonを用いてリフティング問題を解く演習を行う 予習: テキストp142まで読んで調べておく(60分)
復習: スペースインベーダーとリフティング問題を完了させる(60分) 第11回
解析的な解放とシミュレーションによる解法 物理シミュレータpyBulletを用いて倒立振子とリフティングを解く演習を行い、解析的な解き方とシミュレーションを用いた解き方の違いを理解する 予習: テキストp162までを読んで調べておく(60分)
復習: pyBulletを使った演習をすべて完了させる(60分) 第12回
対戦ゲーム
対戦ゲームの例として石取りゲームを深層強化学習で解く演習を行う 予習: テキストp179まで読んで調べておく(60分)
復習: 石取りゲームを完了させる(60分) 第13回
,
対戦ゲームの演習 複雑な対戦ゲームの例としてリバーシを深層強化学習で解く演習を行う 予習: テキストp196までを読んで調べておく(60分)
復習: リバーシを完了させる(60分) 第14回
深層強化学習の現在
Double DQNやA3Cなどの最新手法に関する講義と演習を行う 予習: テキストp200までを読んで調べておく、またこれまでの授業でわからなかったことをまとめておく(60分)
復習: この授業の目標を達成できたかどうか確認する(60分) 課題等に対するフィードバック
サポータルの小テストで正答率が低かった問題に対しては授業内で解説の時間を設ける。
Teamsでの演習課題のルーブリックへの適合度を示しコメントを返却する 評価方法と基準
(1)各回のキーワードに関する小テスト50%
(2)テキストの例題プログラムを使った課題や総合課題のレポートの合計点50% 合計点数で60点以上をC評価とする。 テキスト
牧野浩二・西崎博光『TensorFlowによる深層強化学習入門』オーム社(2021)[ISBN:978-4-274-22673-1]
参考図書
-
科目の位置づけ(学習・教育目標との対応)
本科目はディプロマポリシーに示されている複数の専門分野の知識を有するクロスリンク型の技術者を育成するために、本学科で必要となる機械・電気・情報・制御の4分野の中で情報分野の専門科目の一つとして位置づけられる。またカリキュラムポリシーに示されている情報処理技術者の資格取得に必要な知識・技術を実践的に修得するための科目の一つである。 本科目で学んだ内容は、3年の「人工知能」「画像・視覚システム」「実世界志向インターフェースへの挑戦」という情報系科目へつながる。
履修登録前の準備
1年次「プログラミング言語」履修相当のプログラミング能力を有すること。
コンピュータの基本操作とインターネットへのアクセス方法を修得しておくこと。 |