|
教員名 : 前期_電子情報メディア工学専攻教員
|
授業コード
220550
オムニバス
科目名
統計的データ解析特論
科目名(英語)
Advanced Statistical Data Analysis
配当学年
1年
単位数
2.00単位
年度学期
2025年度秋学期
曜日時限
月曜3限
対象学科
博前_電子
コース
科目区分
大学院科目
必選の別
選択科目
担当者
前期_電子情報メディア工学専攻教員
教室
実務家教員担当授業
担当教員の荒川は自動車メーカーで人間工学研究やHMI開発の経験があり、この経験に即した指導を行う。
授業の目的と進め方
研究を進めていく上で、データを適切に処理し、解析し、解析結果の妥当性を統計的に訴求することが重要である。また、データの予測が必要な状況も生じる。本授業では、実験等で得られたデータを統計的に解析するための手法について、理論と実践の両側面から学ぶ。すなわち、いかにして統計的な解析手法が導かれているか理論的に説明すると共に、統計ソフトRを用いて実データを統計的に解析する術を身につける。授業は、座学後、受講生がR言語を用いて実データを解析する方法で進める。
達成目標1
それぞれの統計的データ解析手法の特徴について理解する。【20%】
達成目標2
それぞれの統計的データ解析手法の理論的背景について理解する。【20%】
達成目標3
統計ソフトRの操作に習熟する。【10%】
達成目標4
統計ソフトRを用いて実データの分析ができる。【25%】
達成目標5
実データ分析結果を考察し、結果の妥当性を客観的に評価できる。【25%】
達成目標6
達成目標7
アクティブラーニング
ディスカッション
ディベート
グループワーク
プレゼンテーション
実習
○
フィールドワーク
その他課題解決型学習
授業計画
授業時間外課題(予習および復習を含む)
第1回
ガイダンス/統計的データ解析の意義
統計的手法の重要性について調べる。また、自身が進める研究の中で統計的手法を用いる状況について把握する(予習1時間)。どのような統計的手法があるか整理する。自身の研究で適用できる手法をリストアップする(復習2時間)。
第2回
統計ソフトRについて/Rの初歩(受講生のR習熟度に応じて「初歩〜発展」)
統計ソフトRをインストールし、基本的な操作方法を学ぶ(予習1時間)。基本的な関数の使い方やデータの読み込みや書き出し、データフレームの概念に慣れる。また、グラフの可視化手法を確認する(復習2時間)。
第3回
統計の尺度/基本統計量
統計の尺度について、どのような尺度があるか、また、具体例を調べる(予習1時間)。自身が今後の研究で扱うデータがどのような尺度であるか調べ、適切な統計処理の方法について理解する。また、任意のデータについて基本統計量を算出する(復習2時間)。
第4回
統計的仮説検定/パラメトリック検定とノンパラメトリック検定/t検定/Wilcoxonの順位和検定/Wilcoxonの符号付順位検定
統計的仮説検定、t検定、Wilcoxonの順位和検定、Wilcoxonの符号付順位検定についてそれぞれ調べる。帰無仮説と対立仮説、t検定とWilcoxonの順位和検定(符号付順位検定)の違いについて理解する(予習1時間)。任意のデータについて検定を施し、検定結果の妥当性について考察する(復習2時間)。
第5回
カイ二乗検定/分散分析(ANOVA)
カイ二乗検定、分散分析についてそれぞれ調べる(予習1時間)。任意のデータについて検定を施し、検定結果の妥当性について考察する(復習2時間)。
第6回
その他の検定手法
Kruskal-Wallis検定、Friedman検定、F検定などについて調べる(予習1時間)。任意のデータについて検定を施し、検定結果の妥当性について考察する(復習2時間)。
第7回
多変量解析/回帰分析
多変量解析の全体像について調べ、そのうちで回帰分析の立ち位置について理解する。回帰式の導出方法を理解する。また、変数選択について調べる(予習1時間)。任意のデータに対して回帰分析を施し、回帰式の妥当性について理解する(復習2時間)。
第8回
主成分分析
多変量解析の全体像について調べ、そのうちで主成分分析の立ち位置について理解する。主成分分析の概念について理解する(予習1時間)。任意のデータについて主成分分析を施し、結果の妥当性について理解する(復習2時間)。
第9回
因子分析
多変量解析の全体像について調べ、そのうちで因子分析の立ち位置について理解する。因子分析の概念について理解する(予習1時間)。因子分析と主成分分析の違いについて確認する。任意のデータについて因子分析を施し、結果の妥当性について理解する(復習2時間)。
第10回
多次元尺度構成法/判別分析
多変量解析の全体像について調べ、そのうちで多次元尺度構成法と判別分析の立ち位置について理解する(予習1時間)。任意のデータについて多次元尺度構成法および判別分析を施し、結果の妥当性について理解する(復習2時間)。
第11回
時系列解析(1)
ヒストグラムの作成方法、自己相関係数の計算方法について調べておく。時系列グラフを作成する理由について考察しておく(予習1時間)。時系列データが、レベル成分、傾き成分、周期成分に分解されることを把握しながら、平滑化・フィルタリング・予測の違いを確認すること。任意のデータについてHolt-Winters法を用いて時系列解析を行う(復習2時間)。
第12回
時系列解析(2)
ARモデル、MAモデル、ARMAモデル、ARIMAモデルについて調べる(予習1時間)。任意のデータについて、ARモデル、MAモデル、ARMAモデル、ARIMAモデルを適用し、予測をする(復習2時間)。
第13回
時系列解析(3)
状態空間モデルとDAG(Directed Acyclic Graph)について調べる(予習1時間)。線形・ガウス型状態空間モデル、ローカルレベルモデル、ローカルトレンドモデルの違いを再確認する。任意の時系列データに対して、カルマンフィルタリング、カルマン予測、カルマン平滑化を施して予測してみる(復習2時間)。
第14回
総括
これまで学んだデータ解析手法について復習する(予習1時間)。それぞれのデータ解析手法の特徴を理解した上で、任意のデータについて、どのような解析手法が適切か、自分なりに考えた上で、解析する(復習2時間)。
課題等に対するフィードバック
基本的には授業内で課題の解答・解説をすることでフィードバックとするが、状況によってはメールやTeams経由でフィードバックをすることもある。
評価方法と基準
レポート提出により評価する。不十分な考察の場合は再提出となる。60点以上で合格とする。
テキスト
プリントを適宜配布する。
参考図書
「基礎からわかる時系列分析—Rで実践するカルマンフィルタ・MCMC・粒子フィルタ—」 萩原淳一郎 ・瓜生真也・牧山幸史著、石田基広監修 技術評論社 【ISBN-13: 978-477419646】
科目の位置づけ(学習・教育目標との対応)
修士論文、ひいては博士論文でデータを扱う際に、表面的な解釈だけでなく、統計的理解に基づいた解釈ができるようになるための科目である。また、統計ソフトとして活用されているRを使いこなすことで、ビッグデータの処理や解釈を容易にする能力も身につけることを期待する。
履修登録前の準備
特に無いが、これまでに学んだ線形代数学と統計学の復習をしておくことが望ましい。また、現代制御の知識があると理解しやすい。
|