シラバス情報

授業コード
520340
オムニバス
科目名
データ工学
科目名(英語)
Data Engineering
配当学年
2年
単位数
2単位
年度学期
2025年度秋学期
曜日時限
集中講義
対象学科
先_データ
コース
科目区分
専門科目
必選の別
選択科目
担当者
秋山 純一
教室
2-375
実務家教員担当授業
授業の目的と進め方
解析の対象となるデータは、種類によって持ちうる特性は様々であり、特性に応じてデータの解析手法を選択する必要がある。本科目では、統計的仮説検定の手順を理解した上で、存在する様々なデータの解析手法を学び、コンピュータ上で実践するための知識と技術を修得する。更に、ベイズ統計学の概要を取り扱い、より多様なデータ解析手法があることを学ぶ。
達成目標1
統計的仮説検定の手順を理解し、t分布などの確率分布に従う検定ができる。【20%】 
達成目標2
カイ2乗検定、回帰分析などの様々な多変量解析の手法を理解し、コンピュータ上でデータを処理できる。【40%】
達成目標3
データの事前分析・解析方法について修得し、目的に応じた分析・解析方法を選択できる。【20%】
達成目標4
乗法定理、ベイズの定理などの、ベイズ統計学の基礎概念を理解し、説明ができる。【20%】
達成目標5
達成目標6
達成目標7

アクティブラーニング
ディスカッション
ディベート
グループワーク
プレゼンテーション
実習
フィールドワーク
その他課題解決型学習

授業計画
授業時間外課題(予習および復習を含む)
第1回
ガイダンス
数理統計の復習
数理統計で履修した内容、または高校数学レベルの確率・統計の内容を復習する(予習1時間)。基本統計量、確率変数、確率分布、統計的仮説検定の手順を復習する(復習1時間)。 
第2回
推測統計学の実際①
自由度の概念を定性的に理解しておく(予習1時間)。母数と統計量、正規母集団、不偏性、一致性、有効性、標本平均の不偏性、不偏推定量、標本分散(不偏分散)、自由度について復習する(復習1時間)。
第3回
推測統計学の実際②
正規分布だけではなく、t分布も利用されるようになった背景を調べておく。(予習1時間)。t分布、母比率、標本比率、母比率の推定、母平均の検定(t検定)、母比率の検定について復習する(復習1時間)。  
第4回
推測統計学の実際③
分散分析の活用事例を思いつく限り挙げておく(予習1時間)。分散分析、グループ間偏差、グループ内偏差、グループ間変動、グループ内変動、F分布、分散分析表について復習する(復習1時間)。
第5回
多変量解析『カイ2乗検定』
カイ2乗検定が活用できる場面を調べておく(予習1時間)。独立性の検定、カイ2乗検定について復習する(復習1時間)。
第6回
多変量解析『単回帰分析』
単回帰分析が活用できる場面を調べておく(予習1時間)。単回帰分析、回帰方程式、目的変量、説明変量、回帰係数、最小2乗法、残差平方和(残差変動)、決定係数について復習する(復習1時間)。
第7回
多変量解析『重回帰分析』
重回帰分析が活用できる場面を調べておく(予習1時間)。重回帰分析、偏回帰係数、分散共分散行列、非線形回帰について復習する(復習1時間)。
第8回
多変量解析『主成分分析』
主成分分析が活用できる場面について調べておく(予習1時間)。主成分分析、寄与率、主成分得点、第2主成分、変量プロット化について復習する(復習1時間)。
第9回
多変量解析『因子分析』
因子分析が活用できる場面について調べておく(予習1時間)。因子分析、共通因子、パス図、因子得点、因子負荷量について復習する(復習1時間)。  
第10回
多変量解析『共分散構造分析』
共分散構造分析が活用できる場面について調べておく(予習1時間)。共分散構造分析について復習する(復習1時間)。
第11回
多変量解析『判別分析』
判別分析が活用できる場面について調べておく(予習1時間)。判別分析、判別関数、群間偏差、郡内偏差、相関比、判別関数の決定原理について復習する(復習1時間)。
第12回
多変量解析『数量化によるアンケートデータの分析』
数量化の手法について、概念を理解しておく(予習1時間)。数量化について復習する(復習1時間)。
第13回
ベイズ統計学①
確率の用語について整理しておく(予習1時間)。同時確率、条件付き確率、乗法定理、ベイズの定理、原因の確率、結果の確率、事後確率、尤度、事前確率、ベイズ確率について復習する(復習1時間)。
第14回
ベイズ統計学②
ベイズ統計学の活用方法を調べておく(予習1時間)。理由不十分の原則、ベイズ更新、ベイジアンネットワーク、ベイズ分類、ナイーブベイズフィルター、ベイズ統計学について復習する(復習1時間)。


課題等に対するフィードバック
・小テスト:解答後、全て解説を行う。
・授業中提出課題、実習課題:手順を事前に解説する。
・記述課題:内容を事前に講義する。
評価方法と基準
授業中に逐次実施する以下の項目について、総合評価を60%以上で合格(C評価以上)とする。
出席・態度(20%)、授業中提出課題(20%)、実習課題(15%)、小テスト(25%)、記述課題(20%)
期末試験は無いが、進捗により最終回のテストを実施する場合がある。
テキスト
涌井 良幸, 涌井 貞美 (著)『統計学の図鑑 (まなびのずかん)』技術評論社 (2015年) ISBN: ‎ 978-4774173313
参考図書
日花 弘子 (著)『Excel データ分析の教科書 仕事に役立つデータの準備・分析・グラフ化の方法』 SBクリエイティブ(2022年)ISBN:978-4815612337
中原 治 (著)『基礎から学ぶ統計学』羊土社(2022年) ISBN:978-4758121217
科目の位置づけ(学習・教育目標との対応)
データサイエンスプログラムにおいて、本科目はデータサイエンス応用科目(選択)である。数理統計(データサイエンス基礎科目・必修)の直系の発展科目として位置づけている。統計検定2級レベルのうち、基礎的な知識と計算を学ぶと共に、コンピュータで統計処理をする応用的な操作を実践する。
履修登録前の準備
・テキスト必携(本年度の数理統計と共通)。講義中の説明において頻繁に図表を参照し、課題の出題範囲としても使用する。
・ノートPC必携(インターネット接続可、Microsoft Office ExcelとTeamsがインストール済)。電源が無い状態で、充分に稼働する状態のバッテリーを推奨する。
・履修の制限は無いが、数理統計(データサイエンスプログラム必修科目)の履修を前提としている。あるいは、高校数学の確率・統計の復習をしておくことが望ましい。