シラバス情報

授業コード
210079
オムニバス
科目名
情報検索特論
科目名(英語)
Advanced Study on Information Retrieval
配当学年
1年
単位数
2.00単位
年度学期
2025年度春学期
曜日時限
月曜4限
対象学科
博前_電子
コース
科目区分
大学院科目
必選の別
選択科目
担当者
佐藤 進也
教室
実務家教員担当授業
担当教員は、Web情報検索に関する研究開発等の実務経験がある。その経験を活かし、情報検索に関して実践的なテーマや実例を授業で扱っている。
授業の目的と進め方
テキストを扱う情報処理の研究にあたって必要となる検索の基本概念・技術(アルゴリズム)を修得し、検索に関連するシステムの構成・処理内容を理解する。そのために、まず、情報検索で標準的に用いられてきた処理方式および方式の評価方法を学ぶ。その上で、文書分類や情報フィルタリングなど情報検索の応用技術と、それらの実装例について学ぶ。 
達成目標1
情報検索のモデルについて説明できる【25%】
達成目標2
情報検索システムを実現するために必要となるテキスト処理について説明できる【25%】
達成目標3
情報検索システムの評価方法について説明できる【25%】
達成目標4
情報検索技術の応用である文書分類や情報フィルタリングの手法について説明できる【25%】
達成目標5
達成目標6
達成目標7

アクティブラーニング
ディスカッション
ディベート
グループワーク
プレゼンテーション
実習
フィールドワーク
その他課題解決型学習

授業計画
授業時間外課題(予習および復習を含む)
第1回
情報検索の枠組み 
情報検索を実現するうえで考慮すべき事柄を検討し、整理しておく。(2時間) 
第2回
Pythonの基礎
実習で使用するPythonの実行環境をインストールしておく。(2時間) 
第3回
文字コード、n-gram、正規表現
文字コード、n-gram、正規表現について調べ、まとめておく。(2時間) 
第4回
形態素、bag-of-words、Zipfの法則
形態素、bag-of-words、Zipfの法則について調べ、まとめておく。(2時間) 
第5回
tf・idf、Okapi BM25 
tf・idf、Okapi BM25について調べ、まとめておく。(2時間) 
第6回
ベクトル空間モデル
ベクトル空間モデルについて調べ、整理しておく。(2時間)
第7回
検索システムの評価尺度
検索システムの評価尺度、特に精度、再現率、F値について調べ、めとめておく。(2時間)
第8回
クラスタリング 
文書のクラスタリングについて調べ、まとめておく。(2時間)
第9回
次元削減 
次元削減の概念、手法について調べ、まとめておく。(2時間)
第10回
トピックモデル
トピックモデルについて調べ、まとめておく。(2時間) 
第11回
文書分類 
文書分類の手法について調査し、まとめておく。(2時間)
第12回
分散表現
分散表現の概念、手法を調べ、まとめておく。(2時間)
第13回
曖昧性解消
曖昧性解消の手法を調べ、まとめておく。(2時間)
第14回
探索的検索
探索的検索の概念・手法について調べ、まとめておく。(2時間)


課題等に対するフィードバック
課題は授業の中で答え合わせをするので復習に役立てること。  
評価方法と基準
課題に対するプレゼンテーションの内容と質疑応答の状況を総合的に評価する。
割り当てられたプレゼンテーションと課題をすべて完了した場合に合格とする。
テキスト
考図書[1]をベースにしつつ、各回の内容に合わせて適宜他の資料も利用する。 
参考図書

[1] Christopher D. Manning『Introduction to Information Retrieval』(2008)【ISBN:978-0521865715】
[2] 徳永健伸著『情報検索と言語処理』東京大学出版局(1999)【ISBN:978-4130654050】
[3] 北研二・津田和彦・獅々堀正幹『情報検索アルゴリズム』共立出版(2002)【ISBN:978-4320120365】 
科目の位置づけ(学習・教育目標との対応)
検索というテーマを通してテキスト処理の手法を学ぶ。秋学期開講科目である『Web情報処理特論』を学ぶための知識を身に付ける科目としても位置づけられる。受講生が事前に調べまとめてきた情報を手がかりにゼミ形式で授業を行う。また、Pythonを使った実習も行うので、各自ノートPCを持参すること。
履修登録前の準備
線形代数、確率・統計の基礎を学んでおくこと。