シラバス情報

授業科目名
ビッグデータ活用
開講年次
3年
開講年度学期
2023年度前期
単位数
2.00単位
科目ナンバリング
E-IN-306L
担当教員名
木村 文則
担当形態
単独
【科目の位置付け】
この授業の基礎となる科目
次に履修が望まれる科目
【授業の目的と到達目標】
(授業の目的)
データマイニングとテキストマイニングについての基礎知識を学ぶ.また,これらを実践する際の一連の流れについても理解する.その上でさらにデータマイニングとテキストマイニングのツールについても理解を深め,それらのツールを実際に使えるようになることを目指す.
(受講生の到達目標)
到達目標1: データマイニングの手法を活用し,データの分析ができる.
到達目標2: テキストマイニングの手法を活用し,テキストデータの分析ができる.
到達目標3: 仮説を検証するのに適切な手法を選択して分析することができる.
【授業の概要】
インターネットが普及したことにより,さまざまな情報が活用できるようになり,「ビッグデータ分析」が注目されている.本講義では,「ビッグデータ分析」の根幹をなす技術であるデータマイニングとテキストマイニングについての基礎知識を学ぶ.また、近年話題となっている人工知能などのトピックについても学習する.
【授業計画と授業の方法】
(授業計画)
1. ビッグデータ分析の概要(講義)
2. 統計ソフトRの基本(講義、演習)
3. 散布図,相関係数,基本統計量(講義、演習)
4. 単回帰分析(1):単回帰分析の基本(講義、演習)
5. 単回帰分析(2):信頼区間、予測区間(講義、演習)
6. 重回帰分析(1):重回帰分析の基本(講義、演習)
7. 重回帰分析(2): 標準偏回帰係数、多重共線性(講義、演習)
8. 距離(講義、演習)
9. 階層的クラスタリング(講義、演習)
10. 非階層的クラスタリング(講義、演習)
11. テキストマイニング(講義、演習)
12. テキストマイニングの実践(1): 共起ネットワーク、階層的クラスタリング(講義、演習)
13. テキストマイニングの実践(2): 多次元尺度構成法、対応分析(講義、演習)
14. テキストデータの加工(講義、演習)
15. 人工知能(講義)

(授業の方法)
授業は15回全て,パワーポイント等で作成されたスライドを用いて教員が講義する形で行います.また,講義中に必要に応じて演習も行います.講義資料は事前にkyouzaiフォルダなどで配布しますので,テキストと合わせて事前学修に役立ててください.
テキスト・参考書
講義資料をパワーポイントにより配布する

(参考書)
Rで学ぶ日本語テキストマイニング
石田 基広, 小林 雄一郎
ひつじ書房
ISBN 978-4894766549

「データマイニング入門 -Rで学ぶ最新データ解析-」
豊田秀樹
東京図書
ISBN 978-4-489-02045-2
授業時間外の学修
(事前学修)
講義資料を確認し,学習内容を把握しておく.
(事後学修)
講義で扱った分析手法を,別のデータに対して自分で分析を行う.
成績評価の方法と基準
(成績評価の方法)
提出課題 (40%): 毎回の授業後に課す課題の提出
期末レポート(60%)

(成績評価の基準)
到達目標1: データマイニングの手法を理解し,統計分析フリーソフト「R」を使いデータの分析ができる.
到達目標2: テキストマイニングの手法を理解し,テキストマイニングのフリーソフトウェア「KH Coder」を使いテキストデータの分析ができる.
到達目標3: 収集したテキストデータに対して仮説を立て,その仮説を分析するのに適切な手法を選択して分析し,その分析および考察を行うことができる.
備  考
担当教員の実務経験の有無
×
実務経験の具体的内容