教員名 : 林 直樹
|
授業科目名
特別演習4
開講年次
2年
開講年度学期
2024年度後期
単位数
2単位
科目ナンバリング
E-CS-214S
担当教員名
木村 文則、林 直樹
担当形態
共同
【科目の位置付け】
この授業の基礎となる科目
次に履修が望まれる科目
【授業の目的と到達目標】
【授業の目的】
(1)技術としてのテキストマイニングの可能性を原理的レベルまで掘り下げて理解する。 (2)テキストを解析する上では、定量と定性、両面からのアプローチが必須な事情を実践的に把握する。 (3)プロジェクトを立ち上げて論理構成し実証するグループワークを通じて、研究発表のノウハウを身につける。 【受講生の到達目標】 (1)テキストマイニングの手法を用いてテキストを分析し、有益な結果を導き出すことができる。 (2)テキストを成立させた背景事情とともに内容を読解し、テキストマイニングの限界を補うことができる。 (3)中間発表とそれへのフィードバックを適切にふまえ、独自の分析視角に立つ最終発表を仕上げることができる。 【授業の概要】
テキストマイニングとは、土台となる文字情報(テキスト)データから、一定の文字列を特定の観点に関連付けて掘り出す(マイニング)ことにより、土台データの性質または構造を読み取る情報解析技術のことである。近年急速に人口に膾炙しており、情報学のみならず、人文社会科学分野でも応用が進められている。
例えば、中世の某貴族Aが著した日記に登場する諸人物の関係性を、この手法を用いて調査できる。日ごとに段落を区切り、同一段落中に登場するAと他人物の組み合わせを解析したとき、人物Bが最も頻繁、次がC、最後にDとEがほぼ同等に少ない頻度といった結果が出れば、登場頻度で親密度を分類し、人物相関図を描き出すことができる。 しかしながら、この手法の精度は決して100%には達しない。なぜなら、インターネット上の連語検索と同様、あくまで文字列同士を関連付けているにすぎないからである。最後は人間自身がテキストを読み、コンテキ(ク)ストすなわち文脈を定性的に把握したうえで、結果の精度を検証しなければならない。そしてこの検証がフィードバックとして有効に機能することで、テキストマイニングの手法自体がさらに洗練されたものとなっていく。同時に、この手法が担保する定量的な客観性から、読み手としての人間が教えられることも多々あるだろう。 そこでこの授業では広く「経済古典」をテキストにし、用語の出現頻度や相関等を解析(共起ネットワーク分析や対応分析など)したうえで、実際はどのような文脈で著者がそのワードを用いているか精読を通じて確認する作業を繰り返しながら、古典を読み解いていきたい。単に人間の目だけで古典を読む場合とは異なる知見が必ず得られるはずである。 【授業計画と授業の方法】
第 1回:ガイダンス/コサイン類似度について【講義】
第 2回:古典原著のテキストマイニング【講義】 第 3回:古典邦訳のテキストマイニング【講義】 第 4回:KH Coderの活用(1)【講義&演習】 第 5回:KH Coderの活用(2)【講義&演習】 第 6回:KH Coderの活用(3)【講義&演習】 第 7回:人物相関図の作成(1)【講義】 第 8回:人物相関図の作成(2)【講義】 第 9回:中間発表準備【演習&課題】 第10回:中間発表&講評【演習】 第11回:経済古典の精読(1)【講義】 第12回:経済古典の精読(2)【講義】 第13回:最終発表準備(1)【演習&課題】 第14回:最終発表準備(2)【演習&課題】 第15回:最終発表&講評【演習】 経済系の教員と情報系の教員が共同で担当する授業である。 まず経済系教員が経済古典をテキストマイニングすることの意義を説明し、続いて情報系教員が専用アプリKH Coderの活用法を伝授する。その後は実践に入り、中間発表に向けて、経済古典を素材にした人物相関図の作成や、同アプリの機能を駆使した定量分析を行う。中間発表後は古典精読の機会を設け、量のみでは拾いきれない定性的領域の存在を把握してもらう。以上をふまえて最終発表を行い、総合的な研究成果を受講者全員で共有することで理解を深める。 受講者数にもよるが、発表は原則グループワークとして行ってもらう。自ら問いを立ててグループメンバーに提案し、相互に話し合った上で理解を得、その問いのもと分析プロジェクトを進め、得られた結果を教員を含めたグループ外に向けて公表し、フィードバックを得るという実践プロセスを経る。発表機会は二度あるため、一次発表の成果を反省的に回顧したうえで二次発表を行うことができ、理解度が向上する。 テキスト・参考書
テキストは特に無し。分析対象としての「テキスト」は青空文庫などから拝借する。参考書としては小峯敦編『テキストマイニングから読み解く経済学史』ナカニシヤ出版(2021年)など。KH Coderの仕様について樋口耕一『社会調査のための計量テキスト分析』ナカニシヤ出版(初版2014年、第二版2020年)を参照する場合もある。
授業時間外の学修
(事前学修)
教員作成のレジュメ・資料等をあらかじめ配布する。それらに目を通した上で受講することが望ましい。 (事後学修) 講義形式の回については各自で復習すべきことはもちろんである。発表に向けてグループワークを行う段には、あるいは発表後のフィードバックを受け止める局面では、個人レベルのみならずグループ単位でよく話し合い、見解を共有して、互いの水準を引き上げる努力を怠らないこと。 成績評価の方法と基準
・到達目標に鑑み、中間発表30%と最終発表70%の合算で評価する。
・発表内容の是非に関しては、①主題のユニークさ②問いの明確さ③分析手法の的確さ④論理的構成の緻密さ⑤実証(検証)の手堅さ、等を評価軸として、担当教員間で見解をすり合わせながら総合的に判断する。 備 考
2018年度にスタートした授業です。毎年、新たな試みを必ず盛り込みながら、テキストマイニングという新しい技術と向き合い続けてきました。教員にとっても刺激となることが多く、この授業を通じて芽生えた問題意識が研究論文に発展したケースもあります。
この授業に限った話ではありませんが、大学では、他人にせつかれて勉強するだけでなく、自ら問いを立て、とことん「研究する」ことの面白さを、ぜひ学び取ってください。未開拓かつ有意義な問題領域は本当にたくさんあります。学問は半永久的に続く共同の営みです。 担当教員の実務経験の有無
無
実務経験の具体的内容
|