授業内容・計画(詳細)の情報


ページを読み終えましたら、ブラウザを終了させてください。

【基本情報】
2018年度 春学期  
授業科目名 データアナリシス
曜日 時限 水-1
テーマ Excelで学ぶ統計データ解析の入門
キーワード 統計学 データの要約・可視化 推定・検定


【授業要旨または授業概要】
 
データサイエンスは、ビジネスや研究など多くの分野への活用が期待され、社会的要請が高い。データサイエンスのひとつの手法が統計学である。
この授業では、統計学の基本的な考え方を理解し、表計算ソフト(Excel)を用いた統計関数の使い方やデータの可視化を習得して、初歩的なデータ分析の理解を深めることを目的とする。
なお、高等学校での統計知識は前提とせず、初歩的な内容から段階的に学習していくほか、統計学の基本的な考え方の理解を優先して、詳細な数式・数学的証明は省略することがある。
また、Excelを、統計学の基礎理論・概念を理解するためのツール、及び、初歩的なデータ解析を実際に行うためのツールとして、授業内で積極的に活用していく。


【学修の到達目標】
◆授業で育成する力・スキル
全学共通: 自ら考える力
センター: 情報処理力(論理力と問題解決力)

◆具体的な到達目標
1) 記述統計の基本手法を理解し、データの集約・要約・可視化を行うことができる 
2) 確率の基礎概念と代表的な確率分布の特性を理解し説明できる 
3) 推測統計の概念を理解し、母集団の特性に関する初歩的な推定ができる 
4) 仮説検定の手法を理解し、初歩的な検定を行うことができる 
添付ファイル:データサイエンス入門(データアナリシス)評価ルーブリック.pdf

【授業計画】
◆スケジュール
第1回 ガイダンス Excelの基本操作復習(式・参照・関数・グラフ化)
第2回 データの種別、集計・可視化
第3回 データの要約(平均・中央値・分散等の代表値、標準化など)
第4回 二次元データの集計・要約・可視化(1) (クロス集計表、ファイ係数・クラメールの連関係数、相関比)
第5回 二次元データの集計・要約・可視化(2)  (散布図、相関係数、回帰式・最小二乗法)
第6回 中間まとめ試験
第7回 推測統計の考え方、確率変数とその特徴 
第8回 代表的な確率分布、パーセント点とp値
第9回 標本の分析、標本統計量とその特徴、中心極限定理
第10回 信頼区間の計算
第11回 仮説検定の基本概念(考え方、基本手順、片側検定・両側検定など)
第12回 t検定(平均値、平均値の差)
第13回 一元配置分散分析
第14回 適合性の検定・独立性の検定

定期試験
◆予習・復習
第1回 ガイダンス Excelの基本操作復習(式・参照・関数・グラフ化)
事前学習:シラバスを確認すること
事後学習:各自のExcelスキルを再確認し、授業が前提とするExcelスキルレベル到達を目指して練習を重ねること。

第2回 データの種別、集計・可視化
事前学習:新聞・Web記事などから、統計的な分析結果として各自が興味を持ったものを探してくること
事後学習:集計表作成やグラフ化の実習課題に取り組むこと

第3回 データの要約(平均・中央値・分散等の代表値、標準化など)
事前学習:主な代表値の意味について予め調べておくこと。また、平均値の具体的な事例をあげられるようにしてくること。
事後学習:主な代表値の計算実習課題に取り組むこと。各代表値や標準化の意味について確認しておくこと。

第4回 二次元データの集計・要約・可視化(1) (クロス集計表、ファイ係数・クラメールの連関係数、相関比)
事前学習:質的データ×質的データ、もしくは、質的データ×量的データのアンケート回答例をそれぞれ作ってくること(空想・仮想的でもよい)
事後学習:クロス集計表の作成と各係数の計算を行う課題に取り組むこと。各係数の意味について確認しておくこと。

第5回 二次元データの集計・要約・可視化(2)  (散布図、相関係数、回帰式・最小二乗法)
事前学習:新聞・Web記事などから「相関」のキーワードがあるものを調べてくること。もしくは、量的データ×量的データの仮想的なデータを作ってくること。
事後学習:散布図の作成と相関係数の計算を行う課題に取り組むこと。相関と因果の違い、回帰式の意味について確認しておくこと。

第6回 中間まとめ試験
事前学習:中間まとめ試験に備えて、第2回〜第5回の内容を復習しておくこと。
事後学習:中間まとめ試験の自己採点を進め、疑問を解消しておくこと。

第7回 推測統計の考え方 、確率変数とその特徴
事前学習:確率の基礎知識について指定資料などを参考に予習しておくこと(高校数A)
事後学習:推測統計の基本的な考え方を振り返っておくこと。離散的・連続的な確率変数としてどのようなものがあるか、考えてみること。

第8回 代表的な確率分布、パーセント点とp値
事前学習:事前に紹介した事例について、どのような分布になるか考えてくること
事後学習:各分布の例パーセント点・p値を計算する課題に取り組むこと。各分布の分布概形とパラメータ、期待値・分散をまとめておくこと。

第9回 標本の分析、標本統計量とその特徴、中心極限定理
事前学習:Excelにおいて標本を得る方法について資料を基に試してみること。
事後学習:標本の統計量が従う分布と関連するExcel関数の使い方について確認しておくこと。標本平均及び不偏分散の不偏性、大数の法則・中心極限定理を体感する課題に取り組むこと

第10回 信頼区間の計算
事前学習:区間推定の基本的な考え方について、ワークシートや指定資料を参考として予習しておくこと
事後学習:信頼区間の計算課題に取り組むこと。信頼区間の意味を確認しておくこと。

第11回 仮説検定の基本概念(考え方、基本手順、片側検定・両側検定など)
事前学習:仮説検定の考え方や基本手順等について、ワークシートや指定資料を参考として予習しておくこと
事後学習:事前学習のワークシートを完成させてくること。平均及び比率に関する仮説検定の課題に取り組むこと。

第12回 t検定(平均値、平均値の差)
事前学習:t分布の概形・特徴のほか、Excelにおけるt分布関連関数の利用方法を確認しておくこと
事後学習:t検定による仮説検定の課題に取り組むこと。

第13回 一元配置分散分析
事前学習:第4回で取り扱った相関比の考え方・計算法を復習しておくこと。ExcelにおけるF分布関連関数の利用方法を確認しておくこと
事後学習:複数グループの平均に差がないかの分析課題に取り組むこと

第14回 適合性の検定・独立性の検定
事前学習:第4回で用意したクロス集計表について復習しておくこと。Excelにおけるχ2乗分布関連関数の利用方法を確認しておくこと
事後学習:適合性の検定・独立性の検定を行う課題に取り組むこと
◆集中授業の期間
 

【履修上の注意点】
・先修条件はないが、Excelでの実習・課題が大きな比重を占めるため、Excelの基本操作(データの入力、演算、参照、代表的な関数の利用、グラフ化など)は修得済みであることを前提として授業を進める。
・「ICT入門(情報システム入門A)」を履修済みであることが望ましい。
・履修希望者が多い場合は、初回ガイダンスで抽選を行うので、必ず出席すること
・授業を欠席した場合、授業内容や課題内容を確認し、各自でリカバリーを行うこと。

【成績評価の基準および方法】
課題(事前課題・実習課題) 50%
中間まとめ試験 20%
定期試験 30%

到達度90%以上でS、80%以上でA、70%以上でB、60%以上でC、60%未満をEとする。
但し、2/3以上の出席がない場合は成績評価の対象としない。


【教科書・参考書】
区分 書名 著者名 発行元 定価
参考文献 サイコロとExcelで体感する統計解析 石川幹人 共立出版 2000
参考文献 実例とExcelによる統計学トレーニング 片山直也 牧野書店 2400
参考書 統計解析がわかる 涌井良幸,涌井貞美 技術評論社 1880


【その他の教材】
授業資料(予習指示や課題を含む)を授業支援システム等で公開する。
必要に応じて資料の配布を行う。


【担当教員への連絡方法】
質問・相談は、授業時のほか、下記電子メールアドレスで受け付ける。
miyakawa@tokai.ac.jp
メールでの質問・相談の際は、適切な表題を付けるとともに、メール本文先頭に、学生証番号・氏名・授業名・開講曜日・時限を明記すること。
また、電子メール以外のコミュニケーションツールについても別途案内する。

PAGE TOP