授業内容・計画(詳細)の情報


ページを読み終えましたら、ブラウザを終了させてください。

【基本情報】
2018年度 秋学期  
授業科目名 データアナリシス
曜日 時限 金-1
テーマ Excelで学ぶ統計データ解析の入門
キーワード 統計学 データの要約・可視化 推定・検定


【授業要旨または授業概要】
 
データサイエンスは、ビジネスや研究など多くの分野への活用が期待され、社会的要請が高い。データサイエンスのひとつの手法が統計学である。
この授業では、統計学の基本的な考え方を理解し、表計算ソフト(Excel)を用いた統計関数の使い方やデータの可視化を習得して、初歩的なデータ分析の理解を深めることを目的とする。
なお、高等学校での統計知識は前提とせず、初歩的な内容から段階的に学習していくほか、統計学の基本的な考え方の理解と実践を優先して、詳細な数式・数学的証明は省略することがある。
また、Excelを、統計学の基礎理論・概念を理解するためのツール、及び、初歩的なデータ解析を実際に行うためのツールとして、授業内で積極的に活用していく。


【学修の到達目標】
◆授業で育成する力・スキル
全学共通: 自ら考える力
センター: 情報処理力(論理力と問題解決力)

◆具体的な到達目標
1) 記述統計の基本手法を理解し、データの集約・要約・可視化を行うことができる 
2) 確率の基礎概念と代表的な確率分布の特性を理解し説明できる 
3) 推測統計の概念を理解し、母集団の特性に関する初歩的な推定ができる 
4) 仮説検定の手法を理解し、初歩的な検定を行うことができる 
添付ファイル:データサイエンス入門2018秋評価基準.pdf

【授業計画】
◆スケジュール
第1回 ガイダンス Excelの基本操作復習(式・参照・関数・グラフ)
第2回 データの種別、基本統計量の計算、基準値・偏差値
第3回 データの集計、度数分布表とグラフ化
第4回 ピボットテーブルの活用
第5回 二次元データの集計・要約・可視化(1) (散布図、相関係数、回帰式・最小二乗法)
第6回 二次元データの集計・要約・可視化(2)  (クロス集計表、ファイ係数・クラメールの連関係数、相関比)
第7回 確率変数と確率分布 
第8回 推測統計の考え方、標本の分析と中心極限定理
第9回 区間推定(信頼区間の計算)
第10回 仮説検定の基本概念、母平均の検定(z検定・t検定)(1)
第11回 母平均の検定(z検定・t検定)(2)・母比率の検定
第12回 2グループの比較に関する検定
第13回 適合性の検定・独立性の検定
第14回 相関比の検定(F検定)・授業のまとめ
定期試験
◆予習・復習
第1回 ガイダンス Excelの基本操作復習(式・参照・関数・グラフ)
事前学習:シラバスを確認すること
事後学習:各自のExcelスキルを再確認し、授業が前提とするExcelスキルレベル到達を目指して練習を重ねること(テキスト11.1該当)

第2回 データの種別、基本統計量の意味と計算、基準値・偏差値 
事前学習:「偏差値」とは一体どんなものか、なぜそのようなものがあるのか、考えてみよう。
事後学習:与えられたデータの基本統計量を計算する課題に取り組むこと

第3回 データの集計、度数分布表とグラフ化
事前学習:ExcelのFREQUENCY関数・COUNTIF関数の使い方を予習しておこう。
事後学習:与えられたデータから度数分布表とグラフを作成する課題に取り組むこと

第4回 ピボットテーブルの活用
事前学習:テキストを参考にピボットテーブルの作成や操作の予習をしておこう
事後学習:ピボットテーブルの利用に関する課題に取り組むこと

第5回 二次元データの集計・要約・可視化(1)  (散布図、相関係数、回帰式・最小二乗法)
事前学習:「相関」とはどのような意味か、「因果」との違いはどのような点にあるか、それぞれ考えてみよう。
事後学習:散布図の作成と相関係数の計算を行う課題に取り組むこと。

第6回 二次元データの集計・要約・可視化(2) (クロス集計表、ファイ係数・クラメールの連関係数、相関比)
事前学習:
事後学習:クロス集計表の作成と各係数の計算を行う課題に取り組むこと。各係数の意味について確認しておくこと。

第7回 確率変数と確率分布
事前学習:確率の基礎知識について高校数学等の復習をしておこう。
事後学習:代表的な確率分布の特徴を確認する課題に取り組むこと。

第8回 推測統計の考え方、標本の分析と中心極限定理
事前学習:テキストを参考に推測統計と記述統計の位置付けの違いを予習しておこう
事後学習:標本の統計量が従う分布と関連するExcel関数の使い方について確認しておくこと。標本平均及び不偏分散の不偏性、大数の法則・中心極限定理を体感する課題に取り組むこと

第9回 信頼区間の計算
事前学習:区間推定の基本的な考え方について、テキストを参考として予習しておくこと
事後学習:信頼区間の計算課題に取り組むこと。信頼区間の意味を確認しておくこと。

第10回 仮説検定の基本概念、母平均の検定(z検定・t検定)(1)
事前学習:仮説検定の考え方や基本手順等について、テキストを参考として予習しておくこと
事後学習:母平均に関する仮説検定の課題に取り組むこと。

第11回 母平均の検定(z検定・t検定)(2)・母比率の検定
事前学習:Excelにおける正規分布、t分布関連関数の利用方法を確認しておくこと
事後学習:母平均・母比率に関する仮説検定の課題に取り組むこと。

第12回 2グループの比較に関する検定
事前学習:2つのグループを比較する際、「対応がある場合」「対応がない場合」とはどのような意味か、テキストを参考に予習しておこう
事後学習:2グループの比較(母平均・母比率)に関する仮説検定の課題に取り組むこと

第13回 適合性の検定・独立性の検定
事前学習:第6回で取り上げたクラメールの連関係数を復習しておくこと。Excelにおけるχ2乗分布関連関数の利用方法を確認しておくこと
事後学習:適合性の検定・独立性の検定を行う課題に取り組むこと

第14回 相関比の検定(F検定)・授業のまとめ
事前学習:第6回で取り上げた相関比を復習しておくこと。ExcelにおけるF分布関連関数の利用方法を確認しておくこと。これまでの学習内容を確認し、質問事項をまとめておくこと
事後学習:相関比の検定を行う課題に取り組むこと。定期試験に備え学習を継続すること
◆集中授業の期間
 

【履修上の注意点】
・先修条件はないが、Excelでの実習・課題が大きな比重を占めるため、Excelの基本操作(データの入力、演算、参照、代表的な関数の利用、グラフ化など)は修得済みであることを前提として授業を進める。
・「ICT入門(情報システム入門A)」を履修済みであることが望ましい。
・履修希望者が多い場合は、初回ガイダンスで抽選を行うので、必ず出席すること
・授業を欠席した場合、授業内容や課題内容を確認し、各自でリカバリーを行うこと。


【成績評価の基準および方法】
課題 50%
定期試験 50%

到達度90%以上でS、80%以上でA、70%以上でB、60%以上でC、60%未満をEとする。
但し、2/3以上の出席がない場合は成績評価の対象としない(「/」評価となる)


【教科書・参考書】
区分 書名 著者名 発行元 定価
教科書 Excelで学ぶ統計解析入門 菅民郎 オーム社 2700
参考文献 サイコロとExcelで体感する統計解析 石川幹人 共立出版 2000
参考文献 実例とExcelによる統計学トレーニング 片山直也 牧野書店 2400
参考書 統計解析がわかる 涌井良幸,涌井貞美 技術評論社 1880


【その他の教材】
授業資料(予習指示や課題を含む)を授業支援システム等で公開する。
必要に応じて資料の配布を行う。


【担当教員への連絡方法】
質問・相談は、授業時のほか、下記電子メールアドレスで受け付ける。
miyakawa@tsc.u-tokai.ac.jp
メールでの質問・相談の際は、適切な表題を付けるとともに、メール本文先頭に、学生証番号・氏名・授業名・開講曜日・時限を明記すること。
また、電子メール以外のコミュニケーションツールについても別途案内する(特に、授業支援システム経由での連絡に注意すること)。

PAGE TOP