2023年度/1AKA011001
【月1】生物統計学演習 <前期>
(公大) / 生物統計学 (府大)
- 生物学的なデータから役に立つ情報を客観的に取り出すために、統計解析手法が用いられる。
- 本科目では、研究目的とデータの特徴から、適切な統計解析手法を選んで実行できるようになることを目標とする。
- 生物統計解析における心構え、バイオデータベースやウェブツールの利用方法、基本統計量の算出、検定、多重比較、相関係数の算出、回帰分析、主成分分析、クラスター分析、ネットワーク解析について、エクセルやRを用いた実習を行う。
- 担当教員氏名
- 尾形 善之
- 科目ナンバリング
- AKAABS32001-J2 (公大) / CAABS2205-J1 (府大)
- 授業管轄部署
- 農学部
- 授業形態
- 演習
- 開講キャンパス
- 中百舌鳥
- 開講区分
- 週間授業
- 配当年次
- 2年 (公大) / カリキュラムにより異なります。 (府大)
注意: 配当年次は学部・学科によって異なる場合があるので、UNIPAで確認してください。学年指定なしの表記は、要覧等を確認してください。
- 単位数
- 2単位 (公大) / 2単位 (府大)
注意: 実際の単位数は学部・学科によって異なる場合があるので、必ずUNIPAで確認してください。
- 到達目標
生物、生命科学データに対する統計解析の心構えを身につける
エクセル:基本操作、データ分析、統計関数を用いた作業、マクロプログラムの実行を実践できる
Rの基本操作、各種統計解析を実行できる
ビッグデータ(遺伝子発現データ)を適切に処理できる
- 統計解析の実行:主成分分析、基本統計量の算出、検定、相関係数の算出、ネットワーク解析を実行できる
- 各授業回の説明
- 成績評価方法
- 授業目標の項で述べた5項目の達成目標に従い、当日レポート(第1~15回の授業、75%)と期末レポート(25%)により評価する。当日レポートは出席確認を含み、5%×15回として計算する。合計で60%以上を合格(C以上)とする。合格者は各回の授業で実習した内容を実践できる。
- 履修上の注意
- 毎回、授業計画に記載したテーマに沿って講義と実習の形式で行う。原則として「当日レポート方式」で行う。
- 授業の構成は前半30分程度が講義で後半が実習となる。講義の後に「チェックポイント」の時間を設けて講義内容の理解度を確認する。毎回の実習の際に課題を出すので、レポートに纏めます。レポートの提出は出席の確認も兼ねる。
- 実習時間を確保するため、講義内容の「解説編」および「実習編」を予め提供するので、必ず予習すること。
- 参考書の「すぐわかる統計用語」は統計用語の辞書として適しているので、毎回提出するレポートの内容確認や次回の予習で理解が足りなかった箇所について、しっかり読んで理解すること。実習については、エクセルやRを使って統計解析するので、参考書などを参照して、操作方法に慣れておくこと。インターネットを利用して情報を集めるのも効果的である。
- 期末レポートの課題については第1回の講義中に提供する。各回の講義で習熟した内容について、そのつど期末レポートに取り組むことで、早く着実にスキルを習熟できる(期末レポートの完成も早まる)。
- 当日レポートは原則として授業終了時に提出するものであるが、当日中であれば受け付ける。担当教員の部屋(尾形、B11棟4階413号室)のレポート入れに提出すること。後日提出したものでも採点はするが、出席扱いにならない場合がある(学籍番号で出席が確認できた場合は、出席扱いにする)。
- 病気や公欠のため出席できない場合は、証明書等の書類を提出すること。その場合であれば、後日のレポート提出を受け付ける。
- 電車の遅延で遅れた場合は、遅延証明書の裏に学籍番号と氏名を書いて提出すること。その場合でも、当日レポートは当日中に提出すること。
- 教科書
- 生物統計学の資料:「解説編」、「実習編」(入手先については、授業支援システムMoodle、および下記URLリンクを参照)
- http://www.biosci.osakafu-u.ac.jp/ogata/
- 参考文献
- 「Excel関数辞典」(秀和システム)
- 「Excelで学ぶ統計解析入門」(オーム社)
- 「Rによるデータサイエンス」(森北出版株式会社)
- オフィスアワー
- - 外部公開シラバスのためデータがありません / Please use UNIPA syllabus -
- 教員への連絡方法(メールアドレス等)
- - 外部公開シラバスのためデータがありません / Please use UNIPA syllabus -
授業 | 授業内容 | 事前・事後の学習内容 |
---|---|---|
第1回 | 統計解析を始める前に:木を見て森を見てまた木を見る 生物統計学に取り組む心構えについて説明する。実習環境を確認する。 モデルカリキュラムとの対応 1-1. データ駆動型社会とデータサイエンス「データサイエンス活用事例(仮説検証、知識発見、原因究明、計画策定、判断支援)」 1-2. 分析設計「データ分析の進め方、分析目的の設定、様々なデータ分析手法、様々なデータ可視化手法、分析目的に応じた適切な調査」 1-3. データ観察「データの集計、比較対象の設定」 1-5. データ可視化「可視化目的に応じた図表化、1~3次元の図表化、適切な縦軸・横軸候補の洗い出し、不必要な誇張表現・強調表現がもたらす影響」 | 統計学と生物統計学との違いについて、自分なりの考えを纏める。実習環境での操作方法を理解する。 |
第2回 | 注目要素を決める:まず木を見る、各種グラフ、ウェブツール 発現傾向や機能などから判断して、注目する遺伝子を決める手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「データ分析の進め方、分析目的の設定、様々なデータ可視化手法(ヒートマップ)」 1-3. データ観察「データの特異点、傾向性」 1-5. データ可視化「可視化目的(分布)に応じた図表化、1~3次元の図表化(ヒートマップ)」 | 教科書をよく読み、注目要素をどのように決めるか考える。授業で扱ったバイオデータベースやウェブツールの使い方を確認する。 |
第3回 | 全体を眺める(1):平均、分散、標準偏差、ヒストグラム 注目遺伝子の発現量の傾向を全体的に眺める方法を説明し、実習する。 モデルカリキュラムとの対応 1-3. データ観察「ヒストグラム、データの傾向性」 1-5. データ可視化「可視化目的に応じた図表化(分布)、1~3次元の図表化(ヒストグラム)」 1-6. 数学基礎「代表値(平均値、中央値、最頻値)、分散、標準偏差、標準誤差」 1-7. アルゴリズム「並び替え(ソート)」 | 教科書をよく読み、また実習を踏まえて、エクセルで統計指標を計算する方法やヒストグラムの作り方を理解する。 |
第4回 | 違いを調べる(1): t 検定 注目遺伝子と他の遺伝子との発現傾向の違いについて考察する手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「仮説検証サイクル」 1-3. データ観察「データの相違性」 1-6. 数学基礎「帰無仮説と対立仮説、片側検定と両側検定、 p値、有意水準」 | 教科書をよく読み、また実習を踏まえて、エクセルで t検定を行う方法を理解する。 |
第5回 | 違いを調べる(2): U 検定 t検定と U検定との結果の違いについて考察する手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「様々なデータ分析手法(検定)、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「データの相違性」 1-6. 数学基礎「帰無仮説と対立仮説、 p値、有意水準」 | 教科書をよく読み、また実習を踏まえて、Rで t検定と U検定を行う方法を理解する。 |
第6回 | 違いを調べる(3):2種類の過誤、 p 値とFDR 違いの明瞭なふたつの実験群での p値とFDRとの関係について考察する手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「様々なデータ分析手法(検定)、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「クロス集計表、データの相違性」 1-6. 数学基礎「第1種の過誤、第2種の過誤、 p値、有意水準、FDR」 | 教科書をよく読み、また実習を踏まえて、FDRの意味と求め方について理解する。またデータにおける2種類の過誤について理解する。 |
第7回 | 違いを調べる(4):多重比較 さまざまな多重比較の方法と手法間での違いを説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「様々なデータ分析手法(多重比較)、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「クロス集計表、データの相違性」 1-6. 数学基礎「 p値、有意水準」 | 教科書をよく読み、また実習を踏まえて、Rを用いた多重比較の方法について理解する。 |
第8回 | 似ていることを調べる:相関係数 注目遺伝子と相関の高い遺伝子と低い遺伝子を見つける手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「分析目的の設定、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「データの類似性・相違性・関連性」 1-6. 数学基礎「相関係数、相関関係と因果関係」 1-7. アルゴリズム「並び替え(ソート)、探索(サーチ)」 | 教科書をよく読み、また実習を踏まえて、エクセルとRで相関係数を計算する方法を理解する。 |
第9回 | 全体を眺める(2):回帰分析 エクセルで回帰分析を行う方法を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「分析目的の設定、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「散布図、データの特異点・傾向性」 1-4. データ分析「単回帰分析、時系列データ、時系列グラフ」 1-5. データ可視化「可視化目的(変化)に応じた図表化、1~3次元の図表化(折れ線グラフ)、関係性の可視化」 1-6. 数学基礎「相関係数」 | 教科書をよく読み、また実習を踏まえて、エクセルで回帰分析を行う方法を理解する。 |
第10回 | 全体を眺める(3):主成分分析-1(目的と原理、標準化、寄与率) 主成分分析の目的と原理を概説し、標準化と寄与率との関係について説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「データ分析の進め方、分析目的の設定、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「比較対象の設定」 1-4. データ分析「主成分分析、次元削減」 1-5. データ可視化「可視化目的(分布)に応じた図表化、1~3次元の図表化(円グラフ)」 | 教科書をよく読み、また実習を踏まえて、Rで主成分分析の寄与率を求める方法を理解する。また、Rでの打ち間違いをなくすため、作業内容をよく理解する。 |
第11回 | 全体を眺める(4):主成分分析-2(負荷量) 主成分の負荷量のグラフを描き、実験間の関係を評価する手順を説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「データ分析の進め方、分析目的の設定、分析目的に応じた適切な調査」 1-3. データ観察「散布図、データの特異点・相違性・関連性」 1-4. 主成分分析、次元削減 1-5. データ可視化「可視化目的(分布)に応じた図表化、1~3次元の図表化(散布図)、ビッグデータの可視化」 | 教科書をよく読み、また実習を踏まえて、Rで主成分の負荷量のグラフの描き方と読み取り方を理解する。 |
第12回 | 全体を眺める(5):主成分分析-3(得点) 主成分の得点のグラフを描き、注目遺伝子が特異的に発現する実験を選ぶ手順について説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「データ分析の進め方、分析目的の設定、データの加工、分析目的に応じた適切な調査」 1-3. データ観察「データの関連性」 1-4. データ分析「主成分分析、次元削減」 1-5. データ可視化「可視化目的(分布)に応じた図表化、1~3次元の図表化(折れ線グラフ、ヒートマップ)、関係性の可視化」 1-7. アルゴリズム「並び替え(ソート)、探索(サーチ)」 | 教科書をよく読み、また実習を踏まえて、Rで主成分の得点のグラフの描き方と読み取り方を理解する。主成分分析の結果を総合的に判断して考察する手順を理解する。 |
第13回 | 全体を眺める(6):クラスタリング 注目遺伝子と他の遺伝子との発現傾向の違いを全体的に眺める手順について説明し、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「分析目的の設定、様々なデータ可視化手法(比較・分布)、分析目的に応じた適切な調査、サンプルサイズの設計、データの加工」 1-3. データ観察「比較対象の設定、データの特異点・相違性・関連性」 1-4. データ分析「クラスター分析、デンドログラム」 1-5. データ可視化「可視化目的(比較・分布)に応じた図表化、1~3次元の図表化(ヒートマップ・デンドログラム)、ビッグデータの可視化、関係性の可視化(階層構造)」 1-6. 数学基礎「相関関係と因果関係」 | 教科書をよく読み、また実習を踏まえて、Rでクラスター分析を行う方法を理解する。 |
第14回 | 全体を眺める(7)、相関ネットワーク解析 注目遺伝子と発現傾向が似ている遺伝子を纏めて選ぶ手順について説明、実習する。 モデルカリキュラムとの対応 1-2. 分析設計「分析目的の設定、様々なデータ可視化手法(構成・分布)、分析目的に応じた適切な調査」 1-3. データ観察「相関ネットワーク、データの特異点・相違性・関連性」 1-4. データ分析「クラスター分析」 1-5. データ可視化「可視化目的(構成・分布)に応じた図表化、関係性の可視化(ネットワーク構造)」 1-6. 数学基礎「相関係数、相関関係と因果関係」 1-7. アルゴリズム「探索アルゴリズム」 | 教科書をよく読み、また実習を踏まえて、ConfeitoGUIツールの使い方を理解する。 |
第15回 | 期末レポートの説明 期末レポートの目的と作業内容について説明する。 モデルカリキュラムとの対応 1-2. 分析設計「データ分析の進め方、仮説検証サイクル、分析目的の設定、様々なデータ分析手法、様々なデータ可視化手法、分析目的に応じた適切な調査」 1-3. データ観察「データの集計、比較対象の設定、クロス集計表、散布図、データの特異点・相違性・関連性」 1-4. データ分析「クラスター分析、主成分分析、次元削減」 1-5. データ可視化「可視化目的(比較・分布)に応じた図表化、1~3次元の図表化(散布図・ヒートマップ)、ビッグデータの可視化」 1-6. 数学基礎「代表値、分散、標準偏差、相関係数、相関関係と因果関係、p値、有意水準」 | 予め提供してある、期末レポート用のデータと作業内容について、よく理解する。 |
Loading...
Updated on 2024/2/27 6:16:20