4门统计学你选择哪个

统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说啃这块统计学硬骨头是提升自己的生信段位不二选择!

最近在朋友圈和各种群聊又看到了另外4个好课程,推荐给大家,文末有一个投票,大家可以参与一下。(估计你们没有那么多时间全部看完,就根据目录进行投票即可)

北京大学-席瑞斌

课程链接:http://www.chinesemooc.org/mooc/4979

1. 统计及生物统计概要(2学时)
2. 数据探索性分析、可视化(4学时)
3. 假设检验和置信区间估计(12学时)
  • a) 参数假设检验
  • b) 非参数假设检验
  • c) Bootstrap方法、permutation 方法
  • d) 多重假设检验
4. 回归分析方法(12 学时)
  • a) 线性回归分析
  • b) 广义线性回归
  • c) 非线性回归方法、广义非线性回归方法
  • d) 混合效应回归模型
5. 高维生物统计学方法 (12学时)
  • a) 模型选择方法
    模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法
  • b) 超高维数变量筛选方法
    线性模型中的变量筛选、非线性模型中的变量筛选
  • c) 降维方法
    PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法
6. 分类、聚类分析简介(6学时)
  • a) 逻辑回归、支持向量机、随机森林等分类方法
  • b) K-means、混合正态模型、隐马氏模型等聚类方法

初看这个目录我差点以为就是为生物信息学人才准备的,因为确实涵盖了我们生信分析过程的方方面面。

多元统计分析上海财经大学_中国大学MOOC(慕课)

可能因为是财经大学的课程,所以并不会可以强调这些统计学原理在生物信息学领域的应用,不过打基础也是极好的。链接是:https://www.icourse163.org/course/0712TUFC001-1003381022#/info

第一章 矩阵代数
  • 1.1 矩阵的定义和运算
  • 1.2 正交矩阵
  • 1.3 矩阵的行列式、逆和秩
  • 1.4 矩阵的特征值、特征向量和迹
  • 1.5 正定矩阵、非负定矩阵和矩阵函数值的SAS输出
  • 附录1.A 矩阵代数的R代码(选)
  • 附录1.C 矩阵代数的本教材节选(选)
第二章 随机向量和多元正态分布
  • 2.1 多元分布
  • 2.2 数字特征
  • 2.3 欧氏距离和马氏距离
  • 2.4 多元正态分布
  • 2.5 极大似然估计及估计量的无偏性
  • 2.6 JMP入门
  • 2.7 一个案例的JMP演示
  • 附录2.A 多维数据描述及可视化等的R代码(选)
  • 附录2.B SPSS在多维数据描述及可视化等中的应用(选)
  • 附录2.C 随机向量的本教材节选(选)
  • 附录2.D 多元正态分布的本教材节选(选)
  • 第二章测验
第三章 判别分析
  • 3.1 引言
  • 3.2 两组距离判别
  • 3.3 多组距离判别
  • 3.4 贝叶斯判别——最大后验概率法
  • 3.5 贝叶斯判别——最小期望误判代价法
  • 3.6 费希尔判别
  • 附录3.A 判别分析的R代码(选)
  • 附录3.B SPSS在判别分析中的应用(选)
  • 附录3.C 摘自本教材的若干数学证明(选)
  • 第三章测验
第四章 聚类分析
  • 4.1 引言
  • 4.2 距离和相似系数
  • 4.3 系统聚类法
  • 4.4 聚类中的若干问题
  • 4.5 动态聚类法——k均值法

  • 附录4.A 聚类分析的R代码(选)

  • 附录4.B SPSS在聚类分析中的应用(选)
  • 第四章测验
第五章 主成分分析
  • 5.1 引言
  • 5.2 总体的主成分
  • 5.3 样本的主成分
  • 5.4 若干案例
  • 5.5 若干补充及主成分应用中需注意的问题
  • 附录5.A 主成分分析的R代码(选)
  • 附录5.B SPSS在主成分分析中的应用(选)
  • 附录5.C 摘自本教材的若干数学证明(选)
  • 附录5.D 对主成分综合得分方法的质疑(摘自本教材,选)
  • 第五章测验
第六章 因子分析
  • 6.1 引言
  • 6.2 正交因子模型
  • 6.3 参数估计
  • 6.4 因子旋转
  • 6.5 因子得分
  • 附录6.A 因子分析的R代码(选)
  • 附录6.B SPSS在因子分析中的应用(选)
  • 附录6.C 摘自本教材的若干数学证明(选)
  • 第六章测验
第七章 对应分析
  • 7.1 引言
  • 7.2 行轮廓和列轮廓
  • 7.3 总惯量
  • 7.4 行、列轮廓的坐标
  • 7.5 对应分析图
  • 附录7.A 对应分析的R代码(选)
  • 附录7.B SPSS在对应分析中的应用(选)
  • 附录7.C 摘自本教材的若干数学证明(选)
  • 第七章测验

厦门大学MOOC 多元统计分析

被搬运到了B站,之所以注意到这门课,是检查我自己的b站,被人工智能算法推荐的,应该是跟我的课程一样的优秀吧!

链接是: https://www.bilibili.com/video/av92489393 或者 https://www.icourse163.org/course/XMU-1206305809

01 多元统计分析概述
  • 1.1 多元分析的定义
  • 1.2 多元分析的方法简介
  • 1.3 多元分析的应用领域

    02 多元数据的描述与展示
  • 2.1 一元随机变量回顾

  • 2.2 随机向量
  • 2.2.1 多元数据的数值特征及可视化
  • 2.2.2 协方差矩阵的用途
  • 2.3 随机向量的变换

    03 多元正态分布
  • 3.1 多元正态分布

  • 3.2 多元正态分布的性质
  • 3.3 多元正态的估计
  • 3.4 评估多元正态性

    04 均值向量的检验
  • 4.1 多元检验的冬季

  • 4.2 单样本均值向量检验
  • 4.3 两样本均值向量检验
  • 4.3.1 独立样本
  • 4.3.2 成对样本

    05 判别分析和分类分析
  • 5.1 判别分析和分类分析概述

  • 5.2 判别分析:分类规则
  • 5.2.1 两群体Fisher线性判别分析
  • 5.2.2 多群体Fisher线性判别分析
  • 5.3 分类分析:分类结果
  • 5.3.1 两群体Fisher分类
  • 5.3.2 两群体贝叶斯分类
  • 5.3.3 多群体分类

    06 主成分分析
  • 6.1 主成分分析思想

  • 6.2 总体主成分分析
  • 6.2.1 总体主成分推导
  • 6.2.2 基于标准化的总体主成分分析
  • 6.3 样本主成分分析
  • 6.3.1 样本主成分推导
  • 6.3.2 主成分个数的选择
  • 6.3.3 R语言应用实例

    07 因子分析
  • 7.1 因子分析简介

  • 7.2 载荷估计方法
  • 7.2.1 主成分法
  • 7.2.2 其他方法
  • 7.2.3 估计因子得分
  • 7.3 因子旋转
  • 7.3.1 因子旋转的理解
  • 7.3.2 正交旋转和斜交旋转
  • 7.4 R语言示例

    08 聚类分析
  • 8.1 聚类分析概述

  • 8.2 层次聚类
  • 8.2.1 简介
  • 8.2.2 层次聚类的类型
  • 8.2.2.1 层次聚类的类型(上)
  • 8.2.2.2 层次聚类的类型(下)
  • 8.2.3 R语言示例
  • 8.3 k-均值聚类
  • 8.3.1 方法介绍
  • 8.3.2 R语言示例

知乎孟大佬的多元统计

在疫情期间孟浩巍录制了一门网络课程,供大家学习——《生物信息学入门课:生信中常用的多元统计分析》,这个是需要付费的,购买链接:https://ke.qq.com/course/709956

目录的话,我只能以截图代替,不然可能会被举报非法原创!

投票开始

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

Comments are closed.