生物信息学习技术路线(生信指月录)
1. Linux¶
推荐 Linux就该这么学 (0-5章节,其他的可选择性学习)
- 要求:
- 掌握 shell 基础语法
- Linux基础命令
- cd, ls, mkdir, pwd, time, df, cp, rm, sed, awk, wc, head, tail, more, history等
- 目录如下:
- 第0章 咱们先来谈谈为什么要学习Linux系统
- 第1章 动手部署一台Linux操作系统
- 第2章 新手必须掌握的Linux命令
- 第3章 管道符、重定向与环境变量
- 第4章 Vim编辑器与Shell命令脚本
- 第5章 用户身份与文件权限
- 掌握 shell 基础语法
2. Python¶
- 掌握 基础语法,条件判断,数据类型,简单的数据结构
- 熟悉常用模块:sys, os, pandas, json, Bio, numpy, seaborn, pysam, argparse等
- 使用Python 读写文件(xls, xlsx, txt等文件)
- 了解 迭代器,生成器,装饰器等概念,并描述其适用的场景
- python2 和 python3 中 range() 函数的区别
- 可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator (ref: https://www.liaoxuefeng.com/wiki/1016959663602400/1017323698112640)
- 在Python中,这种一边循环一边计算的机制,称为生成器:generator (ref: https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128) 熟悉 类 和 实例的概念,类函数,静态函数
- 可选:
- Python 多线程操作
- 使用 pymysql 操作数据库
- 使用 python-docx等操作数据库
- 常见的设计模式及其使用场景
- Python 数据结构与算法
- 陈斌老师 《数据结构与算法》B站课程
- 课件: 链接: https://pan.baidu.com/s/1srvCWOLsxEn3mOq1_TCmhQ 提取码: wtji
- Python 多线程操作
3. 生物信息学课程¶
- 了解相关概念, 专有名词
- 了解相关概念背后的 生物信息算法,统计原理
- 【 山东大学】生物信息学 B站课程
- 【北京大学】生物信息学:导论与方法 B站课程
- 统计学 ⅰ. https://www.yuque.com/biolxy/bioinfo/zgl1ml
4. BioStar 实操练习 https://www.biostarhandbook.com/¶
- 可以看生信媛翻译的 BIOSTAR课程
5. 肿瘤外显子数据分析指南¶
- https://www.yuque.com/biotrainee/wes