没有合适的资源?快使用搜索试试~ 我知道了~
首页华大的生物信息培训教程
华大的生物信息培训教程
需积分: 50 258 浏览量
更新于2023-05-23
评论
收藏 8.09MB PDF 举报
北京华大基因研究中心生物信息学培训教材,非常全面的一本入门教材。linux操作,blast比对,基因功能注释等,介绍的很详细!
资源详情
资源评论
资源推荐

生物信息学培训教材
北京华大基因研究中心

目录
第 1 章 Unix/Linux操作系统介绍............................................................................................................4
1.1 文件和目录相关.........................................................................................................................4
1.2 压缩和解压缩.............................................................................................................................4
1.3 进程及其他 ................................................................................................................................5
1.4 远程登陆 ....................................................................................................................................6
1.5 软件安装简介............................................................................................................................12
第 2 章 数据的基本处理.........................................................................................................................13
2.1 测序原理介绍............................................................................................................................13
2.2 峰图转化 Phred........................................................................................................................13
2.3 Phd2Fasta ................................................................................................................................20
2.4 载体屏蔽 Crossmatch..............................................................................................................23
2.5 序列聚类拼接...........................................................................................................................29
2.5.1 Phrap.............................................................................................................................29
2.5.2 Cap3 ..............................................................................................................................39
2.6 Consed ......................................................................................................................................43
2.7 Primer3 ....................................................................................................................................57
第 3 章 序列的比对 ................................................................................................................................62
3.1 全局比对 ..................................................................................................................................62
3.1.1 Clustalw ...........................................................................................................................62
3.1.2 MUSCLE .........................................................................................................................78
3.1.3 HMMER ..........................................................................................................................81
3.2 局部比对 ..................................................................................................................................85
3.2.1 Blast .................................................................................................................................85
3.2.2 blat ...................................................................................................................................98
3.2.3 blastz..............................................................................................................................104
3.2.4 GeneWise.......................................................................................................................110
3.2.5 Fasta...............................................................................................................................119
3.2.6 Exonerate .......................................................................................................................127
3.2.7 Sim4...............................................................................................................................132
第 4 章 基因组/基因的注释.................................................................................................................140
4.1 重复序列分析.........................................................................................................................140
4.1.1 RepeatMasker.............................................................................................................140
4.1.2 Trf ..............................................................................................................................151
4.1.3 LTR_STRUC...................................................................................................................155
4.2 RNA分析 ..................................................................................................................................158
4.2.1 tRNAScan.....................................................................................................................158
4.2.2 MicroRNA.....................................................................................................................163
4.2.3 snoRNA.........................................................................................................................171
4.2.4 rRNA(rfam).............................................................................................................175
4.3 基因预测 ................................................................................................................................179
4.3.1 Glimmer.......................................................................................................................179
4.3.2 GlimmerM.....................................................................................................................184
4.3.3 Genscan.......................................................................................................................188
4.3.4 TwinScan.....................................................................................................................191
4.3.5 BGF ..............................................................................................................................193
4.3.6 Fgenesh.......................................................................................................................196
4.4 基因功能注释.........................................................................................................................198
4.4.1 InterproScan.............................................................................................................198
4.4.2 WEGO ............................................................................................................................203

第 5 章 SNP分析 ....................................................................................................................................209
5.1 Polyphred..................................................................................................................................209
5.2 SNPdetector ..............................................................................................................................215
5.3 CrossMatch...............................................................................................................................221
第 6 章 进化分析专题...........................................................................................................................224
6.1 Phylip........................................................................................................................................224
6.2 Paml..........................................................................................................................................230
6.3 KaKs_Calculator.......................................................................................................................237
6.4 FGF...........................................................................................................................................244
6.5 mega..........................................................................................................................................257
第 7 章 基因表达分析专题...................................................................................................................261
7.1 EST(Expressed Sequence Tag)表达序列标签(EST)分析.............................................261
7.1.1 EST基本介绍...............................................................................................................261
7.1.2 EST分析流程介绍.......................................................................................................264
7.1.3 EST的应用...................................................................................................................278
7.1.4 实例 ............................................................................................................................279
7.1.5 参考文献.....................................................................................................................280
7.2 生物芯片(Microarray)分析.................................................................................................280
7.2.1 背景介绍.....................................................................................................................280
7.2.2 芯片的数据分析.........................................................................................................283
7.2.3 芯片Oligo设计...........................................................................................................298
7.3 Motif预测 ..............................................................................................................................300
7.3.1 MEME/MAST系统...........................................................................................................300
7.3.2 MDScan.........................................................................................................................315
第 8 章 蛋白质结构预测.......................................................................................................................318
8.1 蛋白质结构知识介绍 ...........................................................................................................318
8.2 蛋白质结构预测方法 ...........................................................................................................327
8.3 蛋白质结构预测的Threading方法..................................................................................328
8.4 蛋白质三维结构预测流程介绍 ...........................................................................................328
第 9 章 公用数据库介绍.......................................................................................................................341
9.1 NCBI.........................................................................................................................................341
9.2 UCSC........................................................................................................................................351
9.3 Ensembl ....................................................................................................................................357

第 1 章 Unix/Linux 操作系统介绍
1.1 文件和目录相关
mkdir dirname 建立子目录. 注意:用户不能在一个不存在的目录中建立子目录。
mkdir data 在当前目录下建立子目录 data
mkdir /usr/data 在/usr/目录下建立子目录 data,此时/usr 目录必须已经存在。
rmdir dirname 删除空目录,目录里面如有文件或目录则无法删除。
pwd 显示用户目前所在目录
cd dirname 切换目录。
cd . "."表示当前目录
cd .. ".."表示上一层目录
cd / "/"表示根目录
cd ~ "~"表示宿主目录(用户登录时所在的目录)
cd /usr/bin 切换到/usr/bin 目录下
ls 查看文件信息,这是最基本的档案指令。 ls 的意义为 "list",也就是将某一个目录或是某一
个档案的内容显示出来。 ls 命令可加参数很多,我们这里不一一列出,只给出较常用的几个,
各参数可以混合使用。
ls 不加任何信息,显示目前目录中所有文件。
ls [file] 显示特定的文件。如:% ls /home2/X11R5
ls –a 显示所有的文件和目录,若无此参数,句点开始的文件和目录不会显示出来,即以”.”
开头的文件,如 tcsh 的初设档 .tcshrc;如果我们要察看这类档案,则必须加上参数 -a
ls -l 这个参数代表使用 ls 的长( long )格式,可以显示更多的信息,包括文件的权限、
所有者、大小、最后更改日期等。如:
ls -l file1
-rwx--x--x 1 soft bgi Aug 8 05:08 file1
第一列表示文件得属性,linux 下文件分三个属性:可读 r,可写 w,可执行 x
第一个字符表示是目录(d)或链接文件(l)或单纯的文件(-)等
第 2-4 字符”rwx” 表示此文件属主 soft 对文件 file1 的权利为”可读、可写、可执行”;
第 5-7 字符”r-x” 表示此用户组 bgi 内的用户对文件 file1 的权利为:”可读、不可
写、可执行”;
第 8-10 字符”r--” 表示其他用户对文件 file1 的权利为”可读、不可写、不可执行”
第二列表示文件个数,如果是文件则为 1,如果是目录则表示里面的文件个数。
第三列别是此文件或目录的拥有者。
第四列表示文件所有者所属的组

第 1 章 Unix/Linux 操作系统介绍 2
第五列表示文件大小,用 byte 表示
第六列表示文件的修改日期
第七列表示文件或目录名称
ls –t 按文件最后更改时间排序文件
ls –F 在文件后面加上类型标识:如果是目录,则在后面加”/”,如果是可执行文件,则在
后面加”*”,如果是个链接,则在后面加”@”
more [file] 显示文件,按屏显示,空格键翻页,回车键每次只翻一行,敲入 q/Q/:q/:Q/ZZ
等都可提前退出 more 命令。
less [file] 基本同 more 命令,可以使用方向键随意滚动文件。
less –S 分列显示
less –help 显示详细说明文档
cat [file] 显示文件内容,所有内容全部显示。
cat –n [file] 在显示内容前加上行号
cp 拷贝文件,可以将文件拷贝成另一个文件,或是拷贝到另一个目录中。可以使用通配符拷贝
具有同一特征的所有文件。
cp file1 file2 将 file1 拷贝成 file2
cp /usr/file2 ./ 将/usr 目录下的文件 file2 拷到当前目录下
cp –i 覆盖相同名称文件前先询问用户
cp –R 递归拷贝,即拷贝时将所有目录一并拷贝
cp --help 查阅命令详细使用信息
mv 移走目录或者改文件名
mv file1 file2 将 file1 改名为 file2
mv filename dirname/ 将文件移至某一目录下
mv –help 查阅命令详细使用信息
rm 删除文件或目录
rm file1 file2 file3 ….
rm * 删除当前目录下所有文件
rm –f 强制删除文件,删除时,不提出任何警告讯息。
rm –i 删除文件之前均会询问是否真要删除,y/n 指示下一步。
rm –r 递回式的删除,即逐级删除目录下的子目录。
rm –help 查阅命令详细使用信息
chmod 更改文件或目录权限
chmod –r file 更改所有的权限,包括子目录及其内文件。
chmod nnn file(s) n 从 0 到 7,权限可相加。依次代表用户、组成员、其他人的权限。
剩余367页未读,继续阅读










安全验证
文档复制为VIP权益,开通VIP直接复制

评论0