plink怎样筛除纯合率低于百分之九十的个体
时间: 2024-10-11 22:02:39 浏览: 27
要使用`plink`(一种常用的遗传学数据分析工具)来筛选纯合率低于90%的个体,首先确保你已经安装并熟悉了`plink`的基本用法。这里提供一个基本的命令示例,假设你有一个名为`ped`的PED文件,其中包含基因型信息:
```bash
# 使用plink过滤低纯合率样本
plink --bfile your_data_ped_file \
--maf 0.90 \
--indep-pairwise 100 10 0.90 \
--extract low_homozygosity_samples.txt \
--make-bed --out filtered_data
```
解释一下这个命令:
1. `--bfile your_data_ped_file`: 指定输入的PED文件路径。
2. `--maf 0.90`: 设置最低的单核苷酸多态性(MAF,Minor Allele Frequency)阈值为0.90,即只保留每个位点纯合率为90%以上的个体。
3. `--indep-pairwise 100 10 0.90`: 运行独立遗传标记分析,排除关联密切(R^2>0.90)且距离小于100kb的标记对,以避免近交相关的偏倚。
4. `--extract low_homozygosity_samples.txt`: 提取满足条件(纯合率低于90%)的个体列表,这个列表通常来自于前面运行`plink`时产生的一个文本文件。
5. `--make-bed --out filtered_data`: 生成新的BED文件,包含筛选后的个体,命名为`filtered_data`。
执行此命令后,你会得到一个新的床文件(`.bed`),其中仅包含纯合率不低于90%的个体。
阅读全文