在R内读取raw基因型文件进行SNP筛选和品种分类
时间: 2024-10-11 09:08:25 浏览: 71
基因型文件转换为vcf文件.rar_vcf中./. 基因型_基因型文件转换为vcf文件
5星 · 资源好评率100%
在R中操作SNP筛选和品种分类通常涉及读取`.ped`或`.bed`格式的数据,这里我们将以`.ped`文件为例。首先,你需要安装`plinkr`包来与PLINK数据交互,然后可以按照以下步骤进行:
1. 安装并加载`plinkr`包[^1]:
```R
install.packages("plinkr")
library(plinkr)
```
2. 从`.ped`文件导入数据:
```R
hapmap <- read_plink(file = "hapmap.ped", format = "ped")
```
注意,这一步假设`hapmap.ped`已经存在并且满足`.ped`格式。
3. 对SNPs进行筛选(例如保留20%随机SNPs):
```R
# 使用plinkr的thin功能
thinned_hapmap <- thin(plink_data(hapmap), proportion = 0.2)
```
4. 分类品种或群体:
```R
# 如果ped文件中包含群体或品种标签,可以使用group_by函数进行分类
groups <- hapmap$sample_id %>% factor()
grouped_hapmap <- group_by(thinned_hapmap, groups)
```
现在,`grouped_hapmap`就包含了筛选后的SNPs以及对应的品种或群体分类。
阅读全文