高通量DNA测序数据分析中的tasmanian-mismatch工具

需积分: 9 143 浏览量更新于2024-10-28 1 收藏 802KB ZIP 举报

资源摘要信息:"tasmanian-mismatch:分析来自基因组 DNA 的高通量测序数据中的伪影" 高通量测序技术（也称为第二代测序技术）允许科学家以大规模的方式对生物体的遗传信息进行快速而准确的分析。这些技术可以生成大量的短序列读数（reads），这些读数在后续分析中需要被拼接并映射到参考基因组上。在这个过程中，各种偏差和错误（伪影）都可能出现，对分析结果造成影响。Tasmanian-mismatch 是一种工具，其目的是识别和分析在高通量测序数据中出现的伪影，尤其是在参考错配的情况下。 Tasmanian-mismatch 的主要目标是识别在高通量测序数据中的系统性错配，这些错配可能会对单核苷酸多态性（SNP）或其他遗传变异的识别产生混淆。研究人员使用该工具时，可以关注那些在参考基因组中可能并不存在错位，但在数据分析中具有显著影响的区域。Tasmanian-mismatch 通过拆分可能受影响的读取，并将信息整合到不同的表格中，从而允许对交叉或非交叉的读取进行分析，而不会因过滤而失去这些读取的信息。这为研究人员提供了关于这些区域在观察到的文物中影响的更准确的理解。 Tasmanian-mismatch 的操作流程大致包括以下几个步骤： 1. 利用 samtools view bam 命令处理 bam 文件，将 bam 文件转换为可被后续分析工具读取的格式。 2. 运行 run_intersections 命令来执行交集分析，这一步骤主要是确定哪些读取与参考基因组中的特定区域重叠。 3. 最后，通过 run_tasmanian 命令来进行实际的伪影识别与分析，该命令包含了对数据进行分类和评估的算法，能够识别出重复区域以及其他可能导致错配的因素。在 Tasmanian-mismatch 的操作中，每一个碱基都会被分类为“重叠”或“不重叠”。重叠的碱基指的是那些落在了感兴趣的区域内，或者与区域边缘有接触的读取。这些感兴趣的区域通常通过 bed 或 bedGraph 文件定义，包含了特定的基因组坐标。根据分析的需要，重叠的读取会进一步被分类为包含或边界类型，而那些不重叠的读取则会被单独处理。该工具在分析读取的工件位置时，会特别注意读取 1 和读取 2 的位置，这是指在双端测序（paired-end sequencing）中，一对读取中的两个末端。通过检查这些位置，Tasmanian-mismatch 能够识别出读取片段在基因组上的具体定位，从而帮助研究人员确定是否存在伪影或错配。总而言之，Tasmanian-mismatch 是一个专为高通量测序数据设计的分析工具，它通过识别和分析可能导致系统性错配的伪影，提高了遗传变异识别的准确性和可靠性。这对于理解基因组结构、寻找疾病相关变异以及开发新的治疗方法等研究领域具有重要意义。通过提供一种拆分受影响读取并将信息整合到不同表中的方法，Tasmanian-mismatch 允许研究人员在保留关键数据的同时，准确地评估那些可能对变异检测产生影响的区域。

收起资源包目录

tasmanian-mismatch:分析来自基因组 DNA 的高通量测序数据中的伪影（99个子文件）

small_region.fa 7KB

tasmanian_test_output.table 6KB

process.yml 2KB

small.csv 6KB

intersections_test.py 27B

small_region.fa.bwt 7KB

intersections_tasmanian.jpg 27KB

count_CpG_GC_repeat.py 3KB

small_region.fa.amb 9B

intersections.py 14KB

sam_reads.c 0B

intersections.cpython-37.pyc 3KB

intersections 49KB

small_region.fa.ann 33B

G_T.sorted.bam 1KB

.gitignore 182B

50_test_reads_ONT.sam 255KB

bedfile.bedGraph 116B

main.nf 7KB

intersections.cpython-37.pyc 4KB

test2.output 6KB

log-run_artifacts 52KB

hist.py 839B

bedfile.bedGraph 116B

plot.cpython-37.pyc 11KB

small_region.dict 152B

.DS_Store 6KB

small_region.fa.fai 18B

lala.py 569B

small_region.fa 7KB

AGR1.fastq 2KB

tasmanian_indexes.loc 103B

Tasmanian.xml 7KB

AGR2.fastq 2KB

find_pairs 519B

smallb.csv 6KB

__init__.cpython-37.pyc 145B

AGR2b.fastq 2KB

small_region.fa.pac 2KB

.manuscript.txt.swp 16KB

tasmanian_index.loc.sample 1KB

small_region.fa.fai 18B

G_T.sorted.sam 5KB

run_intersections 35B

AGR2.fastq 2KB

picard_test_files 57B

manuscript.txt 11KB

conda.yaml 160B

tasmanian_test.py 23B

tasmanian_galaxy.py 23B

README.md 3KB

sam_reads.cpython-37.pyc 2KB

masked_genome.fa 7KB

.definitions.py 96B

tool_test_output.html 260KB

config.yml 1KB

tool_test_output.json 21KB

LICENCE.txt 845B

original.sorted.bam 1KB

basic_tests.sh 369B

tasmanian_indexes.loc 103B

snapshot.jpg 186KB

nextflow.config 88B

test.png 28KB

snapshot_good.jpg 67KB

small_region.fa 18B

__init__.py 64B

AGR2.fastq 2KB

requirements.txt 147B

utils.cpython-37.pyc 7KB

small_region.fa 7KB

sam_reads.py 4KB

test2.bam 1017B

sam_reads.h 0B

utils.py 9KB

.DS_Store 6KB

run_tasmanian 32B

test_test.table.csv 25KB

command.sh 159B

plot.py 13KB

.DS_Store 6KB

AGR1.fastq 2KB

colordiff.py 763B

settings.json 121B

test.output 6KB

tasmanian.cpython-37.pyc 10KB

AGR1b.fastq 2KB

tasmanian_script.py 23KB

AGR2.fastq 2KB

test.bam 1017B

AGR1.fastq 2KB

manuscript_figures.pptx 277KB

MANIFEST.in 18B

small_region.fa.sa 4KB

setup.py 872B

collect_data.py 3KB

__init__.py 52B

AGR1.fastq 2KB

plotit.py 539B

共 99 条

WebWitch

粉丝: 23
资源: 4586

高通量DNA测序数据分析中的tasmanian-mismatch工具

PyPI 官网下载 | tasmanian-mismatch-0.1.3.tar.gz

Python库 | Tasmanian-7.8rc1.tar.gz

PyPI发布tasmanian-mismatch-0.1.3：Python库的分布式云原生应用

datalist-interface:列表用作数据库的简单界面

5-Axis-Camera-Position-Control:我称之为塔斯马尼亚恶魔的是5轴摄像头位置控制系统，可获取您可以想到的所有视频

Tasmanian.jl:Julia·沃珀（Julia Wrapper）到塔斯马尼亚图书馆

Tasmanian Strategical:塔斯马尼亚战略 BBS DOOR 游戏（大约 1993-1995 年）-开源

袋獾优化算法Tasmanian Devil Optimization源代码及其原文

TDO_Tasmanian_Devil_Optimization_求解优化算法_仿生优化算法

两级分层特征提升图像分类精度：深度学习新策略

最新资源