TCGA可变剪切数据分析工具:PSI_download_BLCA

需积分: 9 1 下载量 38 浏览量 更新于2024-11-19 收藏 25.78MB ZIP 举报
资源摘要信息:"PSI_download_BLCA.zip" 知识点: 1. PSI(Percent Spliced In):PSI值是一个用来量化可变剪切事件的指标。它是可变剪切事件中包含该剪切形式的读段(read)数量与该事件所有读段数量的比例。在RNA测序分析中,PSI值可以帮助研究者了解不同可变剪切形式在总转录本中的分布情况。 2. TCGA(The Cancer Genome Atlas):TCGA是美国国家癌症研究所(National Cancer Institute,NCI)和国家人类基因组研究所(National Human Genome Research Institute,NHGRI)合作的一个项目。该项目旨在通过对大量癌症患者样本的全面基因组分析,了解癌症的分子基础,揭示癌症的遗传变异和基因表达模式,从而为癌症的诊断、治疗和预防提供更为精确的分子标记。 3. 可变剪切(Alternative Splicing):可变剪切是真核生物基因表达调控的一种重要方式,指的是从一个前体mRNA中剪接出不同的成熟mRNA的过程。通过这种方式,一个基因可以产生多个不同的mRNA和蛋白质变体,大大增加了蛋白质的多样性。在癌症等疾病的研究中,可变剪切模式的改变被认为是疾病发生和发展的关键因素。 4. 压缩文件格式(.zip):.zip是一种常见的压缩文件格式,它通过压缩算法将一个或多个文件压缩成一个文件,以减少文件的存储空间和网络传输时间。在生物信息学中,压缩文件常用于分享和传输大量的基因组数据、转录组数据和蛋白质组数据。 5. 压缩包子文件(PSI_download_BLCA.zip):这是一个关于膀胱尿路上皮癌(Bladder Urothelial Carcinoma,BLCA)的TCGA可变剪切PSI值数据压缩包文件。该文件可能包含有关BLCA患者样本的可变剪切事件的PSI值,这些数据对于研究BLCA的基因组变异和分子机制具有重要意义。 6. PSI_download_BLCA.txt:这是一个文本文件,包含了从TCGA数据库中下载的关于BLCA的PSI值数据。该文件可能详细记录了各个样本的可变剪切事件的PSI值,以及相关的样本信息和可变剪切类型描述等,是进行BLCA可变剪切数据分析的基础文件。 总结以上知识点,PSI_download_BLCA.zip文件是一个压缩包文件,其中包含了名为PSI_download_BLCA.txt的文本文件,该文本文件存储了TCGA项目中关于膀胱尿路上皮癌(BLCA)的可变剪切事件的PSI值数据。PSI值是一种量化可变剪切事件的方法,其数据对于理解BLCA的分子机制非常重要。TCGA项目旨在通过基因组分析揭示癌症的分子基础,而可变剪切作为基因表达调控的一个重要方式,在疾病研究中发挥着关键作用。

library("pheatmap") library("jsonlite") setwd(dir = "D:/Diyang/1") temp = list.files(pattern="*.csv") myfiles = lapply(temp, read.csv) myfiles = lapply(myfiles, na.omit) file_nums = length(temp) filename = sapply(strsplit(temp,"\\."),"[[",1) for(i in filename) { df = read.csv(paste0(i,'.csv'),header=T,row.names=1) df = replace(df,is.na(df),1) df_temp = df for (name in c("ACC","BLCA")) { print(df[which(colnames(df) == name)]) } df = -log10(abs(df)) df[df_temp<0] = -df[df_temp<0] pdf(paste0(i,'.pdf'),length(colnames(df))/2,length(rownames(df))/2) paletteLength = 1000 #immune #myColor <- colorRampPalette(c("white", "#FF7C00"))(paletteLength) #exp #myColor <- colorRampPalette(c("white", "red"))(paletteLength) #cell #myColor <- colorRampPalette(c("white", "blue"))(paletteLength) #drug #myColor <- colorRampPalette(c("white", "#660BAB"))(paletteLength) #yzx_gx #myColor <- colorRampPalette(c("white", "#C7007D"))(paletteLength) #exp宸紓 # myColor <- colorRampPalette(c("green", "white", "red"))(paletteLength) # myBreaks <- c(seq(min(df), 0, length.out=ceiling(paletteLength/2) + 1), # seq(max(df)/paletteLength, max(df), length.out=floor(paletteLength/2))) #myBreaks <- c(seq(0, max(df), length.out=floor(paletteLength/2))) ####################################### getSig <- function(dc) { sc <- ' ' if (dc < 0.0001) {sc <- '****'} else if (dc < 0.001){sc <- '***'} else if (dc < 0.01){sc <- '**'} else if (dc < 0.05) {sc <- '*'} else{sc <- ''} return(sc) } sig.mat <- matrix(sapply(as.matrix(df_temp), getSig), nrow=nrow(as.matrix(df_temp))) str(sig.mat) ######################################## xx <- pheatmap(df, color=myColor, breaks=myBreaks, clustering_method="average", cluster_rows=F,cluster_cols=F, cellwidth = 20,cellheight = 20,main="-log10(p)",display_numbers=sig.mat) print(xx) dev.off() }为什么最后没有出土

129 浏览量