KK4D:共线性分析与安装教程-参数配置与使用详解

需积分: 0 0 下载量 16 浏览量 更新于2024-08-05 收藏 193KB PDF 举报
KK4D是一款专门用于共线性分析的工具,它支持对基因组序列数据进行多种计算,包括Ka/Ks分析、4DTv计算等。它的安装可以通过bash脚本KK4D.sh完成,安装后需要验证是否成功安装,这可以通过运行`KK4D.sh -h`命令来检查帮助选项。 在使用KK4D之前,用户需要准备一些输入文件,如`genome.gff3`、`genome.pep.fa`、`genome.cds.fa`等,这些文件包含了基因组注释信息、蛋白质序列以及CDS序列。KK4D提供了丰富的命令行接口,以适应不同的分析任务: 1. **共线性分析**:使用`KK4D.sh coline`命令执行共线性分析。 2. **Ka/Ks分析**:`KK4D.sh kaks`用于计算不同位点的 Ka/Ks 比率,这是评估基因进化速率的重要指标。 3. **4DTv分析**:`KK4D.sh 4DTV`执行4DTv(第四代单核苷酸多态性)分析,关注基因变异模式。 4. **从GFF3获取BED格式**:`KK4D.sh bed`将GFF3格式转换为BED格式,便于可视化。 5. **获取蛋白质序列**:`KKD4.sh pep`和`KKD4.sh cds`分别从GFF3和CDS文件提取相应的蛋白质和CDS序列。 6. **整合信息**:`KKD4.sh all`将以上所有信息综合在一起,提供全面的分析结果。 配置文件`config.ini`是关键,用于设置工作路径、样本信息和参数。用户需要确保: - **工作路径**:指定KK4D将在其中寻找和保存文件的目录,建议新建专用目录存放输入文件。 - **样本设置**:包括样本组数、GFF3文件中的特定列(如ID)、类型(如mRNA)、物种的拉丁学名和三字符缩写。 - **文件路径**:提供GFF3、蛋白质和CDS文件的具体路径,以及染色体数量(对于scaffold分析)。 在进行分析前,请务必检查并调整`config.ini`中的参数,特别是工作路径,确保所有文件都在指定的目录中,并且文件数量与设置的样本组数一致。此外,注意在运行不同命令时,需要根据具体需求选择对应的分析选项。 KK4D是一个强大的生物信息学工具,但其高效使用需要对软件功能、输入文件格式和配置参数有深入理解。通过遵循上述步骤,用户能够充分利用KK4D进行精准的共线性分析,从而深入探究基因组序列的进化和变异。

import re import subprocess import requests import json from pprint import pprint url = "https://www.bilibili.com/video/BV1fi4y1K7Na/?spm_id_from=333.1007.top_right_bar_window_default_collection.content.click&vd_source=4545a0e83c576b93b1abd0ca4e16ab4d" headers = { "referer": "https://www.bilibili.com/", "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36", "cookie":"i-wanna-go-back=-1; _uuid=C106610D104-6D27-6584-66E1-FCDE2859156A75277infoc; FEED_LIVE_VERSION=V8; home_feed_column=5; buvid3=D2AE610A6-6EE7-B48E-10C51-9E8269B10C88776898infoc; header_theme_version=CLOSE; DedeUserID=1852701166; DedeUserID__ckMd5=ac9474243bdd3627; nostalgia_conf=-1; CURRENT_PID=e16a0380-e1cd-11ed-a872-2f97008834b2; rpdid=|(k|k~u|)RY)0J'uY)kkl|m)m; b_ut=5; browser_resolution=1482-792; CURRENT_BLACKGAP=0; buvid_fp_plain=undefined; CURRENT_FNVAL=4048; b_nut=1683881044; hit-new-style-dyn=1; hit-dyn-v2=1; SESSDATA=3e3851ea%2C1704423625%2C1959b%2A72SteLEoaNhz8Q6ifKiYFGRpSBjpMp2TG-QWAao2iv2yR5ci81QOokmXevCx102rLpwUc9qgAAQgA; bili_jct=2ea1af9f8ae6f19867c8cd3dc1bfd047; fingerprint=dd5c1878758a4b317420b66dad49b677; b_lsid=97F1E5C5_1894440C9F1; buvid4=9D5A25A5-A648-0805-4C59-8178C4E4362B31067-023042319-0THAXXn9jKfRyf3rDh/fQA%3D%3D; buvid_fp=dd5c1878758a4b317420b66dad49b677; sid=7i4lnopc; bp_video_offset_1852701166=817021346575810700; PVID=1" } response = requests.get(url, headers=headers) name = re.findall('"title":"(.*?)"',response.text)[0].replace(' ','') html_data = re.findall('<script>window.__playinfo__=(.*?)</script>',response.text)[0] json_data = json.loads(html_data) #print(name) # print(html_data) # print(json_data) # pprint(json_data) audio_url = json_data['data']['dash']['audio'][0]['baseUrl'] video_url = json_data['data']['dash']['video'][0]['baseUrl'] # print(audio_url) # print(video_url) audio_content = requests.get(url=audio_url,headers=headers).content video_content = requests.get(url=video_url,headers=headers).content with open("D:\\study\\B站\\素材\\" + name + ".mp3", mode="wb") as audio: audio.write(audio_content) with open("D:\\study\\B站\\素材\\" + name + ".mp4", mode="wb") as video: video.write(video_content) cmd = f'ffmpeg -i D:\\study\\B站\\素材\\{name}.mp4 -i D:\\study\\B站\\素材\\{name}.mp3 -c:a aac -strict experimental D:\\study\\B站\\视频1080P\\{name}output.mp4' subprocess.run(cmd)

2023-07-13 上传