UCI Machine Learning Repository上的DNA序列分类数据集
时间: 2024-05-20 07:15:06 浏览: 130
UCI机器学习数据集
5星 · 资源好评率100%
UCI Machine Learning Repository上有多个DNA序列分类数据集,其中一些较为流行的包括:
1. Dna: 包含了缺失值和离群值的人类基因组和细菌基因组的序列数据。有 3 类基因,分别是人类 DNA,细菌 DNA 和病毒 DNA。
2. Promoter Gene Sequences: 包含了人类和小鼠的启动子序列,分为正类和负类两个类别。正类代表启动子序列,负类代表非启动子序列。
3. HCV Data: 包含了丙型肝炎病毒(HCV)RNA序列的数据,分为 2 类:HCV阳性和HCV阴性。
4. Breast Cancer Wisconsin (Diagnostic) Data Set: 包含了从乳腺活检中提取的肿瘤细胞核的特征,以及一个用于分类的目标变量。数据集中有 569 个样本,其中 212 个是恶性肿瘤,357 个是良性肿瘤。
这些数据集可以用于DNA序列分类问题的研究和开发。
阅读全文