1. Introduction
AbaloneAge.data 数据有 4177 个样本, 7 个特征,其中 rings 作为预测标签,也就是年
龄。对样本的一些统计数据如下表所示。
Name Data Type Meas. Description
Length continuous mm Longest shell measurement
Diameter continuous mm perpendicular to length
Height continuous mm with meat in shell
Whole weight continuous grams whole abalone
Shucked weight continuous grams weight of meat
Viscera weight continuous grams gut weight (after bleeding)
Shell weight continuous grams after being dried
Rings integer
Statistics for numeric domains:
Length Diam Height Whole Shucke Viscera Shell Rings
Min 0.075 0.055 0.000 0.002 0.001 0.001 0.002 1
Max 0.815 0.650 1.130 2.826 1.488 0.760 1.005 29
Mean 0.524 0.408 0.140 0.829 0.359 0.181 0.239 9.934
SD 0.120 0.099 0.042 0.490 0.222 0.110 0.139 3.224
Correl 0.557 0.575 0.557 0.540 0.421 0.504 0.628 1.0
2. Algorithm Description
考虑到数据的可分性,对年龄的预测是一个回归问题,所以采用支持向量机对数据进行回
归分析。
一、支持向量机的基本原理
支持向量机 (SVM) 是 Corinna 和 Vapnik 于二十世纪末首先提出的。支持向量机方法
Vapnik-Chervonenkis 理论与构造风险最小理论为根底,使离超立体最接近的元素到超平
面的间隔最大。通常超平面不止一个,也就是说支持向量机的目标就是最大化超平面之间