零基础入门数据挖掘 - 二手车交易价格预测
时间: 2023-09-12 18:06:12 浏览: 149
零基础入门数据挖掘 - 二手车交易价格预测是一个任务,旨在预测二手车的交易价格。数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。
为了计算某个品牌的销售统计量,并创造特征,需要在训练数据集上进行计算。这里以品牌为单位进行分组,然后计算该品牌的各种统计数目量,包括数量、最大值、最小值、中位数、总和、方差和均值等等。最后将这些统计结果填充到对应的品牌中。
如果你想查看数据的前5行和后5行,可以使用train_data.head(5).append(train_data.tail(5))命令。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [零基础入门数据挖掘——二手车交易价格预测:baseline](https://blog.csdn.net/StarandTiAmo/article/details/128162151)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文