![](https://csdnimg.cn/release/download_crawler_static/88056986/bg7.jpg)
第 1 章 绪论
1.1 研究背景及当前现状
房地产市场是关乎国计民生的重要经济产业。随着城镇化的不断发展和人民生活水平
的不断提高,购房问题成为了居民在生活中经常关注的一项内容。由于近年来政府不断对
房地产行业进行调控,导致二手房交易量增大;同时根据居民家庭收入情况而言,只有少
量的高收入家庭可以购买一手房来进行生活活动,但就大部分的中低收入人群而言,购买
二手房才是适合他们的选择,所以二手房交易热度以及规模逐渐赶超一手房,在房地产市
场占据了重要地位。但随之而来的问题也逐渐显现:一方面,由于房产交易市场发展得蒸蒸
日上,而且成交情况非常火爆,从而导致了二手房子的供应量变大,并因此造成了二手房数据
量的增加;而另一方面,由于市民希望获得二手房源信息途径较少,因而获取的信息过多,信息
出现了混乱,市民往往无法对房屋信息做出全面认识和宏观把握,从而造成了决策困难。在
当前的二手房数据平台,数据库仅仅满足了一些单纯的功能,比如新增、更改、撤销和查找
这些数据,但这种单纯的功能却根本无法发现其中更深层次数据源的潜在价值,从而发挥这
些数据源所应当发挥的优势。因为用户往往想要寻找中意的房子,包括对小区、户型、朝向、
楼层等基本信息的一些需求,导致用户们很难从大量的信息中找到适合自己的二手房信息。
1.2 国内外研究现状
近几年,互联网信息技术飞速发展,各个国家对于计算机的相关技术都也飞速发展,
使用在了各个方面,涉猎较多。在过去的几年里,国外学者对网络爬虫技术运用方面较多,
技术方面也较为成熟,深度学习的一些算法和可视化相关技术都有所运用,虽然研究方面
不少,但几种技术的结合使用情况却不多见。另外,国外二手房网站较少,二手房数据少,
同时对已有的二手房信息没有过多利用,这个方面研究较少,二手房信息结合网络爬虫和
可视化技术等运用更就少了。而在国内,由于近年来房地产事业的飞速发展,导致二手房
信息较多,所以关于二手房的网站较多,例如链家,安居客,58 同城等,网站较多,同样
的,二手房的信息数据多,较为繁乱。网络爬虫技术,数据可视化技术等运用方面较多,
涉猎也较广。一些学者通过网络爬虫技术和可视化技术对二手房的数据信息进行利用设计,
但这些网站以及设计中,数据库仅仅满足了一些单纯的功能,比如新增、更改、撤销和查找
这些数据,但这种单纯的功能却根本无法发现其中更深层次数据源的潜在价值,从而发挥这
些数据源所应当发挥的优势,同时也缺少对房源信息关系的展示,用户难以直观了解。同
时,在这些大量的数据信息中,用户很难做出全面认识和宏观把握,从而造成了决策困难。