没有合适的资源?快使用搜索试试~ 我知道了~
首页GZ-2021041 大数据技术与应用赛项规程.pdf(2021年高职组国赛专用!)
资源详情
资源评论
资源推荐
第 1 页 /共 63 页
全国职业院校技能大赛
赛项规程
一、赛项名称
赛项编号:GZ-2021041
赛项名称:大数据技术与应用
英文名称:Big Data Technology And Application
赛项组别:高职
赛项归属:电子信息大类
二、竞赛目的
为推进实施国家大数据战略,进一步落实国务院《关于促进大数
据发展行动纲要》(国发[2015]50 号)以及 2021 年政府工作报告中
“加快数字化发展,打造数字经济新形态,协同推进数字产业化和产
业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营
造良好数字生态,建设数字中国。”等要求,不断推进大数据专业人
才培养,建立健全多层次、多类型的大数据人才培养体系。
本赛项旨在结合当前大数据行业中技术要求,通过大赛让参赛选
手熟悉一个大数据项目中各个环节的实现过程。通过竞赛来检验教学
水平,引领和促进职业教育教学改革,促进与世界最新水平接轨,营
造崇尚技能的社会氛围。
通过大赛培养参赛选手在企业真实项目环境下进行大数据平台
部署管理、数据采集与处理、数据清洗与挖掘分析、数据可视化及综
第 2 页 /共 63 页
合分析的能力;同时培养选手的理解力、沟通力、抗压力、6S 规范
等职业素质;激发学生自主学习能力和解决问题能力,以达到“以赛
促学、以赛促教、以赛促改”目的。
赛项围绕大数据产业各个岗位的实际需求和要求进行设计,通过
大赛搭建校企合作的平台,深化产教融合,推进产教融合人才培养模
式,提升大数据技术与应用专业及其他相关专业毕业生能力,同时大
赛将促进相关教材、资源、师资、认证、实习就业等全面建设,推动
院校和企业联合培养大数据人才,加强学校教育与产业发展的有效衔
接,促进职业院校信息类相关专业共同发展,为国家战略规划提供大
数据领域的高素质技能型人才。
三、竞赛内容
(一)选手需具备能力
本赛项基于企业真实项目和工作模块,结合企业岗位对学生职业
技能的最新需求,在规定的时间内完成指定大数据模块。其中,主要
考核参赛选手在大数据平台部署管理、数据采集与处理、数据清洗与
挖掘分析、数据可视化及综合分析等方面技能。此外,竞赛同时考核
参赛选手工作组织和团队协作能力、沟通和人际交往能力、解决问题
能力以及致力于紧跟行业发展步伐的自我学习能力。
本项目竞赛内容通过对技能实操表现来评估知识理解以及技能
的熟练程度,将不再另外举行知识及理解性质的理论测试。
(二)竞赛模块
1.竞赛时间
第 3 页 /共 63 页
竞赛总时长为 8 小时。各竞赛队在规定的时间内,独立完成“竞
赛内容”规定的竞赛模块。
2.竞赛内容
本竞赛结合国内行业、企业的实际业务模型;本竞赛只考核技能
部分,不涉及理论。本竞赛进行的技能实操考核,涉及大数据平台及
组件的部署管理、数据采集与处理、数据清洗与挖掘分析、数据可视
化、综合分析。
序号
比赛模块
分数占比
考核内容
1
Hadoop 平台及组
件的部署管理
15%
选手对 Hadoop 平台及组件的部署、管理、
应用
2
数据采集与处理
20%
选手多维度数据采集能力,包括对关系
型数据库、非关系型数据库和网络爬虫
技术的应用
3
数据清洗与挖掘
分析
25%
选手对 Hadoop 系统、Spark 系统、数据
仓 库 等 综 合 应 用 能 力 , 使 用 Java 、
Python、Scala 等开发语言,完成数据清
洗、数据存储、数据转化、数据分析、
数据挖掘等操作
4
数据可视化
20%
选手通过常见的数据可视化方法,使用
Python 语言将数据分析结果以图表的形
式进行呈现、统计
5
综合分析
15%
选手对大数据技术与分析的综合操作和
业务分析及报告撰写能力
6
职业素养
5%
团队分工明确合理、操作规范、文明竞
赛
备注 1:关于最终赛题将由专家组讨论决定。其中,各模块的详细内容描述如下:
(1)Hadoop 平台及组件的部署管理
第 4 页 /共 63 页
依据大数据 Hadoop 平台的技术特点能够独立下载、解压、安装
Hadoop 不同版本的介质。能够对不同版本的 Hadoop 介质进行文件参
数配置,日志查看、状态查看、服务启动、组件部署、组件管理等。
参赛选手需要掌握以下并不仅限于以下技能:
根据需求解压一个 Hadoop 版本
根据需求设置一个 Hadoop 环境变量
根据需求配置相关 Hadoop 环境文件
根据需求配置相关 Hadoop 环境状态
根据需求管理相关 Hadoop 环境启停
根据需求部署 Hive 组件
根据需求管理 Hive 组件
根据需求应用 Hive 组件
根据需求部署 HBase 组件
根据需求管理 HBase 组件
根据需求应用 HBase 组件
根据需求部署 Sqoop 组件
根据需求管理 Sqoop 组件
根据需求应用 Sqoop 组件
根据需求部署 Kafka 组件
根据需求管理 Kafka 组件
根据需求应用 Kafka 组件
根据需求部署 Flume 组件
第 5 页 /共 63 页
根据需求管理 Flume 组件
根据需求应用 Flume 组件
根据需求部署 Spark 组件
根据需求管理 Spark 组件
根据需求应用 Spark 组件
根据需求部署 Zookeeper 组件
根据需求管理 Zookeeper 组件
根据需求应用 Zookeeper 组件
(2)数据采集与处理模块
利用 Chrome 浏览器查看网页源码、分析网站网页结构。按照要
求使用 Python 语言编写爬虫代码、爬取指定数据项;综合利用 ETL
工具对企业数据进行采集,并对采集结果数据集进行数据探索、以及
必要的处理操作。
参赛选手需要掌握以下并不仅限于以下技能:
能够按要求对网页源码进行分析
能够按要求分析出网页结构
能够创建爬虫项目框架
能够按要求构建爬虫请求
能够按要求定义相关字段
能够按要求获取有效数据
能够将爬取到的数据保存到本地
能够将爬取到的数据保存到指定 Mysql
剩余62页未读,继续阅读
灯塔微光
- 粉丝: 906
- 资源: 149
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- 27页智慧街道信息化建设综合解决方案.pptx
- 计算机二级Ms-Office选择题汇总.doc
- 单链表的插入和删除实验报告 (2).docx
- 单链表的插入和删除实验报告.pdf
- 物联网智能终端项目设备管理方案.pdf
- 如何打造品牌的模式.doc
- 样式控制与页面布局.pdf
- 武汉理工Java实验报告(二).docx
- 2021线上新品消费趋势报告.pdf
- 第3章 Matlab中的矩阵及其运算.docx
- 基于Web的人力资源管理系统的必要性和可行性.doc
- 基于一阶倒立摆的matlab仿真实验.doc
- 速运公司物流管理模式研究教材
- 大数据与管理.pptx
- 单片机课程设计之步进电机.doc
- 大数据与数据挖掘.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0