据平台统计出来的数据, 辅助公司中的 PM 以及管理人员分析现有产品的情况,持续改进产品的设计,以及调
整公司的战略和业务。
2015.09 - 2016.07 项目 三:中医在线 APP 采集及日志分析系统
Flume、Kafka、Spark、Hadoop、Hive、MySQL、HBase,ZooKeeper
Eclipse、Linux、JDK、Maven、Git
责任描述:
1,负责离线分析系统:通过用户日志,结合相关业务指标,呈现 App 运营状态;
2,负责日志采集系统:对接前台业务系统,抽取相应日志文件,并进行 ETL;
3,参与实时分析系统:实时分析抽取的日志,统计 app 实时运营状态;
技术描述:
1.采集系统使用双层 Flume 分层抽取数据,使用每层的 Cannel 进行缓存,进行一定程度的容灾备份;
2.将 Flume1.7 的 tairDirSource 迁移到 集群使用的 1.5 上,并修改源代码,以解决文件名改变,重新读取的问 题;
3.通过 Flume 拦截器,以增加消息头的方式,防止进入 Kafka 分区时,发生数据倾斜问题.;
4.第一层 Flume 会使用 Sink 组进行负载均衡,防止第二层某个 Flume 发生倾斜;
5.使用低级 Kafka 消费者,消费数据,维护双重 OffSet,确保宕机情况下不会丢失数据;
6.离线分析系统,通过 Crontab 定时调度 HDFS 的数据存入 Hive,定时使用 Hive 对数据进行分析;
基于平台 APP 的使用量大大增加, 为了解 APP 的用户使用情况 ,基于每天产生的大量日志,搭建分布式环境下的采
集系统. 并基于采集来的日志数据,通过离线数据分析系统和实时数据分析系统两个模块的协同作用.对数据进行
进一步的统计,分析 .为 APP 的改进与升级提供了有力的参考依据。
2015.03 - 2015.09 项目 四:中医在线
Spring + SpringMVC + MyBaits + WebService + ElasticSearch + Nginx
Eclipse、Linux、JDK、Maven、Git
责任描述:
1,负责前台关键字信息缓存检索的实现及维护;
2,负责后台权限管理系统实现及维护;
3,参与后台第三方支付模块的实现和维护;
技术描述:
1.项目使用 Spring + SpringMVC + MyBaits 框架完成整个系统开发;
2.调用 WebService 技术来实现第三方接口的调用;
3.利用 Explain 分析 sql 并建立有效索引;
4.使用 Redis 缓存技术和 ElasticSearch 全文检索来增强用户体验;
5.基于权限模型,实现后台访问权限的控制;
本系统为中医教育及健康服务平台,主要是以线上教育,咨询为主,随着中医药事业的发展,在健康越来越得到人
们的重视,用户可以线上购买视频后,通过在线课程,提高相关知识;本系统主要功能为:用户系统,前台交易
系统,支付系统,后台管理系统,视频系统,用户反馈系统 ,博客系统等;
2017.08 - 2018.02 海量新闻文本信息挖掘
spark+hadoop+kafka+flume+mongdb+Mysql
32 节点(1 主 1 备 30 从)主节点/备 128G 内存 8T 的硬盘 8CPU*4 核。从节点 64G 内存 8CPU*4 核 4T 的硬盘
1 主要负责项目中 spark 组件数据实时处理的任务。
2 spark 集群的安装部署、测试。