本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
• 在本书第1版的基础上,按照离线大数据和流式大数据两个场景进行划分
• 在代码实现上以Python为主,紧贴主流编程语言
• 代码的可用性增强
本书在第1版的基础上,介绍大数据的时代背景及应用方案、常用的离线大数据和流式大数据组件,以及基于云平台的容器级数据平台搭建。书中以离线大数据和流式大数据两个具体示例,贯穿本书的第二、三部分内容,对组件之间的协同工作关系进行剖析。书中的代码部分基本上使用Python编写,用户可以下载参考。
如果你是一位在校学生、Python编程爱好者或是想转行从事大数据工作的在职IT人员,阅读本书必有所收获!
·刘未昕·
从事IT研发和项目管理工作十余年。使用多种主流程序设计语言,深耕于大数据应用及人工智能技术,多年从事金融、数据仓库、智慧医疗等领域的研发工作。5年以上IT行业授课、培训经验,并在多所高校担任外聘讲师。
·张粤磊·
平安壹钱包前大数据架构师。业内知名大数据专家,多本大数据畅销书的作者。2016年以来,其每年都以高级专家和咨询顾问的身份深入参与大数据、人工智能技术在行业的落地应用工作。至今已完成企业培训数百场,培训学员数万名,在数据人才实战型、场景型培训培养方面具有丰富的实践经验。
·张 魁·
虚拟化工程师,OpenStack架构师,苏州某高校云平台架构师,十余年Linux系统运维实践及虚拟化开发经验,4年Linux系统补丁开发经验。先后在美企担任虚拟化应用运维、服务器集群开发运维工程师或系统开发架构师,高校信息中心云平台架构师,主要关注OpenStack、Docker及分布式存储等。
·吴茂贵·
运筹学与控制论专业研究生学历。毕业后主要参与数据仓库、商务智能等方面的项目,期间做过数据处理、数据分析、数据挖掘等工作,行业涉及金融、物流、制造业等。近期主要做复杂数据存储、清理、转换等工作,同时在大数据方面也很有兴趣并投入大量时间和精力,且将持续为之。