当我们翻开一本专业教材,每个字都认识,每段话也能读懂,本以为一看就会,结果用起来仍然心里没底。目前,部分教材由学术专家编著而成,有深度、有见地,但是术业有专攻,由于作者项目实战经验的稍微欠缺,可能导致教材实战部分介绍浅尝辄止,或者说不明白。

这种情况并不少见,特别是大数据、人工智能这样的新兴前沿学科,教材需要既能让老师清晰地明确教学任务,也能帮助学生读懂章节内容,并配套经过验证的实验和相应的资源,确实不易。但是,难不代表没有,“大数据人工智能应用人才培养系列教材”很好地兼顾了上述诉求。

本丛书聚焦专业要求和学生需求,由清华大学博士刘鹏教授联合一线教学师资与行业工程师撰稿,清华大学出版社出版。一方面,有着丰富教学经验和专业知识储备的在校老师对内容进行梳理和打磨,使教材符合教学要求;另一方面,有着丰富实战经验的在职工程师根据实打实的项目,补充实战环节与配套资源。双管齐下,每本书基本包含了理论知识、案例精讲与实践操作,并且做到了理论部分好读,实战部分好用。

特别在实战部分,“大数据人工智能应用人才培养系列教材”从北交所首批上市公司——云创大数据的项目案例和行业积累中拓展教学内容,在其10多个领域的1000多个成功案例中沉淀补充,内容十分接近日常的大数据和人工智能工作。

具体来说,实验包含从云创大数据丰富的大数据与人工智能实验浓缩而来的精华内容,详细介绍软件安装、实验步骤和示例,并提供对应的代码和数据,老师用起来省心,学生学起来顺手。

在其他配套资源方面,丛书作者也是诚意十足,从出版的第一本书就开始提供精美实用PPT,每本书一套PPT,每个章节一个PPT,书籍和PPT一一对应,既方便读者学习理解,更是为教学提供了便利,老师们根据PPT即可形成教案。

同时,每个章节后附有作为教材标配的思考题,在教学结束后,进一步引导学生总结与思考,并且提供对应的习题答案,这样可以大大节省老师们的教学准备时间,帮助他们将更多精力放到其他教学任务上。

不止于此,老师作为教材的讲授者,只有他们能够动手实验,才能更好地传达给学生。为此,自2016年以来,云创大数据相继举办了100多场线下线上大数据、人工智能、云计算培训班,2000多所高校师生参加,通过项目实战培训的方式,进一步帮助培养专业师资,不断优化教材体系。

可以说,使用本丛书不只是获得了书本上的专业知识,同时也收获了与之配套的稀缺资源。因此,丛书自问世以来,便被多所高校采用,而其培养的专业人才也相继走上就业岗位。为了跟上技术发展,本套教材不断丰富完善,第2版开始刷新过时的课程内容。目前,《R语言(第2版)》和《Python语言(第2版)》已正式出版。

清华大学出版社王编辑如此评价:“刘鹏教授的这套教材选题比较独特,并考虑到未来高职高专和应用型本科大数据人才的就业需求情况,从而选择了一些非常有特色的选题。”

具体而言,丛书包含《人工智能概论》、《云计算导论》、《云计算实战》、《大数据导论》、《数据清洗》、《Python语言》、《数据挖掘基础》、《R语言》、《大数据系统运维》、《大数据实践》、《数据标注工程》、《人工智能应用开发》。

《人工智能概论》

本书全面介绍了人工智能的基本技术,目标是用通俗易懂的方法帮助读者构建完整的人工智能知识体系,为后续的深入学习打下基础。全书共分为10章,内容包括人工智能概述、知识表示、搜索技术、机器学习、深度学习、自然语言处理、机器人及智能控制等。本书适合高职高专和应用型本科,作为非人工智能专业的选修课和人工智能专业的导论课教材。也适合作为人工智能技术爱好者的入门书。该书非常适合高校作为全校的人工智能通识课教材。

《云计算导论》

本书从云计算的基本概念开始,以云计算知识结构和技术要点为脉络,用理论与实践相结合的方式介绍云计算导论的内容。全书共8章,分成3个部分,第1章和第2章为基础部分,介绍云计算的基本概念、发展及模型节构;第3章~第7章为技术实践操作部分,是全书的重点内容,主要介绍云计算的体系机构与部署、云计算主要技术、可用的公有云平台、虚拟化平台的搭建,以及分布式计算平台的搭建相关内容;第8章为云计算应用部分,介绍云计算在各个行业领域的实践应用情况。本书既适合作为高职院校计算机相关专业的云计算导论课程的教材,也适合非计算机专业的学生及广大云计算爱好者阅读学习。

《云计算实战》

本书从云计算的概念与原理说起,结合AWS成熟的系统平台与云创云计算实训平台,对云计算的应用场景与系统实际操控进行完整的阐述,详细介绍了云计算与AWS、AWS基础设施、计算服务、存储服务、数据库服务、网络服务、安全防护、AWS 推荐架构、Web 应用部署、成本管理、开发运维、AWSGameday、Jam平台和云计算实训平台等行业前沿的知识与应用。针对云计算应用,本书由参与世界技能大赛云计算赛项的指导教师完成撰写。通过系统讲解、代码应用及章节习题,将理论与实践相结合,帮助读者简单、快速地获取云计算专业知识,深入了解AWS平台与服务。本书适合技师类院校和高校相关专业的教学应用及对云计算感兴趣的朋友进行进阶学习。

《大数据导论》

《大数据导论》是了解和学习大数据的基础条件,通过本书了解大数据基本概念,大数据的架构,大数据的采集方式和预处理,常用的ETL工具,简单熟悉数据仓库的构建模式,大数据的存储,数据挖掘的方法,以及大数据的可视化技术,从而更好地将大数据技术应用在各行业领域,更深入地开展大数据技术的应用研究。从基础开始,通过理论与实际案例相结合,帮助读者由浅入深进行学习,逐步理清大数据的核心技术和发展趋势。本书可以作为培养应用型人才的课程教材,也适用于初学入门者,对大数据基础理论有需求的广大读者。

《数据清洗》

本书系统地讲解了数据清洗理论和实际应用,共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作系统下的数据常规格式、数据编码及数据类型转换等;第3章介绍ETL概念、数据清洗的技术路线、ETL工具及ETL子系统等;第4章介绍了Excel、Kettle、OpenRefine、DataWrangler和Hawk的安装及使用等;第5章介绍Kettle下文本文件抽取、Web数据抽取、数据库数据抽取及增量数据抽取等;第6章介绍数据清洗步骤、数据检验和数据错误处理,数据质量评估及数据加载;第7章介绍网页结构,利用网络爬虫技术进行数据采集,利用JavaScript技术进行行为日志数据采集等;第8章介绍RDBMS的数据清洗方法和数据脱敏处理技术等。

《Python语言》(第1版)

本书以WIN10 和Python3.6.5搭建Python开发基础平台为起点,重点阐述Python语言的基础知识和三个典型的项目实战案例。全书以理论引导、案例驱动、上机实战为理念打造Python语言学习的新模式。具体内容分为两大部分:第一部分以Python编程语言基础知识普及为主,分别介绍了Python3概述、基本语法、流程控制、Python组合数据类型、字符串与正则式、函数、模块、类和对象、异常处理、文件操作;第二部分:以项目实战为核心,以学以致用为导向,以贴近生活的案例为依托,分别介绍Python爬虫项目实战、Python数据可视化项目实战、Python数据分析项目实战。

《Python语言》(第2版)

本书以在 Windows 10 中用 Python 3.6.5 搭建Python 开发基础平台为起点,重点阐述 Python 语言的基础知识和 7 个典型的项目实战案例。全书以理论引导、案例驱动、上机实战为理念打造 Python语言学习的新模式。具体内容分为两大部分:第 1 部分以 Python 语言的基础知识普及为主,内容包括 Python 3概述、基本语法、基本数据类型、流程控制、字符串与正则表达式、函数、模块、对象和类、异常、文件操作;第 2部分以项目实战为核心,以学以致用为导向,以贴近生活的案例为依托,分别介绍爬虫程序、数据可视化、数据分析、Django开发、机器学习、自然语言处理和推荐系统项目实战。

《数据挖掘基础》

本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解了基于日志的大数据挖掘技术的原理、工具、应用场景和成功案例。通过以上内容的学习,读者将了解数据挖掘的基本概念、思想和算法,并掌握其应用要领。本书可以作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。

《R语言》(第1版)

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者无所适从,本书力求用简洁、精炼、理论实践相结合的方式让大家快速掌握R语言。全书共14章,分为基础篇(第2-10章),应用篇(第11-12章)和进阶篇(第13-14章)。基础篇按照数据分析过程,主要讨论了R数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对5个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题,把数据变成价值。进阶篇解决如何用R处理大数据的一些技术。本书可以作为培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。

《R语言》(第2版)

本书通过 Titanic 数据分析案例,深入浅出地介绍了 R语言在大数据分析应用中的相关知识,包括:数据准备、数据清洗、数据探索、数据变换、特征工程、数据建模、模型评估、模型部署等。全书共 13章,第 1~3 章介绍 R语言的开发环境和基本语法;第 4~8 章按数据分析生命周期讨论 R 语言的实现;第 9 章高级编程相对独立,主要解决复杂问题可能用到的程序结构;第 10、11章与机器学习有关,内容偏难,但通过 Rattle 包回避了算法底层技术的难点;第 12、13章通过两个实际项目,让读者体验数据处理的全过程以及业务对分析的重要性。本书力求以简洁、精练、理论与实践相结合的方式,让读者快速掌握 R语言。本书既可作为数据分析相关课程的教材,也可作为数据分析爱好者的参考资料。

《大数据系统运维》

本书是大数据人工智能应用人才培养系列教材中的一册,讲解了大数据系统运行维护过程中的各个主要阶段及其任务,包括配置管理、系统管理、故障管理、性能管理、安全管理、高可用性管理、应用变更管理、升级管理及服务资源管理,内容全面且翔实,兼具基础理论知识与运维实践经验,特别是重点介绍了大数据系统的运维特点及运维技能,以保障大数据系统的稳定可靠运行,更好地支撑大数据的商业应用价值。本书具有很强的系统性和实践指导性,可以作为培养应用型人才的课程教材,也同样适合于有意从事IT系统运维工作的广大从业者和爱好者作为参考书。

《大数据实践》

本书内容涵盖了目前使用广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、Hadoop数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和SparkSQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装部署方式都给出了详细步骤,常用命令也都有具体示例介绍,是一本实操性很强的工具书,能帮助初学者快速掌握和操作这几款常用的大数据处理系统。本书以浅显易懂的语言风格和图文并茂的操作示例带领读者迈入大数据实践之门,可以作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。

《数据标注工程》

《数据标注工程》是由中国大数据应用联盟人工智能专家委员会主任刘鹏教授主编的一本系统学习数据标注技术的教材。本书使用浅显易懂的语言,系统地介绍了数据标注基本概念、分类、流程、质量检验、管理和应用等。通过理论与实战相结合的方式,帮助读者由浅入深进行学习,让读者真正掌握数据标注的核心技术、实施和管理方法。本书可以作为培养应用型人才的课程教材,也适用于初学入门者,以及广大的数据标注行业从业者。数据标注行业迅速成长,缺乏一本权威教材,希望本书能够填补空白。

微信扫描下图二维码下单购买!