游客
,欢迎来到MedPdf网站!
我的:
下载
预定
举报
收藏
站内信(
0
)
个人中心
我的资源
财富中心
发布资源
预定发布
个人信息
登 录
免费注册
首 页
全 部
内 科
外 科
妇产科
儿 科
影像科
求助区
充 值
联系我们
编辑帖子-MedPdf医学_电子_图书_PDF_资源_文件_网盘_下载
首页 > 分类列表 >
编辑帖子
预定模式
库存模式
1.文档管理
已发布资源
未发布资源
标题
文件大小
上传日期
升序
降序
标题
文件大小
资源页码
上传日期
操作
标题
文件大小
资源页码
上传日期
操作
2.目录信息
*
学 科1:
*
标 题:
设置
U R L :
获取中
全选
文件格式:
pdf
epub
rar
exe
txt
chm
doc
docx
ppt
pptx
jpg
kdh
资源页码:
0
自定义页码:
优先使用ISBN查询
资源价格:
160
自定义价格:
百度云盘
云盘地址:
版本号:
网盘名称:
文件夹:
阿里网盘
网盘地址:
版本号:
网盘名称:
文件夹:
内容简介
为了适应数字经济时代的新发展趋势,培养新时代大数据专业人才,编者通过总结多年的教学经验,借鉴国内外相关领域的教学优势,详细剖析大数据采集、预处理与可视化的基础理论、关键技术、相关工具和应用案例,进而编成本书。 本书是集理论与实践于一体的应用型教材。全书共7章,包括大数据概述、Python程序设计、大数据采集、大数据预处理技术、Excel数据获取与预处理、Python数据预处理、数据可视化技术。本书在编写中着重介绍基本原理,同时突出工程应用,并以清晰、容易理解的方式展现大数据采集、预处理与可视化的基础知识、基本任务、常用方法、实用场景和主要流程,力图做到基本概念准确、阐述条理清晰、主体内容精练、重点难点突出、理论联系实际。此外,本书还将反映相关领域新技术的发展情况。 本书可作为计算机、人工智能、大数据、电子商务、电气、电子、统计学、会计学等相关专业的大数据技术类课程的教材,也可供相关领域的科技人员参考使用,还可作为数据分析及应用类认证培训课程用书。(1)知识讲解宜读易懂,语言表述顺畅自然。 讲述大数据技术中通用的基础知识,为读者进一步研究理论和应用技术打下坚实的基础。基本概念清晰、准确、精练,语言表述顺畅、宜读、自然,尽量避免使用晦涩难懂的语言描述深奥的理论和技术知识。 (2)系统构建知识体系,培养读者的大数据思维。 建立恰当的知识体系,并把相关知识进行合理组织,而不是杂乱无章地堆砌。注重大数据技术的科学分析,有利于培养读者的大数据思维。 (3)理论与实践相结合,注重培养实战型人才。 针对大数据技术的相关应用,通过对典型实例进行分析,读者能够深入且全面地理解并掌握大数据技术的具体应用方法,进而提高自身独立分析问题和解决问题的能力。 (4)配套丰富教辅资源,立体化服务高校人才培养。 为了更好地服务院校教学,助力大数据领域工程型人才培养,编者为本书配套打造了多种教辅资源,如课程 PPT、教学大纲、教案、源代码、案例包、课后习题答案、微课视频等,选用本书的教师可以到人邮教育社区(www.ryjiaoyu.com)下载相关资源。
目录
第1章 大数据概述<br /> 1.1 大数据时代 1<br /> 1.2 大数据的相关概念及特征 2<br /> 1.2.1 大数据的概念 2<br /> 1.2.2 大数据的发展历程 3<br /> 1.2.3 大数据的特征 5<br /> 1.2.4 大数据的作用 6<br /> 1.2.5 大数据的应用领域 7<br /> 1.2.6 大数据的关键技术 8<br /> 1.3 大数据系统简介 9<br /> 1.3.1 Hadoop生态系统 9<br /> 1.3.2 Spark生态系统 12<br /> 1.4 大数据思维 15<br /> 1.4.1 传统思维方式 15<br /> 1.4.2 大数据思维方式 16<br /> 1.5 大数据伦理 17<br /> 1.5.1 大数据伦理的由来 17<br /> 1.5.2 大数据的伦理问题 18<br /> 1.5.3 大数据的伦理原则 21<br /> 1.6 大数据安全 22<br /> 1.6.1 数据全生命周期安全 22<br /> 1.6.2 大数据安全防护技术 23<br /> 1.7 本章小结 24<br /> 1.8 习题 24<br /> <br /> 第2章 Python程序设计<br /> 2.1 Python的安装与运行 25<br /> 2.1.1 Python的特点 25<br /> 2.1.2 Python的下载与安装 26<br /> 2.1.3 Python程序的运行 27<br /> 2.1.4 第三方软件包的安装 29<br /> 2.1.5 Python编程规范 31<br /> 2.2 数据类型与运算符 33<br /> 2.2.1 数字和字符串 33<br /> 2.2.2 列表和元组 38<br /> 2.2.3 字典和集合 42<br /> 2.2.4 运算符 44<br /> 2.3 程序控制结构 47<br /> 2.3.1 程序流程图 47<br /> 2.3.2 顺序结构 48<br /> 2.3.3 选择结构 49<br /> 2.3.4 循环结构 51<br /> 2.4 函数与模块 54<br /> 2.4.1 函数的使用 54<br /> 2.4.2 函数的参数传递 55<br /> 2.4.3 全局变量与局部变量 57<br /> 2.4.4 匿名函数 58<br /> 2.4.5 模块 59<br /> 2.5 文件 60<br /> 2.5.1 文件的打开与关闭 60<br /> 2.5.2 文件的读取与写入 62<br /> 2.5.3 文件的定位 63<br /> 2.6 本章小结 63<br /> 2.7 习题 64<br /> <br /> 第3章 大数据采集<br /> 3.1 大数据采集概述 65<br /> 3.1.1 大数据采集的概念 65<br /> 3.1.2 大数据采集的数据源 66<br /> 3.1.3 大数据采集方法 67<br /> 3.1.4 大数据采集平台 69<br /> 3.2 网络爬虫技术 71<br /> 3.2.1 网络爬虫概述 72<br /> 3.2.2 常用网络爬虫方法 72<br /> 3.2.3 网页数据采集的实现 75<br /> 3.2.4 常用网络爬虫工具 78<br /> 3.2.5 电影评论爬取 82<br /> 3.3 数据抽取技术 85<br /> 3.3.1 数据抽取概述 85<br /> 3.3.2 Kettle简介与其安装 86<br /> 3.3.3 文本数据抽取 87<br /> 3.3.4 网页数据抽取 89<br /> 3.4 案例:网络租房信息采集 91<br /> 3.4.1 网络爬虫采集数据 91<br /> 3.4.2 抽取租房信息 94<br /> 3.5 本章小结 96<br /> 3.6 习题 96<br /> <br /> 第4章 大数据预处理技术<br /> 4.1 数据预处理概述 97<br /> 4.1.1 数据质量 97<br /> 4.1.2 数据预处理的主要任务 99<br /> 4.2 数据清洗 99<br /> 4.2.1 缺失值处理方法 99<br /> 4.2.2 噪声数据处理方法 101<br /> 4.2.3 冗余数据处理方法 105<br /> 4.2.4 数据格式与内容处理方法 106<br /> 4.3 数据集成 106<br /> 4.3.1 实体识别问题 106<br /> 4.3.2 冗余问题 107<br /> 4.3.3 数据值冲突的检测与处理 109<br /> 4.4 数据变换 110<br /> 4.4.1 数据规范化 110<br /> 4.4.2 通过离散化变换数据 112<br /> 4.5 数据归约 113<br /> 4.5.1 过滤法 114<br /> 4.5.2 包装法 115<br /> 4.5.3 嵌入法 116<br /> 4.6 数据脱敏 117<br /> 4.6.1 数据脱敏类型 117<br /> 4.6.2 数据脱敏方法 118<br /> 4.7 案例:汽车行驶工况数据预处理 119<br /> 4.7.1 案例背景 119<br /> 4.7.2 数据描述 119<br /> 4.7.3 数据预处理 120<br /> 4.8 本章小结 124<br /> 4.9 习题 125<br /> <br /> 第5章 Excel数据获取与预处理<br /> 5.1 Excel数据获取 126<br /> 5.1.1 获取文本数据 126<br /> 5.1.2 获取网站数据 128<br /> 5.1.3 获取数据库中的数据 130<br /> 5.2 Excel数据清洗与转换 132<br /> 5.2.1 常用数据分析函数 132<br /> 5.2.2 删除重复行 136<br /> 5.2.3 文本查找与替换 137<br /> 5.2.4 字符串截取 139<br /> 5.2.5 数据的转置 140<br /> 5.2.6 数据的查询和引用 140<br /> 5.2.7 字母与数字的转换 142<br /> 5.3 Excel数据抽取与合并 143<br /> 5.3.1 值的抽取 144<br /> 5.3.2 数据合并 146<br /> 5.3.3 字段合并 147<br /> 5.4 案例:房价行情的对比分析 148<br /> 5.4.1 数据获取 148<br /> 5.4.2 数据预处理与分析 149<br /> 5.5 本章小结 151<br /> 5.6 习题 151<br /> <br /> 第6章 Python数据预处理<br /> 6.1 Python数据预处理基础 153<br /> 6.1.1 科学计算库NumPy 153<br /> 6.1.2 数据分析库pandas 160<br /> 6.2 数据的分组、分割、合并和变形 168<br /> 6.2.1 数据分组 168<br /> 6.2.2 数据分割 171<br /> 6.2.3 数据合并 172<br /> 6.2.4 数据变形 175<br /> 6.3 缺失值、异常值和重复值处理 177<br /> 6.3.1 缺失值处理 177<br /> 6.3.2 异常值处理 181<br /> 6.3.3 重复值处理 185<br /> 6.4 时间序列数据处理 185<br /> 6.4.1 时间序列的基本操作 186<br /> 6.4.2 固定频率的时间序列 187<br /> 6.4.3 时间周期及其计算 188<br /> 6.5 文本数据分析 189<br /> 6.5.1 字符串处理方法 189<br /> 6.5.2 文本数据分析工具 191<br /> 6.5.3 正则表达式 194<br /> 6.5.4 文本预处理 196<br /> 6.6 案例:IMDb5000电影数据预处理 199<br /> 6.6.1 数据分析及代码实现 199<br /> 6.6.2 完整代码 201<br /> 6.7 本章小结 203<br /> 6.8 习题 203<br /> <br /> 第7章 数据可视化技术<br /> 7.1 数据可视化概述 205<br /> 7.1.1 数据可视化的定义 205<br /> 7.1.2 数据可视化的发展历程 206<br /> 7.1.3 数据可视化的作用 211<br /> 7.2 数据可视化的理论基础 212<br /> 7.2.1 数据可视化的流程 212<br /> 7.2.2 数据可视化的设计要素 213<br /> 7.2.3 数据可视化的基础图表 216<br /> 7.2.4 数据可视化的常见工具 219<br /> 7.3 Python数据可视化方法 221<br /> 7.3.1 Matplotlib绘制基础图表 221<br /> 7.3.2 seaborn绘制统计图 229<br /> 7.3.3 wordcloud绘制词云图 254<br /> 7.3.4 NetworkX绘制网络图 257<br /> 7.3.5 案例:重庆公开庭审数据可视化 260<br /> 7.4 pyecharts数据可视化方法 265<br /> 7.4.1 pyecharts简介 265<br /> 7.4.2 pyecharts应用 266<br /> 7.4.3 案例:2020年东京奥运会奖牌看板 267<br /> 7.5 本章小结 278<br /> 7.6 习题 279<br /> <br /> 参考文献 280<br />
作者简介
葛继科: 西南大学博士,加拿大麦吉尔大学博士后出站,重庆科技学院教授,硕士研究生导师。主要从事人工智能、大数据应用、网络安全等方面的教学与研究工作。主讲课程包括:大数据平台与应用、大数据分析与挖掘、大数据采集与优化、人工智能、计算机网络、网络安全技术等。主持省部级教学质量工程项目1项,主持省部级教改重点项目2项、一般项目1项、教育部产学合作育人项目9项、校级教改项目4项,发表教改论文8篇。获省部级教学成果二等奖1项、校级教学成果二等奖2项。主持省部级科研项目7项,参与重量科研项目3项、省部级5项;发表学术论文30余篇,其中SCI收录4篇、EI收录20篇、中文核心3篇,授权发明专利6项。出版教学著作《计算机网络安全技术应用探究》1部,主编《油田大数据应用技术》(石油工业出版社,2021年)、《量子人工智能引论》(西南师范大学出版社,2021年)等学术著作。
出版信息
丛书名:
价格:
作 者:
出版社:
出版日期:
出版信息
版 次:
页 数:
字 数:
印刷时间:
开 本:
纸 张:
印 次:
I S B N:
包 装:
508128
0
0
1
×
学科分类
一区
二区
三区
四区
五区
六区
选择类别:
×
搜索网站连接
关键词:
网站名称:
网站链接首部:
网站链接尾部:
是否显示
×
修改文件信息
文件名称:
文件大小:
页码:
上传日期:
取 消
×
添加文件信息
文件名称:
文件大小:
页码:
上传日期:
取 消
Copyright (C)2007-2018 medpdf.com