MATLAB计算机视觉与深度学习实战(第2版)
  • 推荐0
  • 收藏0
  • 浏览95

MATLAB计算机视觉与深度学习实战(第2版)

刘衍琦,王小超,詹福宇 (作者)  张国霞 (责任编辑)

  • 书  号:978-7-121-47573-3
  • 出版日期:2024-05-01
  • 页  数:400
  • 开  本:16(240*190)
  • 出版状态:上市销售
  • 维护人:张国霞
本书详细讲解了29个实用的MATLAB计算机视觉与深度学习实战案例(含可运行程序),涉及图像去雾、答题卡识别、图像分割、肝脏影像辅助分割系统、人脸二维码编解码系统、英文印刷体字符识别、图像融合、全景图像拼接、图像压缩和重建、视频处理工具、运动目标检测、路面裂缝检测识别系统、车流量计数、三维网格模型特征点提取、数字水印、图像水印、辅助自动驾驶、汽车目标检测、手写数字识别、以图搜图、验证码识别、图像生成、影像识别、物体识别、图像校正、时间序列分析、交通目标检测、智能问答等,还讲解了深度神经网络的拆分、编辑、重构等多项重要技术及应用,涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习的理论及应用方面。
工欲善其事,必先利其器。本书对每个数字图像处理的知识点都提供了丰富、生动的案例素材,并以MATLAB为工具详细讲解了实验的核心程序,涉及DeepLearning Toolbox、TensorFlow、Keras、Java等。通过对这些程序的阅读、理解和仿真运行,读者可以更加深刻地理解图像处理的相关知识,并且更加熟练地掌握计算机视觉及深度学习在不同领域中的应用。
本书以案例为基础,结构紧凑,内容深入浅出,实验简单高效,适合高等院校计算机、通信和自动化等相关专业的教师、本科生、研究生,以及计算机视觉工程人员阅读和参考。
详解29套完整的计算机视觉与AI实战案例,超值赠送配套代码、运行视频、课件、教案等。
作者简介:
——刘衍琦
技术图书主编,拥有企业、研究所、高校从业经历,长期从事大数据和人工智能实践应用相关工作,主要涉及机器学习、计算机视觉和自然语言处理等领域。曾主持和参与多个科研项目,已出版十余部图书,拥有多项国家专利。

——王小超
天津工业大学副教授,硕士生导师,大连理工大学博士,北京航空航天大学计算机学院博士后,中国计算机学会会员,天津市131创新型人才培养工程第三层次人才。研究方向为图形图像处理,发表论文30多篇,主持完成国家自然科学基金项目1项。

——詹福宇
博士,毕业于西北工业大学航空学院飞行器设计专业,四川省特聘专家,自贡市“盐都百千万英才计划”青年拔尖人才,现任中电科航空电子有限公司无人机领域高级技术专家,中电科特种飞机系统工程有限公司副总工程师。主要从事飞行器设计、导航飞控系统、智能控制系统等研究工作。
计算机视觉(Computer Vision,CV)主要研究如何用图像采集设备和计算机软件代替人眼对物体进行分类识别、目标跟踪和视觉分析等。深度学习源自经典的神经网络架构,属于机器学习领域,它通过不同形式的神经网络,结合视觉大数据(拥有大规模存量并不断产生增量)进行训练,自动提取细颗粒度的特征并结合粗颗粒度的特征,形成抽象化的视觉描述,在视觉分析方面取得了很大的进步,是当前人工智能爆发式发展的内核驱动。随着大数据及人工智能技术的不断发展,计算机视觉以其可视性、规模性、普适性逐步成为AI应用落地的关键领域之一,在理论研究和工程应用上均发展迅猛。
MATLAB是MathWorks公司推出的一款应用于科学计算和工程仿真的交互式编程软件,近几年已经发展成为集图像处理、数值分析、数学建模、仿真控制、信号处理等工具箱为一体的科学应用软件,并且成为世界上应用最广泛的科学计算软件之一。数字图像处理技术涉及计算机科学、模式识别、人工智能、生物工程等学科,是一种综合性的技术。
自从电子计算机诞生以来,通过计算机仿真来模拟人类视觉便成为一个非常热门且颇具挑战性的研究领域。随着数码相机、智能手机等硬件设备的普及,图像以其易于采集、信息相关性多、抗干扰能力强的特点得到了越来越广泛的应用。当前,人类社会已经进入了信息化和数字化时代,随着国家对人工智能领域的重视,计算机视觉人才的需求量越来越大,应用也越来越广泛。
计算机视觉处理工具箱可为用户提供诸如图像变换、图像增强、图像特征检测、图像复原、图像分割、图像去噪、图像配准、视频处理、深度学习等的技术支撑。同时,借助MATLAB方便的编程及调试技巧,用户可根据需要进一步拓展计算机视觉处理工具箱,满足定制化的业务需求。

目录

目录
第1章 基于图像增强方法的图像去雾技术
1.1 案例背景
1.2 空域图像增强
1.3 直方图均衡化
1.4 程序实现
1.4.1 设计GUI
1.4.2 全局直方图均衡化处理
1.4.3 限制对比度的自适应直方图均衡化处理
1.4.4 Retinex增强处理
1.4.5 方法评测
第2章 基于Hough变换的答题卡识别
2.1 案例背景
2.2 图像二值化
2.3 倾斜校正
2.4 图像分割
2.5 程序实现
2.5.1 图像灰度化
2.5.2 灰度图像二值化
2.5.3 图像平滑滤波
2.5.4 图像校正
2.5.5 完整性核查
第3章 基于聚类算法的图像分割
3.1 案例背景
3.2 K-means聚类算法的原理
3.3 K-means聚类算法的特点
3.4 K-means聚类算法的缺点
3.5 基于K-means聚类算法进行图像分割
3.6 程序实现
3.6.1 数据样本间的距离
3.6.2 提取特征向量
3.6.3 图像聚类分割
第4章 基于区域生长的肝脏影像辅助分割系统
4.1 案例背景
4.2 阈值分割算法
4.3 区域生长算法
4.4 基于阈值预分割的区域生长算法
4.5 程序实现
第5章 基于主成分分析的人脸二维码编解码系统
5.1 案例背景
5.2 QR编码简介
5.2.1 QR编码的符号结构
5.2.2 QR编码的基本特性
5.2.3 QR编码的流程
5.2.4 QR译码的流程
5.3 主成分分析
5.4 程序实现
5.4.1 人脸建库
5.4.2 人脸识别
5.4.3 人脸二维码
第6章 基于特征匹配的英文印刷体字符识别
6.1 案例背景
6.2 图像预处理
6.3 图像识别技术
6.4 程序实现
6.4.1 设计GUI
6.4.2 回调识别
第7章 基于小波变换的图像融合
7.1 案例背景
7.2 小波变换
7.3 程序实现
7.3.1 设计GUI
7.3.2 图像载入
7.3.3 小波融合
第8章 基于块匹配的全景图像拼接
8.1 案例背景
8.2 图像拼接
8.3 图像匹配
8.4 图像融合
8.5 程序实现
8.5.1 设计GUI
8.5.2 载入图像
8.5.3 图像匹配
8.5.4 图像拼接
第9章 基于主成分分析的图像压缩和重建
9.1 案例背景
9.2 主成分分析降维的原理
9.3 由得分矩阵重建样本
9.4 主成分分析数据压缩比
9.5 基于主成分分析的图像压缩
9.6 程序实现
9.6.1 主成分分析的代码实现
9.6.2 图像与样本间的转换
9.6.3 基于主成分分析的图像压缩
第10章 基于小波变换的图像压缩
10.1 案例背景
10.2 图像压缩基础
10.3 程序实现
第11章 基于GUI搭建通用的视频处理工具
11.1 案例背景
11.2 视频解析
11.3 程序实现
11.3.1 设计GUI
11.3.2 实现GUI
第12章 基于帧间差分法进行运动目标检测
12.1 案例背景
12.2 帧间差分法
12.3 背景差分法
12.4 光流法
12.5 程序实现
第13章 路面裂缝检测识别系统设计
13.1 案例背景
13.2 图像灰度化
13.3 图像滤波
13.4 图像增强
13.5 图像二值化
13.6 程序实现
第14章 基于光流场的车流量计数
14.1 案例背景
14.2 光流法检测运动物体的基本原理
14.3 光流场的计算方法
14.4 梯度光流场约束方程
14.5 Horn-Schunck算法
14.6 程序实现
14.6.1 计算视觉系统工具箱简介
14.6.2 基于光流场检测汽车运动
第15章 基于邻域支持的三维网格模型特征点提取
15.1 案例背景
15.2 网格特征提取
15.2.1 邻域支持
15.2.2 网格特征点提取
15.3 程序实现
第16章 基于小波变换的数字水印技术
16.1 案例背景
16.2 数字水印技术原理
16.3 典型的数字水印算法
16.4 数字水印攻击和评价
16.5 基于小波变换的水印技术
16.6 程序实现
16.6.1 准备宿主图像和水印图像
16.6.2 小波数字水印的嵌入
16.6.3 小波数字水印的检测和提取
16.6.4 小波数字水印的攻击实验
第17章 基于BEMD与Hilbert曲线的图像水印技术
17.1 案例背景
17.2 BEMD与Hilbert曲线
17.2.1 相关工作
17.2.2 案例算法
17.3 程序实现
17.3.1 实验结果与分析
17.3.2 核心程
第18章 基于计算机视觉的辅助自动驾驶
18.1 案例背景
18.2 环境感知
18.3 行为决策
18.4 路径规划
18.5 运动控制
18.6 程序实现
18.6.1 传感器数据载入
18.6.2 创建追踪器
18.6.3 碰撞预警
第19章 基于深度学习的汽车目标检测
19.1 案例背景
19.2 基本架构
19.3 卷积层
19.4 池化层
19.5 程序实现
19.5.1 加载数据
19.5.2 构建CNN
19.5.3 训练CNN
19.5.4 评估训练效果
第20章 基于深度学习的手写数字识别
20.1 案例背景
20.2 卷积核
20.3 特征图
20.4 池化降维
20.5 模型定义
20.6 MATLAB实现
20.6.1 解析数据集
20.6.2 构建网络模型
20.6.3 构建识别平台
20.7 Python实现
20.7.1 数据拆分
20.7.2 训练网络
20.7.3 网络测试
20.7.4 集成应用
第21章 基于深度学习的以图搜图
21.1 案例背景
21.2 选择模型
21.2.1 AlexNet
21.2.2 VGGNet
21.2.3 GoogLeNet
21.3 深度特征
21.4 程序实现
21.4.1 构建深度索引
21.4.2 构建搜索引擎
21.4.3 构建搜索平台
第22章 基于深度学习的验证码识别
22.1 案例背景
22.2 生成验证码数据
22.3 验证码CNN识别
22.4 程序实现
22.4.1 验证码样本数据集标注
22.4.2 验证码样本数据集分割
22.4.3 训练验证码识别模型
22.4.4 测试验证码识别模型
第23章 基于生成对抗网络的图像生成
23.1 案例背景
23.2 选择生成对抗数据
23.3 设计生成对抗网络
23.4 程序实现
23.4.1 训练生成对抗模型
23.4.2 测试生成对抗模型
23.4.3 构建生成对抗平台
第24章 基于深度学习的影像识别
24.1 案例背景
24.2 选择肺部影像数据集
24.3 编辑CNN迁移模型
24.4 程序实现
24.4.1 训练CNN迁移模型
24.4.2 测试CNN迁移模型
24.4.3 融合CNN迁移模型
24.4.4 构建CNN识别平台

第25章 基于CNN的物体识别
25.1 案例背景
25.2 CIFAR-10数据集
25.3 VGGNet
25.4 ResNet
25.5 程序实现
第26章 基于CNN的图像校正
26.1 案例背景
26.2 倾斜数据集
26.3 自定义CNN回归网络
26.4 AlexNet回归网络
26.5 程序实现
第27章 基于LSTM的时间序列分析
27.1 案例背景
27.2 厄尔尼诺-南方涛动指数数据
27.3 样条分析
27.4 用MATLAB实现LSTM预测
27.5 用Python实现LSTM预测
第28章 基于YOLO的交通目标检测
28.1 案例背景
28.2 车辆YOLO检测
28.3 交通标志YOLO检测
第29章 基于ChatGPT的智能问答
29.1 案例背景
29.2 网络URL访问
29.3 ChatGPT接口说明
29.4 构建智能问答应用

读者评论

图书类别

相关图书

B站运营大揭秘:百万Up主真想教会你的创作笔记

GenJi是真想教会你 鱼C-小甲鱼 阿Test正经比比 编著 (作者)

本书由B站的三位百万级Up主(GenJi是真想教会你、鱼C-小甲鱼、阿Test正经比比)联合打造,为读者提供了B站独家运营秘籍。 全书总计8章。第1章重点讲解...

 

看漫画学C++:有趣、有料、好玩、好用(全彩入门版)

关东升 ,赵大羽 (作者)

C++,简单而强大,已经渗透到计算机领域的各个角落,甚至有很多中小学也开始引入C++编程课程。 本书秉承有趣、有料、好玩、好用的理念,通过精心设计的漫画,...

 

手机摄影从实战到精通

追风 (作者)

这是一本非常好用的手机摄影指南,旨在帮助读者全面掌握手机摄影从实战到精通的方方面面,使读者通过手机能轻松地拍摄出高质量的视频。 全书总计7章。 第1章讲解对...

 

互联网大厂晋升指南:从P5到P9的升级攻略

李运华 (作者)

本书主要介绍了一套系统的晋升方法论,涵盖“理解晋升→准备晋升→参与晋升→获得晋升”这条完整的晋升链条,深入剖析了晋升背后的规则、“潜规则”、技巧和套路,帮助读者...

¥118.00

架构演变实战:从单体到微服务再到中台

潘志伟 (作者)

本书从搭建单体架构遇到的瓶颈开始,通过真实案例介绍从单体架构转型为微服务架构及中台架构过程中遇到的困难、问题与具体解决方法。全书共计9章,前3章以案例和原理为基...

 

Offer来了:Java面试核心知识点精讲(第2版)

王磊 (作者)

本书讲解Java面试中常被问及的核心知识点,涉及Java基础、Java并发编程、JVM、Java高并发网络编程、Spring基础、Netflix的原理及应用、S...