上部深度學習入門
第1章 深度學習基礎 002~017
1.1 深度學習的概念 003
1.1.1 深度學習的發(fā)展簡史 003
1.1.2 深度學習的特點 006
1.1.3 深度學習的應用 006
1.2 神經(jīng)網(wǎng)絡的概念 007
1.2.1 人是如何識別數(shù)字的 008
1.2.2 感知機的提出 009
1.3 神經(jīng)網(wǎng)絡的應用 012
1.3.1 感知機模型 013
1.3.2 能夠識別數(shù)字的神經(jīng)網(wǎng)絡 015
1.4 本章小結與練習 017
本章練習 017
參考文獻 017
第2章 深度學習的算法基礎梯度下降法 018~026
2.1 梯度下降法的定義 018
2.2 梯度下降法的類型 021
2.2.1 批量梯度下降 021
2.2.2 隨機梯度下降 022
2.2.3 小批量隨機梯度下降 022
2.2.4 動量隨機梯度下降 023
2.3 自適應優(yōu)化算法 024
2.3.1 AdaGrad算法 024
2.3.2 RMSProp算法 025
2.3.3 Adam算法 025
2.4 本章小結與練習 026
本章練習 026
參考文獻 026
第3章 深度學習的結構基礎卷積神經(jīng)網(wǎng)絡 027~040
3.1 卷積神經(jīng)網(wǎng)絡基礎 027
3.1.1 卷積神經(jīng)網(wǎng)絡的發(fā)展 028
3.1.2 卷積神經(jīng)網(wǎng)絡的組成 028
3.2 卷積的基本操作 030
3.2.1 互相關運算 030
3.2.2 特征圖和感受野 031
3.3 卷積操作中的填充和步長 032
3.3.1 填充 032
3.3.2 步長 034
3.4 多通道輸入的卷積與多通道輸出 034
3.4.1 卷積操作 035
3.4.2 多卷積操作 036
3.4.3 多通道輸出 036
3.5 卷積神經(jīng)網(wǎng)絡的池化層和全連接層 037
3.5.1 池化層 037
3.5.2 全連接層 039
3.6 本章小結與練習 040
本章練習 040
參考文獻 040
第4章 搭建深度學習的運行環(huán)境 041~072
4.1 安裝開源軟件包和環(huán)境管理系統(tǒng)Anaconda 041
4.1.1 下載Anaconda 042
4.1.2 安裝Anaconda 045
4.1.3 配置國內(nèi)的下載源 050
4.2 配置Anaconda的環(huán)境變量 052
4.3 創(chuàng)建和刪除虛擬環(huán)境 056
4.3.1 創(chuàng)建虛擬環(huán)境 056
4.3.2 刪除虛擬環(huán)境 061
4.4 安裝和配置PyCharm 063
4.4.1 安裝PyCharm 063
4.4.2 使用PyCharm 065
4.4.3 添加解釋器 069
4.5 本章小結 072
下部深度學習實戰(zhàn)
第5章 基于YOLOv8的黃花菜成熟度視覺檢測 074~096
5.1 數(shù)據(jù)的采集與處理 074
5.1.1 數(shù)據(jù)采集 075
5.1.2 圖像預處理 075
5.1.3 圖像標注 077
5.2 YOLOv8算法簡介 080
5.2.1 YOLO系列算法的發(fā)展歷程 080
5.2.2 YOLOv8算法 081
5.3 基于YOLOv8的黃花菜成熟度檢測實驗 084
5.3.1 搭建實驗環(huán)境 084
5.3.2代碼目錄結構 086
5.4 實驗過程及其結果 088
5.4.1 訓練網(wǎng)絡 088
5.4.2 測試模型 090
5.4.3 分析結果 091
5.5 本章小結與練習 095
本章練習 096
參考文獻 096
第6章 基于YOLOv8的帶鋼表面缺陷視覺檢測 097~112
6.1 對帶鋼表面缺陷檢測的研究 097
6.2 數(shù)據(jù)集的選取及預處理 098
6.2.1 幾類典型的帶鋼表面缺陷 099
6.2.2 帶鋼表面缺陷數(shù)據(jù)集的選取 101
6.2.3 數(shù)據(jù)集標簽的轉(zhuǎn)換與增強 101
6.3 帶鋼表面缺陷檢測模型的訓練 104
6.3.1 模型的訓練過程 104
6.3.2 實驗結果與分析 108
6.4 本章小結與練習 111
本章練習 112
參考文獻 112
第7章 基于YOLOv8的不規(guī)范駕駛行為檢測 113~126
7.1 不規(guī)范駕駛行為檢測的意義和主要研究方法 113
7.2 網(wǎng)絡優(yōu)化與數(shù)據(jù)集 115
7.2.1 對YOLOv8的結構改進 115
7.2.2 數(shù)據(jù)集的選取與處理 119
7.3 實驗過程及其結果 120
7.3.1 模型的修改與訓練 120
7.3.2 不規(guī)范駕駛行為的檢測結果 124
7.4 本章小結與練習 125
本章練習 125
參考文獻 126
第8章 基于深度學習的城市街景語義分割 127~141
8.1 語義分割的概念 127
8.1.1 語義分割的研究 127
8.1.2 語義分割的常用數(shù)據(jù)集 128
8.2 語義分割的常用模型 129
8.2.1 FCN模型 129
8.2.2 U-Net模型 130
8.2.3 SegNet模型 131
8.2.4 DeepLab模型 132
8.2.5 PSPNet模型 132
8.3 城市街景圖像的語義分割 133
8.4 城市街景語義分割模型的訓練與實驗 134
8.4.1 數(shù)據(jù)集和語義分割工具的選取 134
8.4.2 網(wǎng)絡結構及其訓練過程 135
8.4.3 實驗驗證及其結果 138
8.5 本章小結與練習 140
本章練習 140
參考文獻 141
第9章 基于wespeaker的聲紋識別技術 142~160
9.1 聲紋識別技術概述 142
9.1.1 聲紋識別的發(fā)展歷程 143
9.1.2 wespeaker框架的特點與優(yōu)勢 144
9.1.3 VoxCeleb數(shù)據(jù)集概述 145
9.2 基于wespeaker的聲紋識別技術細節(jié) 146
9.2.1 梅爾頻率倒譜系數(shù)(MFCC) 146
9.2.2 濾波器組特征filter bank 148
9.2.3 FBank的代碼實現(xiàn) 149
9.3 構建一個簡單的基于wespeaker的聲紋識別系統(tǒng) 151
9.3.1 聲紋特征模型的訓練 151
9.3.2 基于聲紋特征模型的聲紋對比程序 156
9.3.3 開發(fā)聲紋識別系統(tǒng)的界面 157
9.4 本章小結與練習 159
本章練習 160
第10章 深度學習在新能源發(fā)電預測領域中的應用 161~181
10.1 新能源發(fā)電預測的基礎知識 162
10.1.1 新能源發(fā)電技術及其發(fā)展與挑戰(zhàn) 162
10.1.2 構建基于深度學習的新能源功率預測模型 163
10.2 風力發(fā)電功率預測 168
10.2.1 風力發(fā)電原理 168
10.2.2 構建風力發(fā)電功率預測模型 170
10.3 光伏發(fā)電功率預測 174
10.3.1 光伏發(fā)電原理與影響因素 174
10.3.2 構建光伏發(fā)電功率預測模型 176
10.4 本章小結與練習 179
本章練習 180
參考文獻 181
附錄 書中的常用詞匯中英文對照表 182~183