深度學習框架及系統部署實戰(微課視頻版)
定 價:¥34.9
中 教 價:¥20.94 (6.00折)
庫 存 數: 2
叢 書 名:國家級實驗教學示范中心聯席會計算機學科組規劃教材
在數字化時代,嵌入式人工智能系統和深度學習等技術變得越來越重要。在嵌入式平臺上進行深度學習推理時會受到計算能力、存儲空間、能耗等資源限制的挑戰。本書從深度學習模型在資源受限的硬件平臺上部署的角度,介紹嵌入式AI系統的基本概念、需求、挑戰,以及其軟硬件解決方案。 本書共分為7章。第1章介紹了邊緣計算; 第2章介紹了嵌入式AI系統的基本概念及其面臨的需求與挑戰; 第3章介紹了嵌入式AI系統的硬件解決方案; 第4~6章介紹了嵌入式AI系統的軟件解決方案,包括DNN模型的構建及實現、輕量級DNN模型的構建、模型輕量化方法及實現; 第7章介紹了DNN模型的硬件部署。本書提供了基于Python語言和Torch API的大量代碼解析,并針對Intel系列和NVIDIA系列芯片的硬件部署分別進行介紹。 本書適合作為高等院校計算機專業、軟件工程專業的教材,也可供對深度學習、計算機視覺、嵌入式AI系統等感興趣的開發人員、廣大科技工作者和研究人員參考。
融合智能,釋放未來! 從理論到實踐,理解并掌握高效部署深度學習模型的關鍵策略與技巧。 揭示將人工智能引入現實世界的無限潛力,讓智能變革觸手可及。
全球正在進入數字化新時代,以云計算、大數據、人工智能與物聯網為代表的數字技術已經快速發展。數字化時代的到來使得深度學習和嵌入式人工智能技術變得越來越重要。嵌入式人工智能是指設備可以在不依賴于互聯網且不通過云端數據中心的情況下進行智能計算,利用本地的計算資源來實現深度學習模型的推理。嵌入式人工智能可以完成實時的環境感知、人機交互和決策控制。然而,在嵌入式平臺上進行深度學習推理時,由于算力、能耗、存儲空間等方面的限制,人工智能系統在推理環節會遇到許多挑戰。本書旨在介紹深度學習模型如何在嵌入式平臺上完成部署,包括軟硬件兩個方面。本書介紹的內容有邊緣計算、人工智能計算芯片、常用的深度卷積神經網絡模型、輕量級深度卷積神經網絡、深度學習模型輕量化的方法以及深度學習模型的硬件部署。
本書采用結構性思維,提供多張框圖,使整書脈絡清晰、環環相扣,讀者可以快速把握本書的結構脈絡并關注細節。另外,書中采用大量生動的圖表來說明枯燥的理論,并引用大量的實驗結果比較不同方法之間的性能差異,這些都可以讓一本枯燥的技術書籍更加易于理解。作者從大量的科研論文中尋找相關資料,并將論文中看起來比較枯燥的公式、圖、表變得更有趣、易懂。同時,本書采用簡潔、平實并且有趣的方式來敘述,采用結構圖、原理圖來表達比較復雜的理論或公式。本書可以幫助讀者快速建立起知識體系。
本書提供了可運行的代碼示例,注釋清晰、詳細,配備視頻教程,并附有相關注釋,為讀者打造全方位的學習體驗,使讀者在建立知識體系的同時掌握算法設計、模型壓縮以及模型部署的方法。近年來,作者在承擔40余項與人工智能系統研發相關的科研項目,并成功研制多款計算機視覺產品的過程中,深刻感受到在深度學習模型部署方面可用于系統性學習的相關資料非常有限。作者在查閱大量英文論文、產品說明書、Facebook官網、NVIDIA官網、Intel官網及相關博文等的基礎上,完成了本書的撰寫,希望為人工智能從業人員、初學者,以及希望系統性開始人工智能領域學習的朋友提供幫助。
感謝北京交通大學的同事和學生們的積極參與,感謝你們針對本書理論內容和實踐代碼提出的寶貴建議、意見和測試反饋,讓本書內容更顯精彩。
第1章邊緣計算
1.1云計算與邊緣計算
1.2邊緣計算的挑戰
1.2.1DNN模型設計
1.2.2DNN模型輕量化
1.2.3硬件優化部署
1.3云邊端任務協作
1.4本章小結
1.5習題
第2章嵌入式AI系統
2.1嵌入式AI系統的概念
2.2嵌入式AI系統的硬件結構
2.3嵌入式AI系統的軟件結構
2.3.1驅動層
2.3.2操作系統層
2.3.3中間件層
2.3.4應用層
2.4嵌入式深度學習技術
2.5嵌入式AI系統的應用
2.5.1車載輔助駕駛系統
2.5.2無人機智能巡檢系統
2.5.3VR設備
2.6嵌入式AI系統的需求與挑戰
2.7本章小結
2.8習題
深度學習框架及系統部署實戰(微課視頻版)目錄
第3章嵌入式AI系統的硬件解決方案
3.1通用類芯片GPU
3.2半定制化芯片FPGA
3.3全定制化芯片ASIC
3.4類腦芯片
3.5對四大類型AI芯片的總結與展望
3.5.1對AI芯片的總結
3.5.2對AI芯片的展望
3.6本章小結
3.7習題
第4章深度卷積神經網絡(DCNN)模型的構建及實現
4.1神經網絡的概念及發展歷史
4.1.1神經元的結構
4.1.2感知機
4.1.3BP算法
4.1.4神經網絡的發展歷史
4.2深度卷積神經網絡(DCNN)
4.2.1深度學習的概念
4.2.2DCNN的概念
4.2.3DCNN的構成
4.2.4DCNN的訓練
4.3幾種常用的DNN模型結構
4.3.1AlexNet
4.3.2VGG
4.3.3GoogLeNet
4.3.4ResNet
4.3.5網絡模型對比
4.3.6遷移學習
4.4圖像識別項目實戰
4.5本章小結
4.6習題
第5章輕量級DCNN模型
5.1MobileNet系列
5.1.1MobileNet V1
5.1.2MobileNet V2
5.1.3MobileNet V3
5.2ShuffleNet系列
5.2.1ShuffleNet V1
5.2.2ShuffleNet V2
5.3輕量級DCNN模型對比
5.4項目實戰
5.4.1MobileNet V3模型構建
5.4.2ShuffleNet V2模型構建
5.5本章小結
5.6習題
第6章深度學習模型輕量化方法及實現
6.1網絡模型剪枝
6.1.1基本原理
6.1.2網絡模型的剪枝分類
6.1.3剪枝標準
6.1.4剪枝流程
6.1.5代碼實現
6.2參數量化
6.2.1基本原理
6.2.2參數量化算法的分類
6.2.3參數量化流程
6.2.4代碼實現
6.3知識蒸餾法
6.3.1基本原理
6.3.2知識蒸餾算法流程
6.3.3代碼實現
6.4本章小結
6.5習題
第7章AI模型的硬件部署
7.1開放神經網絡交換(ONNX)格式
7.1.1ONNX模型
7.1.2Torch模型轉ONNX模型實例
7.1.3ONNX 工作原理
7.1.4ONNX模型推理
7.1.5推理速度對比
7.2Intel系列芯片部署方法
7.2.1OpenVINO的簡介
7.2.2OpenVINO的安裝
7.2.3OpenVINO工作流程
7.2.4OpenVINO推理示例
7.3NVIDIA系列芯片部署方法
7.3.1TensorRT的簡介
7.3.2TensorRT的安裝
7.3.3TensorRT模型轉換
7.3.4部署TensorRT模型
7.4本章小結
7.5習題