作者知名:軒轅大模型負責人:真正的大語言模型實踐者,擁有十億、百億、千億等不同參數規模大語言模型的訓練經驗
系統性強:從數據處理的基礎工作(如數據清洗與去重)講起,逐步深入,探討預訓練、微調技術和強化對齊技術等核心技術環節。同時,書中對大語言模型評估策略及其應用技術架構,包括推理引導技術和動態交互技術,進行了全面且深入的探討,確保讀者能夠從理論和技術角度全面理解大語言模型。
實踐性強:精心設計了從零開始的教學章節,提供大語言模型微調的詳細指導,逐步引領讀者掌握關鍵技能。
本書不僅有助于初學者迅速上手,也為有經驗的開發者提供了深入學習的機會
全彩印刷
緣起:為什么要寫這本書
OpenAI的ChatGPT自推出以來,迅速成為人工智能領域的焦點。ChatGPT在語言理解、生成、規劃及記憶等多個維度展示了強大的能力。這不僅體現在對特定任務的高效處理上,更重要的是,它在處理多樣化任務和復雜場景中的靈活性顯著,甚至能在一定程度上模擬人類的思考方式。這種能力的展現,標志著人工智能從專注于單一任務的傳統模型向通用人工智能轉變,其強大的能力將對千行百業產生深遠影響,尤其在優化業務流程和重塑組織結構方面。
然而,在研究和實踐過程中,我們遇到了一個主要挑戰:市場上缺乏大語言模型在實際應用方面的資料。現有的資料多聚焦于理論研究,而具體的實踐方法多被保密,難以獲得實際操作的指導。為了填補這一空白,我們歷經一年的實踐和探索,決定分享我們的經驗和成果,旨在為大語言模型的初學者和實踐者提供快速入門和應用的途徑。
為應對技術的快速演進和信息的日新月異,我們建立了一個GitHub社區,用于持續更新我們的技術成果和見解。我們期望通過這種方式,促進讀者對大語言模型的深入理解和廣泛應用,推動整個領域的持續發展和創新。
本書特色
本書旨在揭開大語言模型的神秘面紗,透徹地解讀其內在機理和應用實踐。書中不僅介紹理論知識,更介紹了深入這一技術領域的具體訓練過程,目的是為讀者提供一個全面、深入且系統化的視角,以揭示大語言模型的精妙之處。
本書的一大特色體現在其知識體系的系統性。我們從數據處理的基礎工作(如數據清洗與去重)講起,逐步深入,探討預訓練、微調技術和強化對齊技術等核心技術環節。同時,書中對大語言模型評估策略及其應用技術架構,包括推理引導技術和動態交互技術,進行了全面且深入的探討,確保讀者能夠從理論和技術角度全面理解大語言模型。
本書的另一大特色是對實踐性的重視。我們精心設計了從零開始的教學章節,提供大語言模型微調的詳細指導,逐步引領讀者掌握關鍵技能。這不僅有助于初學者迅速上手,也為有經驗的開發者提供了深入學習的機會。
作為真正的大語言模型實踐者,我們擁有十億、百億、千億等不同參數規模大語言模型的訓練經驗。在本書中,這些經驗都被毫無保留地融入其中,確保本書內容的實用性和深度。
本書是理論與實踐經驗的精華,干貨滿滿,絕非空談。
本書結構
本書共10章,下面是各章的主要內容概述。
第1章:解鎖大語言模型
本章勾勒大語言模型的全貌,并介紹大語言模型的基礎概念。
第2章:大語言模型基礎技術
本章旨在深度解析構成大語言模型的基礎知識和核心技術。先回顧自然語言的基礎表示方法,為理解復雜模型奠定基礎;再詳盡地探討自然語言處理中的預訓練架構Transformer,以揭示其內在工作機制;接著介紹如BERT和GPT這樣的標桿性預訓練模型;最后以InstructGPT和LLaMA系列為例,為讀者呈現大語言模型的初步實用成果。
第3章:預訓練數據構建
本章將深入探討預訓練數據的常見類別、來源和預處理方式,以及構建訓練數據的重點和難點。
第4章:大語言模型預訓練
本章將深入探討大語言模型預訓練的各個方面。首先解析不同的大語言模型架構和不同模塊的選擇;同時對大語言模型的訓練過程進行介紹,包括數據選擇和配比策略、模型訓練等。
第5章:挖掘大語言模型潛能:有監督微調
本章將從定義、用途和應用場景3個方面解釋有監督微調;同時講解如何構建有針對性的微調數據,以及大語言模型微調的各種技巧。
第6章:大語言模型強化對齊
本章先介紹強化學習的基礎知識、兩類主流深度強化學習算法,重點介紹大語言模型中基于人類反饋的強化學習(RLHF)技術,然后介紹強化學習常用的訓練框架和平臺,以及RLHF實踐過程中的常見問題;最后介紹RLHF中的難點及目前存在的問題,對RLHF將來可能的技術發展做進一步展望。
第7章:大語言模型的評測
本章首先介紹大語言模型的評測,如基座模型的評測方式等。然后重點講解微調之后具有對話能力的模型的評測方式,包括SFT階段全維度的對話能力評測和 RLHF 階段模型以安全性為主的能力評測。最后探討如何評價一個通用人工智能。
第8章:大語言模型的應用
本章將展示提示詞技術對大語言模型的引導能力。首先從最簡單的零樣本提示開始介紹,這些技術使大語言模型擁有逐步推理的能力。然后介紹搜索增強生成技術、推理和行動協同技術,利用這兩個技術,大語言模型可以獲得在與環境的交互中逐步分解并解決問題的能力。
第9章:工程實踐
本章將深入探討大語言模型從訓練到完成任務的各個環節所涉及的工程優化技術和相關實踐案例。這些技術和實踐旨在提高模型的效率、性能和可擴展性,從而滿足實際應用中的需求。
第10章:手把手教你訓練7B大語言模型
本章將介紹微調大語言模型的關鍵步驟和代碼示例,以便更直接地應用這些技術。
通過閱讀本書,讀者可以獲得全面且深入的大型語言模型的知識框架。無論您是研究人員、工程師,還是產品經理,都能從中獲得有價值的知識。大語言模型已經在各個領域展現出了巨大的潛力,本書將幫您更好地掌握和應用這一技術。
說明
本書包含與大語言模型的對話示例。為了真實地展示大語言模型的對話能力,對話內容中難免會出現用詞不規范、語句不通順甚至錯誤的情況。在此,懇請各位讀者包涵。
致謝
在本書的創作旅程中,感激所有給予我們支持的人。感謝我的團隊成員,他們對技術的信仰和對卓越的追求為本書注入了靈魂;感謝行業內的所有貢獻者,他們的研究和實踐成果為我們提供了寶貴的參考和靈感;感謝電子工業出版社鄭柳潔編輯和整個出版團隊,他們的專業技能和對細節的關注,確保了這本書能夠完美地呈現給廣大讀者。感謝所有直接或間接參與本書創作的人,是你們讓這一切成為可能。
楊青
度小滿金融技術委員會執行主席、數據智能應用部總經理,度小滿AI Lab負責人,碩士畢業于清華大學計算機系,曾就職于百度、阿里巴巴,從事自然語言處理、搜索、推薦、大數據架構等相關方向的研發工作。
2018年年初加入度小滿金融,組建數據智能部和AI Lab團隊,從0到1構建度小滿金融的智能引擎核心算法,深耕計算機視覺、自然語言處理、圖模型、機器學習、因果推斷等技術領域,多篇文章被EMNLP、ACL、CIKM等國際會議收錄,智能化征信解讀中臺工程榮獲吳文俊人工智能科技進步獎。相關技術廣泛應用于度小滿營銷、經營、風控、反欺詐全流程業務場景,為上千萬客戶提供穩定、安全的金融服務。
目前,專注于AIGC相關研究及產品落地工作,基于度小滿模型即服務(MaaS)的模式積極探索文生圖、數字人與生成式大語言模型的應用轉化。于2023年年初帶領團隊發布千億參數規模的中文大語言模型軒轅。2023年9月, 軒轅-70B大語言模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。