本書是一部揭示ChatGPT與AIGC的背后真相及未來發(fā)展趨勢的重要著作。首先,本書全景式展現(xiàn)了ChatGPT背后的創(chuàng)造者群像,揭示了創(chuàng)新、創(chuàng)造和創(chuàng)業(yè)的成功之路。其次,本書系統(tǒng)回顧了AIGC發(fā)展過程中的重要里程碑,從早期的神經(jīng)網(wǎng)絡到深度學習技術,再到大語言模型的突破,全面展示了這一領域的進展和創(chuàng)新。再次,本書聚焦剖析了ChatGPT的技術淵源、技術架構、進化之路、商業(yè)模式及未來發(fā)展趨勢。從次,本書將關于ChatGPT的討論擴大到AIGC領域,深刻分析了AIGC的生產力革命內涵。然后,本書深入探討了ChatGPT及AIGC對搜索引擎、人類知識體系、行業(yè)數(shù)字化轉型的影響,引導讀者深入思考技術變革與社會發(fā)展的相互影響。最后,本書全面分析了ChatGPT與AIGC的快速發(fā)展給中國帶來的機遇。
無論您是人工智能領域的科技工作者,還是其他領域的普通讀者,本書都致力于為您提供洞察ChatGPT及AIGC的全新視角,幫助您理解現(xiàn)象背后的基本原理,洞悉產業(yè)發(fā)展?jié)摿Γプ?chuàng)新、創(chuàng)造和創(chuàng)業(yè)的機遇。
我的前一本書《元宇宙大革命》剛剛出版,ChatGPT浪潮掀起,人們驚奇于它的能力,陷于揭示其奧秘的狂熱中。大家急迫地想知道ChatGPT來自何方,本質是什么,能干什么,對未來有何影響。我剛放下那本書,就匆匆投入這本書的寫作中,希望能夠給大家詳盡解讀ChatGPT,為大家答疑解惑。
人工智能走到今天,經(jīng)歷了快70年,已經(jīng)是一個充滿智慧的老者,所以出現(xiàn)ChatGPT這樣的產品毫不奇怪。ChatGPT的出現(xiàn)既有其偶然性,是OpenAI公司的創(chuàng)業(yè)者們堅信大力出奇跡的結果;也有其必然性,是過去近70年人類在人工智能領域所有探索成果的集大成者。這種集大成不是全盤接受,而是一種揚棄的選擇。比如,選擇Transformer模型作為內核,選擇非監(jiān)督預訓練加微調作為訓練方法,選擇RLHF(基于人類反饋的強化學習)技術作為價值觀對齊的保障。ChatGPT雖然以自然語言處理為切入點,但由于人類世界的絕大多數(shù)知識都是以語言、文字的形式進行記載和流傳的,所以事實上ChatGPT以語言理解為基礎構建了一個能夠理解人類世界的模型。基于這個能夠理解人類世界的模型,ChatGPT才具有了強大的多模態(tài)內容生成能力和交流對話能力。
ChatGPT只是生成式AI(人工智能)中的一個模型,大量的生成式AI工具正在驅動AIGC(人工智能生成內容)產業(yè)的發(fā)展。與生成式AI模型強調技術不同,AIGC實質上描述的是人類的一種全新生產活動、方式的過程和結果。AIGC已經(jīng)成為龐大的體系,包括文本生成、圖像生成、視頻生成、音樂生成、代碼生成等眾多細分領域,每個細分領域又存在很多競爭性的產品。這些產品又與各種各樣的行業(yè)應用融合、彼此滲透,最終掀起一場強大的生產力革命。
圍繞ChatGPT及其他生成式AI技術的還有一系列謎團,比如:其涌現(xiàn)能力從何而來?它們會讓搜索引擎退出歷史舞臺嗎?它們會不會污染人類的知識體系?本書認為,大語言模型的涌現(xiàn)能力不能僅從技術層面來解釋,而應從復雜性科學、復雜經(jīng)濟學等領域獲得更加系統(tǒng)的解釋。關于ChatGPT和搜索引擎,本書認為二者具有各自的特點和優(yōu)勢,短期內可能成為互為補充的力量,長期來看,二者可能深度融合,傳統(tǒng)的搜索引擎或許會消失。關于知識污染,本書認為ChatGPT類的工具會導致新一輪的知識爆炸,人類已有的知識體系難免會受到污染,活躍在歷史舞臺中央的知識分子階層可能會變得無用。這種無用不是指專業(yè)研究領域的無用,而是作為公共性知識分子的無用。
以ChatGPT為代表的AIGC正在與此前的元宇宙浪潮合流,共同驅動行業(yè)的數(shù)字化轉型。元宇宙強調新世界的構建和新規(guī)則的設計,而AIGC則強調內容的生成與應用。元宇宙是人類將要生活在其中的未來世界,因此它能夠給予AIGC非常廣闊的舞臺。未來,AIGC將無處不在,并成為元宇宙的靈魂,讓這個將要建成的新世界變得靈動且多彩起來。元宇宙和AIGC將形成強大的雙重驅動力,使教育、工業(yè)、傳媒、文旅、醫(yī)學等行業(yè)進一步加快數(shù)字化轉型,最終呈現(xiàn)出與以往完全不同的變化。
本書認為,以ChatGPT為代表的AIGC相關技術不會成為新的卡脖子技術,而會帶來全新的機遇。中國數(shù)字產業(yè)界已經(jīng)積極行動起來,發(fā)布了一系列新模型、新產品,相信很快就能夠趕上來,并超越國外。
在本書中,我獨立撰寫了第一章、第二章、第五章~第十章;與ChatGPT技術解讀聯(lián)系非常緊密的第三章和第四章,特別邀請人工智能專家、北京中科匯聯(lián)科技股份有限公司董事長游世學先生參與共同撰寫,以確保相關技術解讀更加準確,并且有較高的認知高度。非常感謝游世學先生的參與!由于本書總體撰寫時間很短,行文倉促,書中難免存在一些疏漏之處,歡迎讀者批評指正!
目錄
第一章 盜火者還是玩火者? 1
1.創(chuàng)造者群像 2
埃隆·馬斯克 3
山姆·阿爾特曼 6
格雷格·布洛克曼 9
伊利亞·蘇茨克維爾 11
約翰·舒爾曼 12
沃伊切赫·扎倫巴 14
2.退學創(chuàng)業(yè)成功之路? 15
反復重演的故事 15
走適合自己的路 17
3.OpenAI養(yǎng)成記 19
信仰和使命 20
初創(chuàng)期 24
利潤上限公司 26
轟動世界 27
人民公敵? 31
4.風暴有多強 33
5.英雄創(chuàng)造時代 36
第二章 深度學習崛起 38
1.人工智能夢想之路 38
符號主義開局(19561967年) 39
專家系統(tǒng)繁榮一時(19681985年) 41
神經(jīng)網(wǎng)絡的復興(19862005年) 43
深度學習的勝利(20062021年) 46
走向通用人工智能(20222038年) 49
2.深度學習是機器學習的一個分支 50
監(jiān)督學習 51
無監(jiān)督學習 51
半監(jiān)督學習 51
強化學習 52
遷移學習 53
深度學習 54
3.感知機如何進化為深度學習 54
神經(jīng)元與感知機 54
前饋神經(jīng)網(wǎng)絡 56
反饋神經(jīng)網(wǎng)絡 59
反向傳播算法 60
卷積神經(jīng)網(wǎng)絡 62
循環(huán)神經(jīng)網(wǎng)絡 64
4.一些重要的深度學習算法模型 67
深度信念網(wǎng)絡 68
生成對抗網(wǎng)絡 70
深度強化學習 71
5.阿爾法狗的價值及其進化 73
阿爾法狗橫空出世 74
向自主學習進化 75
6.籠罩在深度學習頭上的烏云 77
第三章 大語言模型 79
1.大語言模型自然語言處理的前沿 80
什么是自然語言處理 80
自然語言處理的發(fā)展歷程 81
大語言模型超越自然語言處理 85
2.算力爆炸 86
不同類型的算力 87
全球算力爆炸 87
大語言模型與算力爆炸 88
3.海量數(shù)據(jù) 89
大語言模型需要海量數(shù)據(jù) 89
數(shù)據(jù)收集與預處理 90
數(shù)據(jù)隱私、數(shù)據(jù)安全和數(shù)據(jù)偏差 92
4.典型大語言模型 92
LLaMA 93
PaLM2 95
LaMDA 96
Claude 96
Chinchilla 97
Gopher 97
BLOOM 98
5.大語言模型戰(zhàn)勝了小語言模型? 98
6.大語言模型的弊端 101
第四章 為什么是ChatGPT 103
1.關鍵里程碑Transformer 103
總體架構 104
注意力機制 105
位置編碼 108
前饋網(wǎng)絡 109
殘差連接與層歸一化 109
2.GPT系列的持續(xù)進化 110
GPT-1 110
GPT-2 112
GPT-3 112
InstructGPT 114
ChatGPT 115
GPT-4 117
3.ChatGPT商業(yè)化的五種模式 119
與微軟的深度捆綁 120
API 121
訂閱模式 121
模型多元化 121
應用商店 122
4.通用人工智能的早期版本? 123
5.未來前進的方向 125
第五章 機器生成內容AIGC 128
1.生成式AI與AIGC 129
生成式AI 129
全面理解AIGC 133
2.沒有什么不能生成 135
文本生成 135
圖像生成 140
視頻生成 143
音樂生成 145
代碼生成 147
3.AIGC的實質是生產力革命 150
生產力革命 151
人人都是創(chuàng)造者 153
第六章 生成性與涌現(xiàn) 155
1.復雜經(jīng)濟學 156
復雜性科學 156
復雜經(jīng)濟學的基本觀點 157
經(jīng)濟活動中的涌現(xiàn) 158
2.平臺生態(tài) 158
平臺生態(tài)是什么 158
平臺生態(tài)中的生成性 159
平臺生態(tài)中的涌現(xiàn) 160
3.生成性 161
4.知識涌現(xiàn) 162
5.涌現(xiàn)能力的臨界值 164
第七章 搜索引擎的黃昏 166
1.信息爆炸的逆轉 167
為何重要 167
如何工作 169
2.美好時光 171
3.巨人間的平庸競爭 174
4.危機確實迫在眉睫 175
5.替代還是升級? 177
第八章 知識的危機 179
1.什么是知識 180
2.顯性知識與隱性知識 185
3.人類的知識是如何進步的 188
4.知識爆炸 190
5.污染還是凈化? 192
6.無用的知識分子? 194
第九章 元宇宙和AIGC雙重驅動數(shù)字化轉型 198
1.元宇宙空間革命與規(guī)則重構 199
2.無處不在的AIGC與效率革命 202
3.雙重驅動的行業(yè)變革 204
教育 204
工業(yè) 208
傳媒 212
文旅 217
醫(yī)學 219
第十章 挑戰(zhàn)與中國機遇 224
1.新的卡脖子? 225
2.中國的機遇 226
3.中國數(shù)字產業(yè)界的集體行動 228
4.低端版本還是超越? 231
參考文獻 233