本書是一部揭示ChatGPT與AIGC的背后真相及未來發(fā)展趨勢的重要著作。首先,本書全景式展現(xiàn)了ChatGPT背后的創(chuàng)造者群像,揭示了創(chuàng)新、創(chuàng)造和創(chuàng)業(yè)的成功之路。其次,本書系統(tǒng)回顧了AIGC發(fā)展過程中的重要里程碑,從早期的神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)技術(shù),再到大語言模型的突破,全面展示了這一領(lǐng)域的進展和創(chuàng)新。再次,本書聚焦剖析了ChatGPT的技術(shù)淵源、技術(shù)架構(gòu)、進化之路、商業(yè)模式及未來發(fā)展趨勢。從次,本書將關(guān)于ChatGPT的討論擴大到AIGC領(lǐng)域,深刻分析了AIGC的生產(chǎn)力革命內(nèi)涵。然后,本書深入探討了ChatGPT及AIGC對搜索引擎、人類知識體系、行業(yè)數(shù)字化轉(zhuǎn)型的影響,引導(dǎo)讀者深入思考技術(shù)變革與社會發(fā)展的相互影響。最后,本書全面分析了ChatGPT與AIGC的快速發(fā)展給中國帶來的機遇。
無論您是人工智能領(lǐng)域的科技工作者,還是其他領(lǐng)域的普通讀者,本書都致力于為您提供洞察ChatGPT及AIGC的全新視角,幫助您理解現(xiàn)象背后的基本原理,洞悉產(chǎn)業(yè)發(fā)展?jié)摿,抓住?chuàng)新、創(chuàng)造和創(chuàng)業(yè)的機遇。
我的前一本書《元宇宙大革命》剛剛出版,ChatGPT浪潮掀起,人們驚奇于它的能力,陷于揭示其奧秘的狂熱中。大家急迫地想知道ChatGPT來自何方,本質(zhì)是什么,能干什么,對未來有何影響。我剛放下那本書,就匆匆投入這本書的寫作中,希望能夠給大家詳盡解讀ChatGPT,為大家答疑解惑。
人工智能走到今天,經(jīng)歷了快70年,已經(jīng)是一個充滿智慧的老者,所以出現(xiàn)ChatGPT這樣的產(chǎn)品毫不奇怪。ChatGPT的出現(xiàn)既有其偶然性,是OpenAI公司的創(chuàng)業(yè)者們堅信大力出奇跡的結(jié)果;也有其必然性,是過去近70年人類在人工智能領(lǐng)域所有探索成果的集大成者。這種集大成不是全盤接受,而是一種揚棄的選擇。比如,選擇Transformer模型作為內(nèi)核,選擇非監(jiān)督預(yù)訓(xùn)練加微調(diào)作為訓(xùn)練方法,選擇RLHF(基于人類反饋的強化學(xué)習(xí))技術(shù)作為價值觀對齊的保障。ChatGPT雖然以自然語言處理為切入點,但由于人類世界的絕大多數(shù)知識都是以語言、文字的形式進行記載和流傳的,所以事實上ChatGPT以語言理解為基礎(chǔ)構(gòu)建了一個能夠理解人類世界的模型;谶@個能夠理解人類世界的模型,ChatGPT才具有了強大的多模態(tài)內(nèi)容生成能力和交流對話能力。
ChatGPT只是生成式AI(人工智能)中的一個模型,大量的生成式AI工具正在驅(qū)動AIGC(人工智能生成內(nèi)容)產(chǎn)業(yè)的發(fā)展。與生成式AI模型強調(diào)技術(shù)不同,AIGC實質(zhì)上描述的是人類的一種全新生產(chǎn)活動、方式的過程和結(jié)果。AIGC已經(jīng)成為龐大的體系,包括文本生成、圖像生成、視頻生成、音樂生成、代碼生成等眾多細分領(lǐng)域,每個細分領(lǐng)域又存在很多競爭性的產(chǎn)品。這些產(chǎn)品又與各種各樣的行業(yè)應(yīng)用融合、彼此滲透,最終掀起一場強大的生產(chǎn)力革命。
圍繞ChatGPT及其他生成式AI技術(shù)的還有一系列謎團,比如:其涌現(xiàn)能力從何而來?它們會讓搜索引擎退出歷史舞臺嗎?它們會不會污染人類的知識體系?本書認為,大語言模型的涌現(xiàn)能力不能僅從技術(shù)層面來解釋,而應(yīng)從復(fù)雜性科學(xué)、復(fù)雜經(jīng)濟學(xué)等領(lǐng)域獲得更加系統(tǒng)的解釋。關(guān)于ChatGPT和搜索引擎,本書認為二者具有各自的特點和優(yōu)勢,短期內(nèi)可能成為互為補充的力量,長期來看,二者可能深度融合,傳統(tǒng)的搜索引擎或許會消失。關(guān)于知識污染,本書認為ChatGPT類的工具會導(dǎo)致新一輪的知識爆炸,人類已有的知識體系難免會受到污染,活躍在歷史舞臺中央的知識分子階層可能會變得無用。這種無用不是指專業(yè)研究領(lǐng)域的無用,而是作為公共性知識分子的無用。
以ChatGPT為代表的AIGC正在與此前的元宇宙浪潮合流,共同驅(qū)動行業(yè)的數(shù)字化轉(zhuǎn)型。元宇宙強調(diào)新世界的構(gòu)建和新規(guī)則的設(shè)計,而AIGC則強調(diào)內(nèi)容的生成與應(yīng)用。元宇宙是人類將要生活在其中的未來世界,因此它能夠給予AIGC非常廣闊的舞臺。未來,AIGC將無處不在,并成為元宇宙的靈魂,讓這個將要建成的新世界變得靈動且多彩起來。元宇宙和AIGC將形成強大的雙重驅(qū)動力,使教育、工業(yè)、傳媒、文旅、醫(yī)學(xué)等行業(yè)進一步加快數(shù)字化轉(zhuǎn)型,最終呈現(xiàn)出與以往完全不同的變化。
本書認為,以ChatGPT為代表的AIGC相關(guān)技術(shù)不會成為新的卡脖子技術(shù),而會帶來全新的機遇。中國數(shù)字產(chǎn)業(yè)界已經(jīng)積極行動起來,發(fā)布了一系列新模型、新產(chǎn)品,相信很快就能夠趕上來,并超越國外。
在本書中,我獨立撰寫了第一章、第二章、第五章~第十章;與ChatGPT技術(shù)解讀聯(lián)系非常緊密的第三章和第四章,特別邀請人工智能專家、北京中科匯聯(lián)科技股份有限公司董事長游世學(xué)先生參與共同撰寫,以確保相關(guān)技術(shù)解讀更加準確,并且有較高的認知高度。非常感謝游世學(xué)先生的參與!由于本書總體撰寫時間很短,行文倉促,書中難免存在一些疏漏之處,歡迎讀者批評指正!
目錄
第一章 盜火者還是玩火者? 1
1.創(chuàng)造者群像 2
埃隆·馬斯克 3
山姆·阿爾特曼 6
格雷格·布洛克曼 9
伊利亞·蘇茨克維爾 11
約翰·舒爾曼 12
沃伊切赫·扎倫巴 14
2.退學(xué)創(chuàng)業(yè)成功之路? 15
反復(fù)重演的故事 15
走適合自己的路 17
3.OpenAI養(yǎng)成記 19
信仰和使命 20
初創(chuàng)期 24
利潤上限公司 26
轟動世界 27
人民公敵? 31
4.風(fēng)暴有多強 33
5.英雄創(chuàng)造時代 36
第二章 深度學(xué)習(xí)崛起 38
1.人工智能夢想之路 38
符號主義開局(19561967年) 39
專家系統(tǒng)繁榮一時(19681985年) 41
神經(jīng)網(wǎng)絡(luò)的復(fù)興(19862005年) 43
深度學(xué)習(xí)的勝利(20062021年) 46
走向通用人工智能(20222038年) 49
2.深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支 50
監(jiān)督學(xué)習(xí) 51
無監(jiān)督學(xué)習(xí) 51
半監(jiān)督學(xué)習(xí) 51
強化學(xué)習(xí) 52
遷移學(xué)習(xí) 53
深度學(xué)習(xí) 54
3.感知機如何進化為深度學(xué)習(xí) 54
神經(jīng)元與感知機 54
前饋神經(jīng)網(wǎng)絡(luò) 56
反饋神經(jīng)網(wǎng)絡(luò) 59
反向傳播算法 60
卷積神經(jīng)網(wǎng)絡(luò) 62
循環(huán)神經(jīng)網(wǎng)絡(luò) 64
4.一些重要的深度學(xué)習(xí)算法模型 67
深度信念網(wǎng)絡(luò) 68
生成對抗網(wǎng)絡(luò) 70
深度強化學(xué)習(xí) 71
5.阿爾法狗的價值及其進化 73
阿爾法狗橫空出世 74
向自主學(xué)習(xí)進化 75
6.籠罩在深度學(xué)習(xí)頭上的烏云 77
第三章 大語言模型 79
1.大語言模型自然語言處理的前沿 80
什么是自然語言處理 80
自然語言處理的發(fā)展歷程 81
大語言模型超越自然語言處理 85
2.算力爆炸 86
不同類型的算力 87
全球算力爆炸 87
大語言模型與算力爆炸 88
3.海量數(shù)據(jù) 89
大語言模型需要海量數(shù)據(jù) 89
數(shù)據(jù)收集與預(yù)處理 90
數(shù)據(jù)隱私、數(shù)據(jù)安全和數(shù)據(jù)偏差 92
4.典型大語言模型 92
LLaMA 93
PaLM2 95
LaMDA 96
Claude 96
Chinchilla 97
Gopher 97
BLOOM 98
5.大語言模型戰(zhàn)勝了小語言模型? 98
6.大語言模型的弊端 101
第四章 為什么是ChatGPT 103
1.關(guān)鍵里程碑Transformer 103
總體架構(gòu) 104
注意力機制 105
位置編碼 108
前饋網(wǎng)絡(luò) 109
殘差連接與層歸一化 109
2.GPT系列的持續(xù)進化 110
GPT-1 110
GPT-2 112
GPT-3 112
InstructGPT 114
ChatGPT 115
GPT-4 117
3.ChatGPT商業(yè)化的五種模式 119
與微軟的深度捆綁 120
API 121
訂閱模式 121
模型多元化 121
應(yīng)用商店 122
4.通用人工智能的早期版本? 123
5.未來前進的方向 125
第五章 機器生成內(nèi)容AIGC 128
1.生成式AI與AIGC 129
生成式AI 129
全面理解AIGC 133
2.沒有什么不能生成 135
文本生成 135
圖像生成 140
視頻生成 143
音樂生成 145
代碼生成 147
3.AIGC的實質(zhì)是生產(chǎn)力革命 150
生產(chǎn)力革命 151
人人都是創(chuàng)造者 153
第六章 生成性與涌現(xiàn) 155
1.復(fù)雜經(jīng)濟學(xué) 156
復(fù)雜性科學(xué) 156
復(fù)雜經(jīng)濟學(xué)的基本觀點 157
經(jīng)濟活動中的涌現(xiàn) 158
2.平臺生態(tài) 158
平臺生態(tài)是什么 158
平臺生態(tài)中的生成性 159
平臺生態(tài)中的涌現(xiàn) 160
3.生成性 161
4.知識涌現(xiàn) 162
5.涌現(xiàn)能力的臨界值 164
第七章 搜索引擎的黃昏 166
1.信息爆炸的逆轉(zhuǎn) 167
為何重要 167
如何工作 169
2.美好時光 171
3.巨人間的平庸競爭 174
4.危機確實迫在眉睫 175
5.替代還是升級? 177
第八章 知識的危機 179
1.什么是知識 180
2.顯性知識與隱性知識 185
3.人類的知識是如何進步的 188
4.知識爆炸 190
5.污染還是凈化? 192
6.無用的知識分子? 194
第九章 元宇宙和AIGC雙重驅(qū)動數(shù)字化轉(zhuǎn)型 198
1.元宇宙空間革命與規(guī)則重構(gòu) 199
2.無處不在的AIGC與效率革命 202
3.雙重驅(qū)動的行業(yè)變革 204
教育 204
工業(yè) 208
傳媒 212
文旅 217
醫(yī)學(xué) 219
第十章 挑戰(zhàn)與中國機遇 224
1.新的卡脖子? 225
2.中國的機遇 226
3.中國數(shù)字產(chǎn)業(yè)界的集體行動 228
4.低端版本還是超越? 231
參考文獻 233