close
前陣子網民瘋狂使用AI畫圖,人人都變成風格迥異的名畫家。曾幾何時注意力突被論文抄襲的問題吸引,而不禁揣想如果使用AI世界另一個得寵的寶寶GPT-3,是不是能寫出夠水準的論文或者論文摘要。如果真的可行,而GPT-3又可以巧妙地躲過論文警察的探照燈,那麼會不會造成網絡上一群論文寫手失業,就像現在大家擔心畫家是否會失業一樣。
這一切的一切,其實都可回溯自2018年,谷歌無心插柳所創造出的神經網路「變形金剛」(Transformer)。它一下子衍生了好幾個子嗣,有的住在芝麻街,有的變成了獨角獸;有些是畫家,有些則是作家。
我們知道,論文的文章段落結構其實蠻固定,起承轉合的順序也是挺分明的。比起寫小說,GPT-3是絕對更樂意寫論文的。尤其是當它已被Transformer的編碼器預先訓練得滿腹經綸,出口成章,而全世界所有的論文知識庫又盡在囊中的時候。
GPT-3其實就是一個預先訓練好的Transformer解碼器,而這個「解碼」 ,其實就是產生文字(或者繼續掰下去)的意思。它的任務並不是AI傳統的推理(那是他的情敵BERT[見下圖]所擅長的),而是在人類的前導文字或提示(prompt)輸入之後,開始海闊天空地揮灑它能夠想像出的文章段落。這前導文字,其實事先已被編碼成一個神秘的「潛在特徵向量」,它像餅乾一樣被餵給GPT-3,成為寫文章的靈感和源頭,接著「解碼」出一篇洋洋灑灑的論文,或者其他的文字作品。
目前GPT-3的水準,除了上述的論文之外,已經足以寫股市、球賽、天氣預報以及新聞等等一些結構比較確定,邏輯不太複雜的文章。如再輔以它本身所涉獵的知識庫,其實已經足以讓絕大多數的吃瓜群眾歎為觀止。當然他對雙關語的掌握、字裡行間的意在言外,以及典故背後的衍伸,還是相當直白而幼稚的。那些東西的維度可能太高,或者根本不可能用數學方式表達。
至於文學作品,像是詩和小說,那就更為有趣了。 GPT-3可以根據詩人的提示,寫出文字非常優美,音韻對仗令人驚艷,但卻不知所云的古詩或者現代詩。這不能怪它,因為除了飽讀人類所寫的詩之總和外,他唯一知道的就是向量之間的相關係數。
GPT也可以在熟讀金庸小說之後,提示一段「王雨嫣和段譽掉到古井中」,接下來請它自由發揮的故事。令人驚訝的是,他可以把小説別處似乎相關的橋段都搬了進來,表面上似乎合情合理,但是對場景氛圍以及人際關係的掌控明顯不佳,所以死對頭鳩摩智也跌到井裡亂入胡言,而一心復興大燕的慕容復,卻突然出現說些風涼怪話。
或許金庸小說的維度,遠超過GPT-3以數學所能表達的極限。如果未來的GPT能夠讓金庸復活,使我們在「飛雪連天射白鹿,笑書神俠倚碧鴛」之後看到AI寫的第15部夠水準的金庸小說,屆時大家都沒話說,小說家們也祇有改行了。
文章標籤
全站熱搜
留言列表