国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

網絡消費網 >  科技 > > 正文
【天天時快訊】60行代碼就能構建GPT!網友:比之前的教程都要清晰
時間:2023-02-19 13:08:10

Pine 發自 凹非寺

量子位 | 公眾號 QbitAI

現在只用60行代碼,就能從0構建GPT了!


(資料圖片僅供參考)

想當初,前特斯拉前AI總監的minGPT和nanoGPT也都還要300行代碼。

這個60行代碼的GPT也有名字,博主將它命名為PicoGPT

不過和此前minGPT和nanoGPT的教程不同,今天要講的這個博主的教程,更側重于代碼實現部分,模型的權重則用已經訓練好的。

對此,博主解釋稱這篇教程的重點在于提供一個簡單且易于破解的完整技術介紹

這對還不理解GPT背后概念的盆友,算是非常友好了。

還有網友稱贊,這篇博客介紹得非常清晰,第一部分尤為如此。

這篇介紹GPT模型的文章太好了,它比我之前看到的介紹都要清晰,至少在第一部分討論文本生成和取樣是這樣的。

目前,此項目在GitHub上標星已破百,HackerNews上的點擊量也即將破千。

從GPT是什么講起

在介紹之前,還是需要說明一下,這篇教程不是完全零門檻,需要讀者提前熟悉Python、NumPy以及一些基本的訓練神經網絡。

教程的重點聚焦在技術介紹上,統共有六大部分:

什么是GPT?

按照慣例,在正式構建GPT之前得先對它做一些基本介紹,教程從輸入/輸出、生成文本以及訓練三個部分分別來講GPT是如何工作的。

在這趴,博主附上代碼,甚至還用了一些比喻來讓讀者們更好地理解GPT。

舉個栗子

,在輸入這一部分,作者將句子比作一條繩子,tokenizer則會將其分割成一小段一小段(單詞),被稱作token。

又比如說,在生成文本這part介紹自動回歸時,博主直接貼上代碼:

def generate(inputs, n_tokens_to_generate):

for _ in range(n_tokens_to_generate): # auto-regressive decode loop

output = gpt(inputs) # model forward pass

next_id = np.argmax(output[-1]) # greedy sampling

inputs = np.append(out, [next_id]) # append prediction to input

return list(inputs[len(inputs) - n_tokens_to_generate :]) # only return generated ids

input_ids = [1, 0] # "not" "all"

output_ids = generate(input_ids, 3) # output_ids = [2, 4, 6]

output_tokens = [vocab[i] for i in output_ids] # "heroes" "wear" "capes"

在每次迭代中,它會將預測的token追加回輸入,這個預測未來值并將其添加回輸入的過程就是GPT被描述為自動回歸的原因。

60行代碼怎么運行?

了解完GPT的基本概念之后,就直接快進到了如何在電腦上運行這個PicoGPT。

博主先是甩出了他那只有60行的代碼:

import numpy as np

def gpt2(inputs, wte, wpe, blocks, ln_f, n_head):

pass # TODO: implement this

def generate(inputs, params, n_head, n_tokens_to_generate):

from tqdm import tqdm

for _ in tqdm(range(n_tokens_to_generate), "generating"): # auto-regressive decode loop

logits = gpt2(inputs, **params, n_head=n_head) # model forward pass

next_id = np.argmax(logits[-1]) # greedy sampling

inputs = np.append(inputs, [next_id]) # append prediction to input

return list(inputs[len(inputs) - n_tokens_to_generate :]) # only return generated ids

def main(prompt: str, n_tokens_to_generate: int = 40, model_size: str = "124M", models_dir: str = "models"):

from utils import load_encoder_hparams_and_params

# load encoder, hparams, and params from the released open-ai gpt-2 files

encoder, hparams, params = load_encoder_hparams_and_params(model_size, models_dir)

# encode the input string using the BPE tokenizer

input_ids = encoder.encode(prompt)

# make sure we are not surpassing the max sequence length of our model

assert len(input_ids) + n_tokens_to_generate < hparams["n_ctx"]

# generate output ids

output_ids = generate(input_ids, params, hparams["n_head"], n_tokens_to_generate)

# decode the ids back into a string

output_text = encoder.decode(output_ids)

return output_text

if name == "__main__":

import fire

fire.Fire(main)

然后從克隆存儲庫,安裝依賴項等步驟一步步教你如何在電腦上運行GPT。

其中,還不乏一些貼心的小tips,比如說如果使用的是M1 Macbook,那在運行pip install之前,需要將requments.txt中的tensorflow更改為tensorflow-macos。

此外,對于代碼的四個部分:gpt2,generate,main以及fire.Fire(main),博主也有做詳細解釋。

等到代碼能夠運行之后,下一步博主就準備詳細介紹編碼器、超參數(hparams)以及參數(params)這三部分了。

直接在筆記本或者Python會話中運行下面這個代碼:

from utils import load_encoder_hparams_and_params

encoder, hparams, params = load_encoder_hparams_and_params("124M", "models")

Bingo!一些必要的模型和tokenizer文件就直接下載到model/124M,編碼器、hparams和params也能直接加載。

更具體的內容這里就不多說了,教程的鏈接已經附在文末。

一些基礎神經網絡層的介紹

這一趴涉及到的知識就更加基礎了,因為下一趴是實際GPT自身的架構,所以在此之前,需要了解一些非特定于GPT的更基本的神經網絡層。

博主介紹了GeLU、Softmax函數以及Layer Normalization和Linear。

GPT架構

終于!這部分要來講GPT自身的架構了,博主從transformer的架構引入。

△transformer架構

GPT的架構只使用了transformer中的解碼器堆棧(即圖表的右邊部分),并且其中的的“交叉注意”層也沒有用到。

△GPT架構

隨后,博主將GPT的架構總結成了三大部分:

文本 + 位置嵌入

變壓器解碼器堆棧

下一個token預測頭

并且還將這三部分用代碼展示了出來,是醬紫的:

def gpt2(inputs, wte, wpe, blocks, ln_f, n_head): # [n_seq] -> [n_seq, n_vocab]

# token + positional embeddings

x = wte[inputs] + wpe[range(len(inputs))] # [n_seq] -> [n_seq, n_embd]

# forward pass through n_layer transformer blocks

for block in blocks:

x = transformer_block(x, block, n_head=n_head) # [n_seq, n_embd] -> [n_seq, n_embd]

# projection to vocab

x = layer_norm(x, ln_f) # [n_seq, n_embd] -> [n_seq, n_embd]

return x @ wte.T # [n_seq, n_embd] -> [n_seq, n_vocab]

再后面,就是關于這三部分的更多細節……

測試構建的GPT

這部分將全部的代碼組合在一起,就得到了gpt2.py,統共有120行代碼,刪除注釋和空格的話,就是60行。

然后測試一下!

python gpt2.py \

"Alan Turing theorized that computers would one day become" \

--n_tokens_to_generate 8

結果是這樣的:

the most powerful machines on the planet.

成功了!

一些后續補充

最后一部分,博主也總結了這短短60行代碼的不足:非常低效!

不過他還是給出了兩個可以讓GPT變高效的方法:

同時地而不是順序地執行注意力計算。

實現 KV 緩存。

此外,博主還推薦了一些訓練模型、評估模型以及改進架構的方法和教程。

關鍵詞: inputs params

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 www.fnsyft.com All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

        久久er99精品| 亚洲精品自拍动漫在线| 午夜精品成人在线视频| 欧美第一区第二区| 一区二区三区不卡视频| 国产高清亚洲一区| ●精品国产综合乱码久久久久| 欧美性生活久久| 亚洲国产精品成人综合色在线婷婷| 日韩国产欧美在线播放| jizzjizzjizz欧美| 午夜精品在线看| 久久久久国产精品麻豆| 日韩不卡手机在线v区| 久久在线观看免费| 欧美亚洲国产一区二区三区 | av一本久道久久综合久久鬼色| 一区二区三区成人| 欧美成人官网二区| 日韩电影在线一区二区| 国产视频一区不卡| 日韩欧美一区二区不卡| 精品国产精品一区二区夜夜嗨| 国产精品日韩成人| 国产一区在线观看视频| 亚洲高清免费一级二级三级| 亚洲高清久久久| 成人影视亚洲图片在线| 亚洲视频免费看| 欧美老女人在线| 亚洲三级在线免费观看| 高清不卡一区二区| 亚洲一级二级在线| 国产精品每日更新在线播放网址| 久久97超碰国产精品超碰| 国产精品初高中害羞小美女文| 69久久99精品久久久久婷婷 | 亚洲精品乱码久久久久| 久久精品一区二区三区不卡牛牛| 日韩va欧美va亚洲va久久| 国产精品沙发午睡系列990531| 91精品国产一区二区三区| 天天综合网天天综合色| 国产亚洲欧美激情| 欧美一区二区福利在线| 奇米一区二区三区| 伊人夜夜躁av伊人久久| 国产视频一区在线播放| 国产精品69毛片高清亚洲| 亚洲福利一区二区三区| 最新国产の精品合集bt伙计| 99久久久无码国产精品| 欧美日韩精品免费观看视频 | 国产亚洲欧美日韩在线一区| 国产乱理伦片在线观看夜一区| 亚洲制服丝袜av| 专区另类欧美日韩| 一区二区三区欧美亚洲| 国产欧美一区二区精品久导航| 日韩欧美精品在线| 激情欧美日韩一区二区| 色综合久久久久久久久久久| 一区二区三区精品在线观看| 中文字幕欧美日韩一区| 久久你懂得1024| av网站免费线看精品| 欧美日韩精品高清| 久久精品国产亚洲aⅴ| 亚洲一区欧美一区| 亚洲综合一区在线| 最新国产成人在线观看| 中文字幕在线观看不卡视频| 久久午夜色播影院免费高清| 欧美精品一区男女天堂| 国产成人高清在线| 欧美久久免费观看| 九九精品一区二区| 欧美艳星brazzers| 麻豆国产精品视频| 日本精品一区二区三区高清| 天天av天天翘天天综合网色鬼国产| 亚洲免费色视频| 一区二区三区四区五区视频在线观看| 国产精品欧美久久久久无广告| 欧美国产精品专区| 国产免费观看久久| 国产精品网曝门| 国产亚洲视频系列| 国产精品美女久久久久久久久 | 日韩视频一区二区三区在线播放 | 亚洲综合久久久久| 亚洲精品亚洲人成人网| 亚洲激情网站免费观看| 国产精品青草久久| 亚洲欧洲日产国码二区| 亚洲欧洲色图综合| 玉足女爽爽91| 亚洲一区二区三区在线播放| 亚洲国产精品一区二区www在线| 一区二区三区四区国产精品| 亚洲综合区在线| 亚洲在线视频网站| 日韩中文欧美在线| 日本韩国欧美国产| 精品一区在线看| 欧美丰满少妇xxxxx高潮对白 | 奇米精品一区二区三区四区| 欧美亚洲综合另类| 国产成人综合精品三级| 欧美成人在线直播| 91丨porny丨首页| 国产欧美一区二区三区鸳鸯浴| 国产精品久久午夜| 亚洲综合久久久久| 色菇凉天天综合网| 国产一二精品视频| 精品成人在线观看| 国产欧美日韩在线| 一区二区三区在线观看欧美| 亚洲成人一区二区| 精品制服美女丁香| 日韩欧美一区二区三区在线| 久久午夜老司机| 亚洲人成7777| 一本在线高清不卡dvd| 国产精品自拍av| 久久综合九色综合欧美亚洲| 亚洲国产岛国毛片在线| 亚洲大片免费看| 欧美色偷偷大香| 成人av电影免费在线播放| 日本一区二区视频在线| 亚洲免费伊人电影| 久久国产尿小便嘘嘘| 精品毛片乱码1区2区3区| 日本一区二区三区在线不卡 | 亚洲国产精品久久不卡毛片| 久久99九九99精品| 日韩欧美国产三级| 欧美国产日韩精品免费观看| 亚洲国产日韩a在线播放性色| 欧美在线不卡视频| 91影视在线播放| 亚洲色图清纯唯美| 日本久久精品电影| 99精品国产热久久91蜜凸| 亚洲日本一区二区三区| 欧美在线免费观看亚洲| 99久久er热在这里只有精品15 | 久久蜜臀中文字幕| 亚洲国产视频a| 欧美一区二区在线看| 国产三级三级三级精品8ⅰ区| 香蕉乱码成人久久天堂爱免费| 4438x成人网最大色成网站| 久久精品欧美日韩精品| 日日摸夜夜添夜夜添精品视频 | 亚洲国产视频一区二区| 91精品国产综合久久精品| 欧美极品少妇xxxxⅹ高跟鞋| 日本不卡视频一二三区| 久久综合成人精品亚洲另类欧美| 亚洲欧洲精品一区二区精品久久久| 日本va欧美va精品发布| 久久色在线观看| 亚洲一区二区三区三| 成人午夜在线免费| 一区二区久久久久| 欧美一区二区成人| 亚洲欧洲中文日韩久久av乱码| 国产在线麻豆精品观看| 国产精品国产自产拍高清av王其| 91成人网在线| 中文字幕的久久| 国产在线观看一区二区| 中文字幕日韩欧美一区二区三区| 欧美曰成人黄网| 欧美激情在线看| 国内精品国产成人国产三级粉色 | 亚洲欧洲三级电影| 欧美人牲a欧美精品| 最近日韩中文字幕| 丁香六月久久综合狠狠色| 一区二区理论电影在线观看| 日韩一区二区电影在线| 夜夜爽夜夜爽精品视频| 不卡大黄网站免费看| 舔着乳尖日韩一区| 中文字幕高清不卡| 欧美日韩免费不卡视频一区二区三区| 中文字幕电影一区| 国产精品1区2区3区在线观看| 樱桃国产成人精品视频| 精品久久久三级丝袜| 污片在线观看一区二区| 国产日韩欧美高清在线| 国产一区二区免费看| 一区二区日韩av| 久久品道一品道久久精品| 欧美视频中文字幕|