📰 newsreader

hackernews score 0.95 好み 0.00 en

GateGPT:80 MHzのFPGA上で毎秒56kトークンを実現するTransformer (KVキャッシュ)

原題: GateGPT: 56k tokens per second Transformer (KV cache) on FPGA at 80 MHz

gategpttransformerkv cachefpgatokens per secondintegrated circuitmicrogptcustom chip
原文 ↗

日本語訳

# タイトル

GateGPT: 80 MHzのFPGA上で実現した、毎秒56kトークンのTransformer (KVキャッシュ)

# 本文

わずか80 MHzで56,000トークン/秒以上。🤯

KVキャッシュを備えた完全なTransformerをカスタムチップに実装しました。100%デジタル集積回路として、ゲート単位で設計。FPGA上でプロトタイプを作成しました。(GPUもCPUも使用していません)

@karpathy の microGPT を動作させる、純粋なデジタル・シリコン。GPTが名前を綴っています 👇

原文(英語)を表示

56,000+ tokens/sec at just 80 MHz. 🤯

I burned a full Transformer with KV cache into a custom chip. Designed gate by gate as a 100% digital integrated circuit. Prototyped on a FPGA. (No GPU. No CPU)

Just pure digital silicon running @karpathy microGPT, spelling out names on a GPT 👇

← 一覧に戻る