3 months ago

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

\Yuxuan Song\ \ Zheng Zhang\ \ Cheng Luo\ \ Pengyang Gao\ \ Fan Xia\ \ Hao Luo\ \ Zheng Li\ \ Yuehang Yang\ \ Hongli Yu\ \ Xingwei Qu\

Abstract

We present Seed Diffusion Preview, a large-scale language model based on discrete-state diffusion, offering remarkably fast inference speed. Thanks to non-sequential, parallel generation, discrete diffusion models provide a notable speedup to mitigate the inherent latency of token-by-token decoding, as demonstrated recently (e.g., Mercury Coder, Gemini Diffusion). Seed Diffusion Preview achieves an inference speed of 2,146 token/s over H20 GPUs while maintaining competitive performance across a sweep of standard code evaluation benchmarks, significantly faster than contemporary Mercury and Gemini Diffusion, establishing new state of the art on the speed-quality Pareto frontier for code models.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started

Hyper Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

Command Palette

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

\Yuxuan Song\ \ Zheng Zhang\ \ Cheng Luo\ \ Pengyang Gao\ \ Fan Xia\ \ Hao Luo\ \ Zheng Li\ \ Yuehang Yang\ \ Hongli Yu\ \ Xingwei Qu\12 more

Abstract

Build AI with AI

Hyper Newsletters

\Yuxuan Song\ \ Zheng Zhang\ \ Cheng Luo\ \ Pengyang Gao\ \ Fan Xia\ \ Hao Luo\ \ Zheng Li\ \ Yuehang Yang\ \ Hongli Yu\ \ Xingwei Qu\