HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Reinforcement Learning

Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.

ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality

ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality

Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.

iFSQ: Improving FSQ for Image Generation with 1 Line of Code

Image Generation

Diffusion Model

Bin Lin, Zongjian Li, Yuwei Niu, et al.

Elastic Attention: Test-time Adaptive Sparsity Ratios for Efficient Transformers

Zecheng Tang, Quantong Qiu, Yi Yang, et al.

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

Diffusion Model

Honglin Lin, Chonghan Qin, Zheng Liu, et al.

The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

Video Generation

Chenyu Mu, Xin He, Qu Yang, et al.

daVinci-Dev: Agent-native Mid-training for Software Engineering

Ji Zeng, Dayuan Fu, Tiantian Mi, et al.

Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs

Natural Language Processing

Wei Zhou, Jun Zhou, Haoyu Wang, et al.

DeepSeek-OCR 2: Visual Causal Flow

Document Understanding

Haoran Wei, Yaofeng Sun, Yukun Li

Learning to Discover at Test Time

Reinforcement Learning

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

Eliciting Harmful Capabilities by Fine-Tuning On Safeguarded Outputs

Supervised Fine-Tuning

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

Memory-V2V: Augmenting Video-to-Video Diffusion Models with Memory

Diffusion Model

Video Processing

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

VisGym: Diverse, Customizable, Scalable Environments for Multimodal Agents

Embodied Intelligence

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

Embodied Intelligence

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

Code Generation

Yuhang Wang, Yuling Shi, Mo Yang, et al.

LongCat-Flash-Thinking-2601 Technical Report

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

Can Language Models Discover Scaling Laws?

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

Cosmos Policy: Fine-Tuning Video Models for Visuomotor Control and Planning

Video Generation

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Triton-distributed: Programming Overlapping Kernels on Distributed AI Systems with the Triton Compiler

Zheng Size, Wenlei Bao, Qi Hou, et al.

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

Diffusion Model

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

BayesianVLA: Bayesian Decomposition of Vision Language Action Models via Latent Action Queries

Multimodal Representation

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models

Diffusion Model

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

LLM-in-Sandbox Elicits General Agentic Intelligence

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Video Understanding

Video Processing

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 Technical Report

Mao Zheng, Zheng Li, Tao Chen, et al.

Scaling Laws for Code: Every Programming Language Matters

Code Generation

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3-TTS Technical Report

Audio and Speech Processing

Hangrui Hu, Xinfa Zhu, Ting He, et al.

Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition

Human-Computer Interaction

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Teaching Models to Teach Themselves: Reasoning at the Edge of Learnability

Reinforcement Learning

Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.

ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality

ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality

Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.

iFSQ: Improving FSQ for Image Generation with 1 Line of Code

Image Generation

Diffusion Model

Bin Lin, Zongjian Li, Yuwei Niu, et al.

Elastic Attention: Test-time Adaptive Sparsity Ratios for Efficient Transformers

Zecheng Tang, Quantong Qiu, Yi Yang, et al.

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

Diffusion Model

Honglin Lin, Chonghan Qin, Zheng Liu, et al.

The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

Video Generation

Chenyu Mu, Xin He, Qu Yang, et al.

daVinci-Dev: Agent-native Mid-training for Software Engineering

Ji Zeng, Dayuan Fu, Tiantian Mi, et al.

Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs

Natural Language Processing

Wei Zhou, Jun Zhou, Haoyu Wang, et al.

DeepSeek-OCR 2: Visual Causal Flow

Document Understanding

Haoran Wei, Yaofeng Sun, Yukun Li

Learning to Discover at Test Time

Reinforcement Learning

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

Eliciting Harmful Capabilities by Fine-Tuning On Safeguarded Outputs

Supervised Fine-Tuning

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

Memory-V2V: Augmenting Video-to-Video Diffusion Models with Memory

Diffusion Model

Video Processing

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

VisGym: Diverse, Customizable, Scalable Environments for Multimodal Agents

Embodied Intelligence

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

Embodied Intelligence

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

Code Generation

Yuhang Wang, Yuling Shi, Mo Yang, et al.

LongCat-Flash-Thinking-2601 Technical Report

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

Can Language Models Discover Scaling Laws?

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

Cosmos Policy: Fine-Tuning Video Models for Visuomotor Control and Planning

Video Generation

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Triton-distributed: Programming Overlapping Kernels on Distributed AI Systems with the Triton Compiler

Zheng Size, Wenlei Bao, Qi Hou, et al.

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

Diffusion Model

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

BayesianVLA: Bayesian Decomposition of Vision Language Action Models via Latent Action Queries

Multimodal Representation

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models

Diffusion Model

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

LLM-in-Sandbox Elicits General Agentic Intelligence

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Video Understanding

Video Processing

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 Technical Report

Mao Zheng, Zheng Li, Tao Chen, et al.

Scaling Laws for Code: Every Programming Language Matters

Code Generation

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3-TTS Technical Report

Audio and Speech Processing

Hangrui Hu, Xinfa Zhu, Ting He, et al.

Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition

Human-Computer Interaction

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

iFSQ: Improving FSQ for Image Generation with 1 Line of Code

Elastic Attention: Test-time Adaptive Sparsity Ratios for Efficient Transformers

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

daVinci-Dev: Agent-native Mid-training for Software Engineering

Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs

DeepSeek-OCR 2: Visual Causal Flow

Learning to Discover at Test Time

Eliciting Harmful Capabilities by Fine-Tuning On Safeguarded Outputs

Memory-V2V: Augmenting Video-to-Video Diffusion Models with Memory

Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification

VisGym: Diverse, Customizable, Scalable Environments for Multimodal Agents

TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

LongCat-Flash-Thinking-2601 Technical Report

Can Language Models Discover Scaling Laws?

Cosmos Policy: Fine-Tuning Video Models for Visuomotor Control and Planning

Triton-distributed: Programming Overlapping Kernels on Distributed AI Systems with the Triton Compiler

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

BayesianVLA: Bayesian Decomposition of Vision Language Action Models via Latent Action Queries

The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models

LLM-in-Sandbox Elicits General Agentic Intelligence

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

HY-MT1.5 Technical Report

Scaling Laws for Code: Every Programming Language Matters

Qwen3-TTS Technical Report

Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

iFSQ: Improving FSQ for Image Generation with 1 Line of Code

Elastic Attention: Test-time Adaptive Sparsity Ratios for Efficient Transformers

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

daVinci-Dev: Agent-native Mid-training for Software Engineering

Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs

DeepSeek-OCR 2: Visual Causal Flow

Learning to Discover at Test Time

Eliciting Harmful Capabilities by Fine-Tuning On Safeguarded Outputs

Memory-V2V: Augmenting Video-to-Video Diffusion Models with Memory

Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification

VisGym: Diverse, Customizable, Scalable Environments for Multimodal Agents

TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

SWE-Pruner: Self-Adaptive Context Pruning for Coding Agents

LongCat-Flash-Thinking-2601 Technical Report

Can Language Models Discover Scaling Laws?

Cosmos Policy: Fine-Tuning Video Models for Visuomotor Control and Planning

Triton-distributed: Programming Overlapping Kernels on Distributed AI Systems with the Triton Compiler

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

BayesianVLA: Bayesian Decomposition of Vision Language Action Models via Latent Action Queries

The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models

LLM-in-Sandbox Elicits General Agentic Intelligence

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

HY-MT1.5 Technical Report

Scaling Laws for Code: Every Programming Language Matters

Qwen3-TTS Technical Report

Small Models, Big Results: Achieving Superior Intent Extraction through Decomposition

FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents