HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

3D Machine Vision

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO: Reinforcing Diffusion Models without Reward Hacking

GARDO: Reinforcing Diffusion Models without Reward Hacking

Reinforcement Learning

Diffusion Model

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

Reinforcement Learning

Diffusion Model

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

Diffusion Model

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

Image Generation

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE Technical Report

Text Generation

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

Training AI Co-Scientists Using Rubric Rewards

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.

AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction

3D Machine Vision

Depth Estimation

Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu

Taming Hallucinations: Boosting MLLMs' Video Understanding via Counterfactual Video Generation

Diffusion Model

Video Understanding

Zhe Huang, Hao Wen, Aiming Hao, et al.

SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

Multimodal Representation

Yong Xien Chng, Tao Hu, Wenwen Tong, et al.

Human-Computer Interaction

Embodied Intelligence

Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

Video Generation

Yuxue Yang, Lue Fan, Ziqi Shi, et al.

Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization

Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.

IQuest-Coder-V1 Technical Report

Code Generation

Jian Yang, Wei Zhang, Shawn Guo, et al.

Recursive Language Models

Alex L. Zhang, Tim Kraska, Omar Khattab

FlowBlending: Stage-Aware Multi-Model Sampling for Fast and High-Fidelity Video Generation

Video Generation

Diffusion Model

Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.

Dream2Flow: Bridging Video Generation and Open-World Manipulation with 3D Object Flow

Video Generation

Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.

On the Role of Discreteness in Diffusion LLMs

Diffusion Model

Ziqi Jin, Bin Wang, Xiang Lin, et al.

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Diffusion Model

Zefeng He, Xiaoye Qu, Yafu Li, et al.

Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

Natural Language Processing

Xingwei Qu, Shaowen Wang, Zihao Huang, et al.

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Retrieval-Augmented Generation

Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.

AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Jiafeng Liang, Hao Li, Chang Li, et al.

Scaling Open-Ended Reasoning to Predict the Future

Retrieval-Augmented Generation

Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.

GaMO: Geometry-aware Multi-view Diffusion Outpainting for Sparse-View 3D Reconstruction

Diffusion Model

3D Machine Vision

Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.

mHC: Manifold-Constrained Hyper-Connections

Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Weixun Wang, XiaoXiao Xu, Wanhe An, et al.

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.

GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs

Text Generation

Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.

GraphLocator: Graph-guided Causal Reasoning for Issue Localization

Wei Liu, Chao Peng, Pengfei Gao, et al.

Evaluating Parameter Efficient Methods for RLVR

Reinforcement Learning

Supervised Fine-Tuning

Qingyu Yin, Yulun Wu, Zhennan Shen, et al.

End-to-End Test-Time Training for Long Context

Natural Language Processing

Arnuv Tandon, Karan Dalal, Xinhao Li, et al.

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

3D Machine Vision

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO: Reinforcing Diffusion Models without Reward Hacking

GARDO: Reinforcing Diffusion Models without Reward Hacking

Reinforcement Learning

Diffusion Model

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

Reinforcement Learning

Diffusion Model

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

Diffusion Model

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

Image Generation

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE Technical Report

Text Generation

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

Training AI Co-Scientists Using Rubric Rewards

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.

AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction

3D Machine Vision

Depth Estimation

Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu

Taming Hallucinations: Boosting MLLMs' Video Understanding via Counterfactual Video Generation

Diffusion Model

Video Understanding

Zhe Huang, Hao Wen, Aiming Hao, et al.

SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

Multimodal Representation

Yong Xien Chng, Tao Hu, Wenwen Tong, et al.

Human-Computer Interaction

Embodied Intelligence

Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

Video Generation

Yuxue Yang, Lue Fan, Ziqi Shi, et al.

Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization

Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.

IQuest-Coder-V1 Technical Report

Code Generation

Jian Yang, Wei Zhang, Shawn Guo, et al.

Recursive Language Models

Alex L. Zhang, Tim Kraska, Omar Khattab

FlowBlending: Stage-Aware Multi-Model Sampling for Fast and High-Fidelity Video Generation

Video Generation

Diffusion Model

Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.

Dream2Flow: Bridging Video Generation and Open-World Manipulation with 3D Object Flow

Video Generation

Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.

On the Role of Discreteness in Diffusion LLMs

Diffusion Model

Ziqi Jin, Bin Wang, Xiang Lin, et al.

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Diffusion Model

Zefeng He, Xiaoye Qu, Yafu Li, et al.

Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

Natural Language Processing

Xingwei Qu, Shaowen Wang, Zihao Huang, et al.

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Retrieval-Augmented Generation

Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.

AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Jiafeng Liang, Hao Li, Chang Li, et al.

Scaling Open-Ended Reasoning to Predict the Future

Retrieval-Augmented Generation

Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.

GaMO: Geometry-aware Multi-view Diffusion Outpainting for Sparse-View 3D Reconstruction

Diffusion Model

3D Machine Vision

Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.

mHC: Manifold-Constrained Hyper-Connections

Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Weixun Wang, XiaoXiao Xu, Wanhe An, et al.

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.

GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs

Text Generation

Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.

GraphLocator: Graph-guided Causal Reasoning for Issue Localization

Wei Liu, Chao Peng, Pengfei Gao, et al.

Evaluating Parameter Efficient Methods for RLVR

Reinforcement Learning

Supervised Fine-Tuning

Qingyu Yin, Yulun Wu, Zhennan Shen, et al.

End-to-End Test-Time Training for Long Context

Natural Language Processing

Arnuv Tandon, Karan Dalal, Xinhao Li, et al.

VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

K-EXAONE Technical Report

The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems

Training AI Co-Scientists Using Rubric Rewards

AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction

Taming Hallucinations: Boosting MLLMs' Video Understanding via Counterfactual Video Generation

SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization

IQuest-Coder-V1 Technical Report

Recursive Language Models

FlowBlending: Stage-Aware Multi-Model Sampling for Fast and High-Fidelity Video Generation

Dream2Flow: Bridging Video Generation and Open-World Manipulation with 3D Object Flow

On the Role of Discreteness in Diffusion LLMs

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Scaling Open-Ended Reasoning to Predict the Future

GaMO: Geometry-aware Multi-view Diffusion Outpainting for Sparse-View 3D Reconstruction

mHC: Manifold-Constrained Hyper-Connections

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs

GraphLocator: Graph-guided Causal Reasoning for Issue Localization

Evaluating Parameter Efficient Methods for RLVR

End-to-End Test-Time Training for Long Context

VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

K-EXAONE Technical Report

The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems

Training AI Co-Scientists Using Rubric Rewards

AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction

Taming Hallucinations: Boosting MLLMs' Video Understanding via Counterfactual Video Generation

SenseNova-MARS: Empowering Multimodal Agentic Reasoning and Search via Reinforcement Learning

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization

IQuest-Coder-V1 Technical Report

Recursive Language Models

FlowBlending: Stage-Aware Multi-Model Sampling for Fast and High-Fidelity Video Generation

Dream2Flow: Bridging Video Generation and Open-World Manipulation with 3D Object Flow

On the Role of Discreteness in Diffusion LLMs

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

AI Meets Brain: Memory Systems from Cognitive Neuroscience to Autonomous Agents

Scaling Open-Ended Reasoning to Predict the Future

GaMO: Geometry-aware Multi-view Diffusion Outpainting for Sparse-View 3D Reconstruction

mHC: Manifold-Constrained Hyper-Connections

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

GateBreaker: Gate-Guided Attacks on Mixture-of-Expert LLMs

GraphLocator: Graph-guided Causal Reasoning for Issue Localization

Evaluating Parameter Efficient Methods for RLVR

End-to-End Test-Time Training for Long Context