HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Positive Alignment: Artificial Intelligence for Human Flourishing

Positive Alignment: Artificial Intelligence for Human Flourishing

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

LLaVA-UHD v4: What Makes Efficient Visual Encoding in MLLMs?

LLaVA-UHD v4: What Makes Efficient Visual Encoding in MLLMs?

Multimodal Representation

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

Unmasking On-Policy Distillation: Where It Helps, Where It Hurts, and Why

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

Text Generation

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF: Embedded Language Flows

Diffusion Model

Text Generation

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

Document Understanding

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

Rubric-based On-policy Distillation

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

Video Generation

Video Understanding

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

George Wu, Nan Jing, Qing Yi, et al.

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

Guijin Son, Seungone Kim, Catherine Arnett, et al.

Qwen-Image-2.0 Technical Report

Bing Zhao, Chenfei Wu, Deqing Li, et al.

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Reinforcement Learning

Yi Wang, Xincheng Li, Pengwei Xie, et al.

Fast Byte Latent Transformer

Text Generation

Diffusion Model

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

Retrieval-Augmented Generation

Guankai Li, Jiabin Chen, Yi Xu, et al.

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

Diffusion Model

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Reinforcement Learning

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy Distillation for Flow Matching Models

Diffusion Model

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Diffusion Model

Video Generation

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

When to Trust Imagination: Adaptive Action Execution for World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

Intelligent Question Answering

Text Generation

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Reinforcement Learning

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Diffusion Model

Supervised Fine-Tuning

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technical Report

Supervised Fine-Tuning

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

Positive Alignment: Artificial Intelligence for Human Flourishing

Positive Alignment: Artificial Intelligence for Human Flourishing

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

LLaVA-UHD v4: What Makes Efficient Visual Encoding in MLLMs?

LLaVA-UHD v4: What Makes Efficient Visual Encoding in MLLMs?

Multimodal Representation

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

Unmasking On-Policy Distillation: Where It Helps, Where It Hurts, and Why

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

Text Generation

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF: Embedded Language Flows

Diffusion Model

Text Generation

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

Document Understanding

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

Rubric-based On-policy Distillation

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

Video Generation

Video Understanding

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

George Wu, Nan Jing, Qing Yi, et al.

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

Guijin Son, Seungone Kim, Catherine Arnett, et al.

Qwen-Image-2.0 Technical Report

Bing Zhao, Chenfei Wu, Deqing Li, et al.

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

Junbo Cui, Bokai Xu, Chongyi Wang, et al.

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Reinforcement Learning

Yi Wang, Xincheng Li, Pengwei Xie, et al.

Fast Byte Latent Transformer

Text Generation

Diffusion Model

Julie Kallini, Artidoro Pagnoni, Tomasz Limisiewicz, et al.

AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

Daniel Zheng, Ingrid von Glehn, Yori Zwols, et al.

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

Retrieval-Augmented Generation

Guankai Li, Jiabin Chen, Yi Xu, et al.

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

Diffusion Model

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Tong Zheng, Haolin Liu, Chengsong Huang, et al.

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Reinforcement Learning

Yun Qu, Qi Wang, Yixiu Mao, et al.

Flow-OPD: On-Policy Distillation for Flow Matching Models

Diffusion Model

Zhen Fang, Wenxuan Huang, Yu Zeng, et al.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Diffusion Model

Video Generation

Kaixing Yang, Jiashu Zhu, Xulong Tang, et al.

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

Retrieval-Augmented Generation

Yilun Zhao, Jinbiao Wei, Tingyu Song, et al.

When to Trust Imagination: Adaptive Action Execution for World Action Models

Rui Wang, Yue Zhang, Jiehong Lin, et al.

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

Intelligent Question Answering

Text Generation

Ivan Bondarenko, Roman Derunets, Oleg Sedukhin, et al.

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

Continuous Latent Diffusion Language Model

Hongcan Guo, Qinyu Zhao, Yian Zhao, et al.

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Reinforcement Learning

Yaorui Shi, Yuxin Chen, Zhengxi Lu, et al.

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Retrieval-Augmented Generation

Zhuofeng Li, Haoxiang Zhang, Cong Wei, et al.

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

Retrieval-Augmented Generation

Shaden Alshammari, Kevin Wen, Abrar Zainal, et al.

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Diffusion Model

Supervised Fine-Tuning

Dongyang Jiang, Xin Jin, Dongyang Liu, et al.

ZAYA1-8B Technical Report

Supervised Fine-Tuning

Robert Washbourne, Rishi Iyer, Tomas Figliolia, et al.

Unmasking On-Policy Distillation: Where It Helps, Where It Hurts, and Why

A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training

ELF: Embedded Language Flows

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

Rubric-based On-policy Distillation

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

Qwen-Image-2.0 Technical Report

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Fast Byte Latent Transformer

AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Flow-OPD: On-Policy Distillation for Flow Matching Models

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

When to Trust Imagination: Adaptive Action Execution for World Action Models

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Continuous Latent Diffusion Language Model

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

ZAYA1-8B Technical Report

Unmasking On-Policy Distillation: Where It Helps, Where It Hurts, and Why

A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models

SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training

ELF: Embedded Language Flows

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

Rubric-based On-policy Distillation

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

Qwen-Image-2.0 Technical Report

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies

Fast Byte Latent Transformer

AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

Flow-OPD: On-Policy Distillation for Flow Matching Models

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

Rethinking Reasoning-Intensive Retrieval: Evaluating and Advancing Retrievers in Agentic Search Systems

When to Trust Imagination: Adaptive Action Execution for World Action Models

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

MiA-Signature: Approximating Global Activation for Long-Context Understanding

Continuous Latent Diffusion Language Model

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

MathNet: A GLOBAL MULTIMODAL BENCHMARK FOR MATHEMATICAL REASONING AND RETRIEVAL

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

ZAYA1-8B Technical Report