HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Xiangyi Li, Wenbo Chen, Yimin Liu, et al.

GLM-5: from Vibe Coding to Agentic Engineering

GLM-5: from Vibe Coding to Agentic Engineering

Code Generation

GLM-5 Team, Aohan Zeng, Xin Lv, et al.

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

Image Generation

Diffusion Model

Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Zheng Chu, Xiao Wang, Jack Hong, et al.

Qute: Towards Quantum-Native Database

Retrieval-Augmented Generation

Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Retrieval-Augmented Generation

Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

Multimodal Representation

Jiahao Yuan, Yike Xu, Jinyong Wen, et al.

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

Video Understanding

Multimodal Representation

Saar Huberman, Kfir Goldberg, Or Patashnik, et al.

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Reinforcement Learning

Supervised Fine-Tuning

Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

Yandan Yang, Shuang Zeng, Tong Lin, et al.

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

Supervised Fine-Tuning

Xirui Li, Ming Li, Tianyi Zhou

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Intelligent Question Answering

Baorong Shi, Bo Cui, Boyuan Jiang, et al.

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Visual Question Answering

Lai Wei, Liangbo He, Jun Lan, et al.

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Supervised Fine-Tuning

Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Audio and Speech Processing

Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Reinforcement Learning

Wenkai Yang, Weijie Liu, Ruobing Xie, et al.

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Diffusion Model

Dianyi Wang, Ruihang Li, Feng Han, et al.

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Reinforcement Learning

Intelligent Question Answering

Xin Xu, Clive Bai, Kai Yang, et al.

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Xiangyi Li, Wenbo Chen, Yimin Liu, et al.

GLM-5: from Vibe Coding to Agentic Engineering

GLM-5: from Vibe Coding to Agentic Engineering

Code Generation

GLM-5 Team, Aohan Zeng, Xin Lv, et al.

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

Image Generation

Diffusion Model

Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Zheng Chu, Xiao Wang, Jack Hong, et al.

Qute: Towards Quantum-Native Database

Retrieval-Augmented Generation

Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Retrieval-Augmented Generation

Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

Multimodal Representation

Jiahao Yuan, Yike Xu, Jinyong Wen, et al.

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

Video Understanding

Multimodal Representation

Saar Huberman, Kfir Goldberg, Or Patashnik, et al.

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

Reinforcement Learning

Supervised Fine-Tuning

Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

Yandan Yang, Shuang Zeng, Tong Lin, et al.

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

Supervised Fine-Tuning

Xirui Li, Ming Li, Tianyi Zhou

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Intelligent Question Answering

Baorong Shi, Bo Cui, Boyuan Jiang, et al.

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Visual Question Answering

Lai Wei, Liangbo He, Jun Lan, et al.

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Supervised Fine-Tuning

Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Audio and Speech Processing

Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Reinforcement Learning

Wenkai Yang, Weijie Liu, Ruobing Xie, et al.

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Diffusion Model

Dianyi Wang, Ruihang Li, Feng Han, et al.

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Reinforcement Learning

Intelligent Question Answering

Xin Xu, Clive Bai, Kai Yang, et al.

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.

Towards Autonomous Mathematics Research

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Intelligent Question Answering

Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.

ASA: Activation Steering for Tool-Calling Domain Adaptation

Intelligent Question Answering

Youjin Wang, Run Zhou, Rong Fu, et al.

PhyCritic: Multimodal Critic Models for Physical AI

Visual Question Answering

Tianyi Xiong, Shihao Wang, Guilin Liu, et al.

GENIUS: Generative Fluid Intelligence Evaluation Suite

Ruichuan An, Sihan Yang, Ziyu Guo, et al.

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Ailin Huang, Ang Li, Aobo Kong, et al.

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Diffusion Model

Video Generation

Xiaokang Liu, Zechen Bai, Hai Ci, et al.

Towards Autonomous Mathematics Research

Retrieval-Augmented Generation

Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Multimodal Representation

Yun Luo, Futing Wang, Qianjia Cheng, et al.

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

Tianyi Jiang, Arctanx An, Hengyi Feng, et al.

UI-Venus-1.5 Technical Report

Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Qute: Towards Quantum-Native Database

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Towards Autonomous Mathematics Research

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

ASA: Activation Steering for Tool-Calling Domain Adaptation

PhyCritic: Multimodal Critic Models for Physical AI

GENIUS: Generative Fluid Intelligence Evaluation Suite

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Towards Autonomous Mathematics Research

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

UI-Venus-1.5 Technical Report

BitDance: Scaling Autoregressive Generative Models with Binary Tokens

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Qute: Towards Quantum-Native Database

InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

SemanticMoments: Training-Free Motion Similarity via Third Moment Features

RLinf-Co: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Towards Autonomous Mathematics Research

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

ASA: Activation Steering for Tool-Calling Domain Adaptation

PhyCritic: Multimodal Critic Models for Physical AI

GENIUS: Generative Fluid Intelligence Evaluation Suite

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Towards Autonomous Mathematics Research

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads

Chain of Mindset: Reasoning with Adaptive Cognitive Modes

UI-Venus-1.5 Technical Report