HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

DREAM: Deep Research Evaluation with Agentic Metrics

DREAM: Deep Research Evaluation with Agentic Metrics

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces

LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL: Forging Open Agentic Vision Models via RL

Video Understanding

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Multimodal Representation

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

Query-focused and Memory-aware Reranker for Long Context Processing

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

On Data Engineering for Scaling LLM Terminal Capabilities

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning

Reinforcement Learning

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

Diffusion Model

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

Reinforcement Learning

Multimodal Representation

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

Preference Modeling

Multi-Task Learning

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

VLANeXt: Recipes for Building Strong VLA Models

Multimodal Representation

Xiao-Ming Wu, Bin Fan, Kang Liao, et al.

A Very Big Video Reasoning Suite

Video Understanding

Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.

Selective Training for Large Vision Language Models via Visual Information Gain

Supervised Fine-Tuning

Seulbi Lee, Sangheum Hwang

DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

Visual Question Answering

Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.

SARAH: Spatially Aware Real-time Agentic Humans

Multimodal Representation

Evonne Ng, Siwei Zhang, Zhang Chen, et al.

EgoPush: Learning End-to-End Egocentric Multi-Object Rearrangement for Mobile Robots

Object Tracking

Boyuan An, Zhexiong Wang, Yipeng Wang, et al.

Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

Diffusion Model

Video Generation

Linxi Xie, Lisong C. Sun, Ashley Neall, et al.

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Reinforcement Learning

Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.

Arcee Trinity Large Technical Report

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Unified Latents (UL): How to train your latents

Diffusion Model

Image Generation

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Diffusion Model

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Bounded Model Checking for Unbounded Client Server Systems

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

Retrieval-Augmented Generation

Junhong Lin, Bing Zhang, Song Wang, et al.

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Multimodal Representation

Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.

Panini: Continual Learning in Token Space via Structured Memory

Retrieval-Augmented Generation

Intelligent Question Answering

Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Learning to Configure Agentic AI Systems

Aditya Taparia, Som Sagar, Ransalu Senanayake

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Ming Li, Xirui Li, Tianyi Zhou

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.

DREAM: Deep Research Evaluation with Agentic Metrics

DREAM: Deep Research Evaluation with Agentic Metrics

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces

LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL: Forging Open Agentic Vision Models via RL

Video Understanding

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Multimodal Representation

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

Query-focused and Memory-aware Reranker for Long Context Processing

Retrieval-Augmented Generation

Yuqing Li, Jiangnan Li, Mo Yu, et al.

On Data Engineering for Scaling LLM Terminal Capabilities

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning

Reinforcement Learning

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

Diffusion Model

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

Reinforcement Learning

Multimodal Representation

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

Preference Modeling

Multi-Task Learning

Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.

VLANeXt: Recipes for Building Strong VLA Models

Multimodal Representation

Xiao-Ming Wu, Bin Fan, Kang Liao, et al.

A Very Big Video Reasoning Suite

Video Understanding

Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.

Selective Training for Large Vision Language Models via Visual Information Gain

Supervised Fine-Tuning

Seulbi Lee, Sangheum Hwang

DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

Visual Question Answering

Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.

SARAH: Spatially Aware Real-time Agentic Humans

Multimodal Representation

Evonne Ng, Siwei Zhang, Zhang Chen, et al.

EgoPush: Learning End-to-End Egocentric Multi-Object Rearrangement for Mobile Robots

Object Tracking

Boyuan An, Zhexiong Wang, Yipeng Wang, et al.

Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

Diffusion Model

Video Generation

Linxi Xie, Lisong C. Sun, Ashley Neall, et al.

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Reinforcement Learning

Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.

Arcee Trinity Large Technical Report

Varun Singh, Lucas Krauss, Sami Jaghouar, et al.

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Dongrui Liu, Yi Yu, Jie Zhang, et al.

Unified Latents (UL): How to train your latents

Diffusion Model

Image Generation

Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

Haiyang Xu, Xi Zhang, Haowei Liu, et al.

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Diffusion Model

Jintao Zhang, Kai Jiang, Chendong Xiang, et al.

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Yifan Wu, Yiran Peng, Yiyu Chen, et al.

Bounded Model Checking for Unbounded Client Server Systems

Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

Retrieval-Augmented Generation

Junhong Lin, Bing Zhang, Song Wang, et al.

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Multimodal Representation

Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.

Panini: Continual Learning in Token Space via Structured Memory

Retrieval-Augmented Generation

Intelligent Question Answering

Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Learning to Configure Agentic AI Systems

Aditya Taparia, Som Sagar, Ransalu Senanayake

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Ming Li, Xirui Li, Tianyi Zhou

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.

PyVision-RL: Forging Open Agentic Vision Models via RL

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Query-focused and Memory-aware Reranker for Long Context Processing

On Data Engineering for Scaling LLM Terminal Capabilities

DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

VLANeXt: Recipes for Building Strong VLA Models

A Very Big Video Reasoning Suite

Selective Training for Large Vision Language Models via Visual Information Gain

DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

SARAH: Spatially Aware Real-time Agentic Humans

EgoPush: Learning End-to-End Egocentric Multi-Object Rearrangement for Mobile Robots

Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Arcee Trinity Large Technical Report

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Unified Latents (UL): How to train your latents

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Bounded Model Checking for Unbounded Client Server Systems

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Panini: Continual Learning in Token Space via Structured Memory

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Learning to Configure Agentic AI Systems

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

PyVision-RL: Forging Open Agentic Vision Models via RL

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Query-focused and Memory-aware Reranker for Long Context Processing

On Data Engineering for Scaling LLM Terminal Capabilities

DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

VLANeXt: Recipes for Building Strong VLA Models

A Very Big Video Reasoning Suite

Selective Training for Large Vision Language Models via Visual Information Gain

DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

SARAH: Spatially Aware Real-time Agentic Humans

EgoPush: Learning End-to-End Egocentric Multi-Object Rearrangement for Mobile Robots

Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Arcee Trinity Large Technical Report

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5

Unified Latents (UL): How to train your latents

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Bounded Model Checking for Unbounded Client Server Systems

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

Panini: Continual Learning in Token Space via Structured Memory

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Learning to Configure Agentic AI Systems

Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?