HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Retrieval-Augmented Generation

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

Agentic Reasoning for Large Language Models

Agentic Reasoning for Large Language Models

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX: VOICE AND ROLE CONTROL FOR FULL DUPLEX CONVERSATIONALSPEECH MODELS

Audio and Speech Processing

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0: A Real-Time End-to-End Spoken Dialogue Model with Personalized Voice Cloning

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

Preference Modeling

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer: All-in-one Framework for Spatio-temporal Video Transfer

Video Generation

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

Toward Efficient Agents: Memory, Tool learning, and Planning

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5: Scaling Human-Centric Robot Learning for Cross-Embodiment Generalization

Embodied Intelligence

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision

Supervised Fine-Tuning

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

Building Production-Ready Probes For Gemini

Text Generation

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 Technical Report

Retrieval-Augmented Generation

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance: An Unbind-Rebind Paradigm for Robust Multi-Subject Animation

Shuai Tan, Biao Gong, Ke Ma, et al.

The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models

Supervised Fine-Tuning

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Jie Yang, Honglin Guo, Li Ji, et al.

Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge

Yao Tang, Li Dong, Yaru Hao, et al.

Reasoning Models Generate Societies of Thought

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

Embodied Intelligence

Linqing Zhong, Yi Liu, Yifei Wei, et al.

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

Intelligent Question Answering

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Artificial Intelligence

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

Your Group-Relative Advantage Is Biased

Reinforcement Learning

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM: Scaling Transformers with Embedding Modules

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE: Visual Instruction Based Editor

Diffusion Model

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Reinforcement Learning

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Reinforcement Learning

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

Image Segmentation

Semantic Segmentation

Yu Wang, Yi Wang, Rui Dai, et al.

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Retrieval-Augmented Generation

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

Agentic Reasoning for Large Language Models

Agentic Reasoning for Large Language Models

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX: VOICE AND ROLE CONTROL FOR FULL DUPLEX CONVERSATIONALSPEECH MODELS

Audio and Speech Processing

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0: A Real-Time End-to-End Spoken Dialogue Model with Personalized Voice Cloning

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

Preference Modeling

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer: All-in-one Framework for Spatio-temporal Video Transfer

Video Generation

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

Toward Efficient Agents: Memory, Tool learning, and Planning

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5: Scaling Human-Centric Robot Learning for Cross-Embodiment Generalization

Embodied Intelligence

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision

Supervised Fine-Tuning

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

Building Production-Ready Probes For Gemini

Text Generation

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 Technical Report

Retrieval-Augmented Generation

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance: An Unbind-Rebind Paradigm for Robust Multi-Subject Animation

Shuai Tan, Biao Gong, Ke Ma, et al.

The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models

Supervised Fine-Tuning

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Jie Yang, Honglin Guo, Li Ji, et al.

Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge

Yao Tang, Li Dong, Yaru Hao, et al.

Reasoning Models Generate Societies of Thought

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

Embodied Intelligence

Linqing Zhong, Yi Liu, Yifei Wei, et al.

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

Intelligent Question Answering

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Artificial Intelligence

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

Your Group-Relative Advantage Is Biased

Reinforcement Learning

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM: Scaling Transformers with Embedding Modules

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE: Visual Instruction Based Editor

Diffusion Model

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Reinforcement Learning

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Reinforcement Learning

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

Image Segmentation

Semantic Segmentation

Yu Wang, Yi Wang, Rui Dai, et al.

PERSONAPLEX: VOICE AND ROLE CONTROL FOR FULL DUPLEX CONVERSATIONALSPEECH MODELS

FlashLabs Chroma 1.0: A Real-Time End-to-End Spoken Dialogue Model with Personalized Voice Cloning

MemoryRewardBench: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

OmniTransfer: All-in-one Framework for Spatio-temporal Video Transfer

Toward Efficient Agents: Memory, Tool learning, and Planning

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Being-H0.5: Scaling Human-Centric Robot Learning for Cross-Embodiment Generalization

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision

Building Production-Ready Probes For Gemini

LFM2 Technical Report

CoDance: An Unbind-Rebind Paradigm for Robust Multi-Subject Animation

The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge

Reasoning Models Generate Societies of Thought

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Your Group-Relative Advantage Is Biased

STEM: Scaling Transformers with Embedding Modules

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

VIBE: Visual Instruction Based Editor

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Urban Socio-Semantic Segmentation with Vision-Language Reasoning

PERSONAPLEX: VOICE AND ROLE CONTROL FOR FULL DUPLEX CONVERSATIONALSPEECH MODELS

FlashLabs Chroma 1.0: A Real-Time End-to-End Spoken Dialogue Model with Personalized Voice Cloning

MemoryRewardBench: Benchmarking Reward Models for Long-Term Memory Management in Large Language Models

OmniTransfer: All-in-one Framework for Spatio-temporal Video Transfer

Toward Efficient Agents: Memory, Tool learning, and Planning

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Being-H0.5: Scaling Human-Centric Robot Learning for Cross-Embodiment Generalization

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision

Building Production-Ready Probes For Gemini

LFM2 Technical Report

CoDance: An Unbind-Rebind Paradigm for Robust Multi-Subject Animation

The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Multiplex Thinking: Reasoning via Token-wise Branch-and-Merge

Reasoning Models Generate Societies of Thought

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation

Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text

The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents

Your Group-Relative Advantage Is Biased

STEM: Scaling Transformers with Embedding Modules

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

VIBE: Visual Instruction Based Editor

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Urban Socio-Semantic Segmentation with Vision-Language Reasoning