HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Agent Lightning: Train ANY AI Agents with Reinforcement Learning

Agent Lightning: Train ANY AI Agents with Reinforcement Learning

Reinforcement Learning

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

Automated Algorithmic Discovery for Gravitational-Wave Detection Guided by LLM-Informed Evolutionary Monte Carlo Tree Search

Automated Algorithmic Discovery for Gravitational-Wave Detection Guided by LLM-Informed Evolutionary Monte Carlo Tree Search

Machine Learning

He Wang, Liang Zeng

Beyond the Trade-off: Self-Supervised Reinforcement Learning for
Reasoning Models' Instruction Following

Reinforcement Learning

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

Supervised Fine-Tuning

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

CellForge: Agentic Design of Virtual Cell Models

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic
Association and Long Story Comprehension

Retrieval-Augmented Generation

Document Understanding

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization

Reinforcement Learning

Yihong Dong, Xue Jiang, Yongding Tao, et al.

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

3D Machine Vision

Baijun Ye, Minghui Qin, Saining Zhang, et al.

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

Han Li, Yuling Shi, Shaoxin Lin, et al.

Multimodal Referring Segmentation: A Survey

Multimodal Representation

Henghui Ding, Song Tang, Shuting He, et al.

3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

Visual Question Answering

Ting Huang, Zeyu Zhang, Hao Tang

SWE-Exp: Experience-Driven Software Issue Resolution

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

PixNerd: Pixel Neural Field Diffusion

Diffusion Model

Image Generation

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

Beyond Fixed: Variable-Length Denoising for Diffusion Large Language
Models

Diffusion Model

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

Co-Producing AI: Toward an Augmented, Participatory Lifecycle

Human-Computer Interaction

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM: An Iterative Large 3D Reconstruction Model

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X: Enhancing Latent Action Modeling in Vision-Language-Action
Models

Video Understanding

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring
Challenges in Complex Conversations

Chengqian Ma, Wei Tao, Yiwen Guo

RecGPT Technical Report

Retrieval-Augmented Generation

Chao Yi, Dian Chen, Gaoyang Guo, et al.

Phi-Ground Tech Report: Advancing Perception in GUI Grounding

Image Understanding

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Computer Vision

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

Less is More for Synthetic Speech Detection in the Wild

Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.

Solution-aware vs global ReLU selection: partial MILP strikes back for DNN verification

Convolutional Neural Network

Yuke Liao, Blaise Genest, Kuldeep Meel, et al.

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual
Segmentation

Video Understanding

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision

Object Detection

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced
Multimodal Reasoning

Reinforcement Learning

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency
and Performance

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG: Dividing 3D Assets via Generative Exploded Dynamics

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder: Advancing Visual-to-Code Generation for Front-End
Automation via Modular Multimodal Agents

Code Generation

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

Agent Lightning: Train ANY AI Agents with Reinforcement Learning

Agent Lightning: Train ANY AI Agents with Reinforcement Learning

Reinforcement Learning

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

Automated Algorithmic Discovery for Gravitational-Wave Detection Guided by LLM-Informed Evolutionary Monte Carlo Tree Search

Automated Algorithmic Discovery for Gravitational-Wave Detection Guided by LLM-Informed Evolutionary Monte Carlo Tree Search

Machine Learning

He Wang, Liang Zeng

Beyond the Trade-off: Self-Supervised Reinforcement Learning for
Reasoning Models' Instruction Following

Reinforcement Learning

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

Supervised Fine-Tuning

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

CellForge: Agentic Design of Virtual Cell Models

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic
Association and Long Story Comprehension

Retrieval-Augmented Generation

Document Understanding

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization

Reinforcement Learning

Yihong Dong, Xue Jiang, Yongding Tao, et al.

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

3D Machine Vision

Baijun Ye, Minghui Qin, Saining Zhang, et al.

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

Han Li, Yuling Shi, Shaoxin Lin, et al.

Multimodal Referring Segmentation: A Survey

Multimodal Representation

Henghui Ding, Song Tang, Shuting He, et al.

3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

Visual Question Answering

Ting Huang, Zeyu Zhang, Hao Tang

SWE-Exp: Experience-Driven Software Issue Resolution

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

PixNerd: Pixel Neural Field Diffusion

Diffusion Model

Image Generation

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

Beyond Fixed: Variable-Length Denoising for Diffusion Large Language
Models

Diffusion Model

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

Co-Producing AI: Toward an Augmented, Participatory Lifecycle

Human-Computer Interaction

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM: An Iterative Large 3D Reconstruction Model

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X: Enhancing Latent Action Modeling in Vision-Language-Action
Models

Video Understanding

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring
Challenges in Complex Conversations

Chengqian Ma, Wei Tao, Yiwen Guo

RecGPT Technical Report

Retrieval-Augmented Generation

Chao Yi, Dian Chen, Gaoyang Guo, et al.

Phi-Ground Tech Report: Advancing Perception in GUI Grounding

Image Understanding

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Computer Vision

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

Less is More for Synthetic Speech Detection in the Wild

Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.

Solution-aware vs global ReLU selection: partial MILP strikes back for DNN verification

Convolutional Neural Network

Yuke Liao, Blaise Genest, Kuldeep Meel, et al.

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual
Segmentation

Video Understanding

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision

Object Detection

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced
Multimodal Reasoning

Reinforcement Learning

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency
and Performance

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG: Dividing 3D Assets via Generative Exploded Dynamics

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder: Advancing Visual-to-Code Generation for Front-End
Automation via Modular Multimodal Agents

Code Generation

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models' Instruction Following

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

CellForge: Agentic Design of Virtual Cell Models

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension

RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

Multimodal Referring Segmentation: A Survey

3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

SWE-Exp: Experience-Driven Software Issue Resolution

PixNerd: Pixel Neural Field Diffusion

Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

Co-Producing AI: Toward an Augmented, Participatory Lifecycle

iLRM: An Iterative Large 3D Reconstruction Model

villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models

C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations

RecGPT Technical Report

Phi-Ground Tech Report: Advancing Perception in GUI Grounding

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Less is More for Synthetic Speech Detection in the Wild

Solution-aware vs global ReLU selection: partial MILP strikes back for DNN verification

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation

Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning

Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance

BANG: Dividing 3D Assets via Generative Exploded Dynamics

ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents

Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models' Instruction Following

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

CellForge: Agentic Design of Virtual Cell Models

SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension

RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization

GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting

SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution

Multimodal Referring Segmentation: A Survey

3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

SWE-Exp: Experience-Driven Software Issue Resolution

PixNerd: Pixel Neural Field Diffusion

Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models

Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training

Co-Producing AI: Toward an Augmented, Participatory Lifecycle

iLRM: An Iterative Large 3D Reconstruction Model

villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models

C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations

RecGPT Technical Report

Phi-Ground Tech Report: Advancing Perception in GUI Grounding

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Less is More for Synthetic Speech Detection in the Wild

Solution-aware vs global ReLU selection: partial MILP strikes back for DNN verification

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation

Adapting Vehicle Detectors for Aerial Imagery to Unseen Domains with Weak Supervision

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning

Falcon-H1: A Family of Hybrid-Head Language Models Redefining Efficiency and Performance

BANG: Dividing 3D Assets via Generative Exploded Dynamics

ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents