HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Group Sequence Policy Optimization

Group Sequence Policy Optimization

Reinforcement Learning

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

SafeWork-R1: Coevolving Safety and Intelligence under the AI-45 Law

SafeWork-R1: Coevolving Safety and Intelligence under the AI-45 Law

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

Decoupling Knowledge and Reasoning in LLMs: An Exploration Using Cognitive Dual-System Theory

Mutian Yang, Jiandong Gao, Ji Wu

Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny

Supervised Fine-Tuning

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

RAVine: Reality-Aligned Evaluation for Agentic Search

Retrieval-Augmented Generation

Yilong Xu, Xiang Long, Zhi Zheng, et al.

Can One Domain Help Others? A Data-Centric Study on Multi-Domain
Reasoning via Reinforcement Learning

Reinforcement Learning

Yu Li, Zhuoshi Pan, Honglin Lin, et al.

DesignLab: Designing Slides Through Iterative Detection and Correction

Human-Computer Interaction

Document Understanding

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

Yume: An Interactive World Generation Model

Diffusion Model

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

Pixels, Patterns, but No Poetry: To See The World like Humans

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

MedChatZH: a Better Medical Adviser Learns from Better Instructions

Intelligent Question Answering

Yang Tan, Mingchen Li, Zijie Huang, et al.

Constructing Ophthalmic MLLM for Positioning-diagnosis Collaboration Through Clinical Cognitive Chain Reasoning

Visual Question Answering

Medical Imaging

Xinyao Liu, Diping Song

HySafe-AI: Hybrid Safety Architectural Analysis Framework for AI Systems: A Case Study

University of Cambridge

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Ang Li, Charles Wang, Kaiyu Yue, et al.

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-thinking
Reasoning

Reinforcement Learning

Visual Question Answering

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

Diffusion Model

Image Generation

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

MegaScience: Pushing the Frontiers of Post-Training Datasets for Science
Reasoning

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

Step-Audio 2 Technical Report

Boyong Wu, Chao Yan, Chen Hu, et al.

Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

Uncertainty-Aware Knowledge Transformers for Peer-to-Peer Energy Trading with Multi-Agent Reinforcement Learning

Reinforcement Learning

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

Image Generation

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

Semantic Segmentation

Hayeon Kim, Ji Ha Jang, Se Young Chun

WebShaper: Agentically Data Synthesizing via Information-Seeking
Formalization

Retrieval-Augmented Generation

Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.

The Invisible Leash: Why RLVR May Not Escape Its Origin

Reinforcement Learning

Fang Wu, Weihao Xuan, Ximing Lu, et al.

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

Reinforcement Learning

Object Detection

Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via
Context-Aware Multi-Stage Policy Optimization

Supervised Fine-Tuning

Xingxuan Li, Yao Xiao, Dianwen Ng, et al.

Design of intrinsically disordered region binding proteins

Kejia Wu, et al

An All-Atom Generative Model for Designing Protein Complexes

Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

Supervised Fine-Tuning

Fei Zhao, Chonggang Lu, Yue Wang, et al.

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Image Generation

Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.

Mono-InternVL-1.5: Towards Cheaper and Faster Monolithic Multimodal Large Language Models

Gen Luo, Wenhan Dou, Wenhao Li, et al.

Franca: Nested Matryoshka Clustering for Scalable Visual Representation
Learning

Computer Vision

Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.

Group Sequence Policy Optimization

Group Sequence Policy Optimization

Reinforcement Learning

Chujie Zheng, Shixuan Liu, Mingze Li, et al.

SafeWork-R1: Coevolving Safety and Intelligence under the AI-45 Law

SafeWork-R1: Coevolving Safety and Intelligence under the AI-45 Law

Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.

Decoupling Knowledge and Reasoning in LLMs: An Exploration Using Cognitive Dual-System Theory

Mutian Yang, Jiandong Gao, Ji Wu

Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny

Supervised Fine-Tuning

Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.

RAVine: Reality-Aligned Evaluation for Agentic Search

Retrieval-Augmented Generation

Yilong Xu, Xiang Long, Zhi Zheng, et al.

Can One Domain Help Others? A Data-Centric Study on Multi-Domain
Reasoning via Reinforcement Learning

Reinforcement Learning

Yu Li, Zhuoshi Pan, Honglin Lin, et al.

DesignLab: Designing Slides Through Iterative Detection and Correction

Human-Computer Interaction

Document Understanding

Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.

Yume: An Interactive World Generation Model

Diffusion Model

Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.

Pixels, Patterns, but No Poetry: To See The World like Humans

Hongcheng Gao, Zihao Huang, Lin Xu, et al.

MedChatZH: a Better Medical Adviser Learns from Better Instructions

Intelligent Question Answering

Yang Tan, Mingchen Li, Zijie Huang, et al.

Constructing Ophthalmic MLLM for Positioning-diagnosis Collaboration Through Clinical Cognitive Chain Reasoning

Visual Question Answering

Medical Imaging

Xinyao Liu, Diping Song

HySafe-AI: Hybrid Safety Architectural Analysis Framework for AI Systems: A Case Study

University of Cambridge

Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Ang Li, Charles Wang, Kaiyu Yue, et al.

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-thinking
Reasoning

Reinforcement Learning

Visual Question Answering

Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

Diffusion Model

Image Generation

Wongi Jeong, Kyungryeol Lee, Hoigi Seo, et al.

MegaScience: Pushing the Frontiers of Post-Training Datasets for Science
Reasoning

Run-Ze Fan, Zengzhi Wang, Pengfei Liu

Step-Audio 2 Technical Report

Boyong Wu, Chao Yan, Chen Hu, et al.

Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning

Hongyin Luo, Nathaniel Morgan, Tina Li, et al.

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report

Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.

Uncertainty-Aware Knowledge Transformers for Peer-to-Peer Energy Trading with Multi-Agent Reinforcement Learning

Reinforcement Learning

Mian Ibad Ali Shah, Enda Barrett, Karl Mason

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

Image Generation

Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

Semantic Segmentation

Hayeon Kim, Ji Ha Jang, Se Young Chun

WebShaper: Agentically Data Synthesizing via Information-Seeking
Formalization

Retrieval-Augmented Generation

Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.

The Invisible Leash: Why RLVR May Not Escape Its Origin

Reinforcement Learning

Fang Wu, Weihao Xuan, Ximing Lu, et al.

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

Reinforcement Learning

Object Detection

Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via
Context-Aware Multi-Stage Policy Optimization

Supervised Fine-Tuning

Xingxuan Li, Yao Xiao, Dianwen Ng, et al.

Design of intrinsically disordered region binding proteins

Kejia Wu, et al

An All-Atom Generative Model for Designing Protein Complexes

Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, et al.

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

Supervised Fine-Tuning

Fei Zhao, Chonggang Lu, Yue Wang, et al.

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Image Generation

Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.

Mono-InternVL-1.5: Towards Cheaper and Faster Monolithic Multimodal Large Language Models

Gen Luo, Wenhan Dou, Wenhao Li, et al.

Franca: Nested Matryoshka Clustering for Scalable Visual Representation
Learning

Computer Vision

Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.

Decoupling Knowledge and Reasoning in LLMs: An Exploration Using Cognitive Dual-System Theory

Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny

RAVine: Reality-Aligned Evaluation for Agentic Search

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

DesignLab: Designing Slides Through Iterative Detection and Correction

Yume: An Interactive World Generation Model

Pixels, Patterns, but No Poetry: To See The World like Humans

MedChatZH: a Better Medical Adviser Learns from Better Instructions

Constructing Ophthalmic MLLM for Positioning-diagnosis Collaboration Through Clinical Cognitive Chain Reasoning

HySafe-AI: Hybrid Safety Architectural Analysis Framework for AI Systems: A Case Study

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-thinking Reasoning

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning

Step-Audio 2 Technical Report

Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report

Uncertainty-Aware Knowledge Transformers for Peer-to-Peer Energy Trading with Multi-Agent Reinforcement Learning

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization

The Invisible Leash: Why RLVR May Not Escape Its Origin

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Design of intrinsically disordered region binding proteins

An All-Atom Generative Model for Designing Protein Complexes

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Mono-InternVL-1.5: Towards Cheaper and Faster Monolithic Multimodal Large Language Models

Franca: Nested Matryoshka Clustering for Scalable Visual Representation Learning

Decoupling Knowledge and Reasoning in LLMs: An Exploration Using Cognitive Dual-System Theory

Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny

RAVine: Reality-Aligned Evaluation for Agentic Search

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

DesignLab: Designing Slides Through Iterative Detection and Correction

Yume: An Interactive World Generation Model

Pixels, Patterns, but No Poetry: To See The World like Humans

MedChatZH: a Better Medical Adviser Learns from Better Instructions

Constructing Ophthalmic MLLM for Positioning-diagnosis Collaboration Through Clinical Cognitive Chain Reasoning

HySafe-AI: Hybrid Safety Architectural Analysis Framework for AI Systems: A Case Study

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-thinking Reasoning

Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers

MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning

Step-Audio 2 Technical Report

Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning

Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report

Uncertainty-Aware Knowledge Transformers for Peer-to-Peer Energy Trading with Multi-Agent Reinforcement Learning

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

Robust 3D-Masked Part-level Editing in 3D Gaussian Splatting with Regularized Score Distillation Sampling

WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization

The Invisible Leash: Why RLVR May Not Escape Its Origin

GUI-G^2: Gaussian Reward Modeling for GUI Grounding

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Design of intrinsically disordered region binding proteins

An All-Atom Generative Model for Designing Protein Complexes

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Mono-InternVL-1.5: Towards Cheaper and Faster Monolithic Multimodal Large Language Models

Franca: Nested Matryoshka Clustering for Scalable Visual Representation Learning