HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Jupiter: Enhancing LLM Data Analysis Capabilities via Notebook and Inference-Time Value-Guided Search

Jupiter: Enhancing LLM Data Analysis Capabilities via Notebook and Inference-Time Value-Guided Search

Shuocheng Li, Yihao Liu, Silin Du, et al.

Hunyuan-MT Technical Report

Hunyuan-MT Technical Report

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM: Native 3D Part Segmentation

Computer Vision

Semantic Segmentation

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making
through Multi-Turn Reinforcement Learning

Reinforcement Learning

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3D and 4D World Modeling: A Survey

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

RewardDance: Reward Scaling in Visual Generation

Preference Modeling

Image Generation

Jie Wu, Yu Gao, Zilyu Ye, et al.

Sharing is Caring: Efficient LM Post-Training with Collective RL
Experience Sharing

Reinforcement Learning

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG: Agentic Construction and Evaluation of Financial Knowledge Graphs

Document Understanding

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

A Survey of Reinforcement Learning for Large Reasoning Models

Reinforcement Learning

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

Measuring and mitigating overreliance is necessary for building human-compatible AI

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1: A Vision-Language-Action Model Bridging Understanding and Generation to Actions

Embodied Intelligence

Qi Lv, Weijie Kong, Hao Li, et al.

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Diffusion Model

Image Generation

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

Reconstruction Alignment Improves Unified Multimodal Models

Image Generation

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual
Search

Xin Lai, Junyi Li, Wei Li, et al.

Visual Representation Alignment for Multimodal Large Language Models

Multimodal Representation

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

Reinforcement Learning

Supervised Fine-Tuning

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue: A Large-scale Cantonese Speech Corpus with Multi-dimensional Annotation

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner: MLLM-Powered Spreadsheet Layout Generation with Rule-Based and Vision-Based Reflection

Document Understanding

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

Autonomous Code Evolution Meets NP-Completeness

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

Reinforcement Learning Foundations for Deep Research Systems: A Survey

Reinforcement Learning

Wenjun Li, Zhi Chen, Jingru Lin, et al.

Reinforced Visual Perception with Tools

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

Does DINOv3 Set a New Medical Vision Standard?

Computer Vision

Medical Imaging

Che Liu, Yinda Chen, Haoyuan Shi, et al.

Revolutionizing Reinforcement Learning Framework for Diffusion Large
Language Models

Supervised Fine-Tuning

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents

Supervised Fine-Tuning

Junteng Liu, Yunji Li, Chi Zhang, et al.

Reverse-Engineered Reasoning for Open-Ended Generation

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC: Cognitive Orchestration through Dynamic Knowledge Alignment in Multi-Agent LLM Collaboration

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE: Controlled Unlearning for Robust Embeddings -- Mitigating Conceptual Shortcuts in Pre-Trained Language Models

Natural Language Processing

Supervised Fine-Tuning

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting

Visual Question Answering

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT: Lighting Estimation with Video Diffusion Transformer

Diffusion Model

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning

Visual Question Answering

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

Set Block Decoding is a Language Model Inference Accelerator

Text Generation

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

Symbolic Graphics Programming with Large Language Models

Code Generation

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

Jupiter: Enhancing LLM Data Analysis Capabilities via Notebook and Inference-Time Value-Guided Search

Jupiter: Enhancing LLM Data Analysis Capabilities via Notebook and Inference-Time Value-Guided Search

Shuocheng Li, Yihao Liu, Silin Du, et al.

Hunyuan-MT Technical Report

Hunyuan-MT Technical Report

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM: Native 3D Part Segmentation

Computer Vision

Semantic Segmentation

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making
through Multi-Turn Reinforcement Learning

Reinforcement Learning

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3D and 4D World Modeling: A Survey

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

RewardDance: Reward Scaling in Visual Generation

Preference Modeling

Image Generation

Jie Wu, Yu Gao, Zilyu Ye, et al.

Sharing is Caring: Efficient LM Post-Training with Collective RL
Experience Sharing

Reinforcement Learning

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG: Agentic Construction and Evaluation of Financial Knowledge Graphs

Document Understanding

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

A Survey of Reinforcement Learning for Large Reasoning Models

Reinforcement Learning

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

Measuring and mitigating overreliance is necessary for building human-compatible AI

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1: A Vision-Language-Action Model Bridging Understanding and Generation to Actions

Embodied Intelligence

Qi Lv, Weijie Kong, Hao Li, et al.

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Diffusion Model

Image Generation

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

Reconstruction Alignment Improves Unified Multimodal Models

Image Generation

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual
Search

Xin Lai, Junyi Li, Wei Li, et al.

Visual Representation Alignment for Multimodal Large Language Models

Multimodal Representation

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

Reinforcement Learning

Supervised Fine-Tuning

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue: A Large-scale Cantonese Speech Corpus with Multi-dimensional Annotation

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner: MLLM-Powered Spreadsheet Layout Generation with Rule-Based and Vision-Based Reflection

Document Understanding

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

Autonomous Code Evolution Meets NP-Completeness

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

Reinforcement Learning Foundations for Deep Research Systems: A Survey

Reinforcement Learning

Wenjun Li, Zhi Chen, Jingru Lin, et al.

Reinforced Visual Perception with Tools

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

Does DINOv3 Set a New Medical Vision Standard?

Computer Vision

Medical Imaging

Che Liu, Yinda Chen, Haoyuan Shi, et al.

Revolutionizing Reinforcement Learning Framework for Diffusion Large
Language Models

Supervised Fine-Tuning

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents

Supervised Fine-Tuning

Junteng Liu, Yunji Li, Chi Zhang, et al.

Reverse-Engineered Reasoning for Open-Ended Generation

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC: Cognitive Orchestration through Dynamic Knowledge Alignment in Multi-Agent LLM Collaboration

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE: Controlled Unlearning for Robust Embeddings -- Mitigating Conceptual Shortcuts in Pre-Trained Language Models

Natural Language Processing

Supervised Fine-Tuning

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting

Visual Question Answering

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT: Lighting Estimation with Video Diffusion Transformer

Diffusion Model

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning

Visual Question Answering

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

Set Block Decoding is a Language Model Inference Accelerator

Text Generation

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

Symbolic Graphics Programming with Large Language Models

Code Generation

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

P3-SAM: Native 3D Part Segmentation

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

3D and 4D World Modeling: A Survey

RewardDance: Reward Scaling in Visual Generation

Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing

FinReflectKG: Agentic Construction and Evaluation of Financial Knowledge Graphs

A Survey of Reinforcement Learning for Large Reasoning Models

Measuring and mitigating overreliance is necessary for building human-compatible AI

F1: A Vision-Language-Action Model Bridging Understanding and Generation to Actions

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Reconstruction Alignment Improves Unified Multimodal Models

Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search

Visual Representation Alignment for Multimodal Large Language Models

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

WenetSpeech-Yue: A Large-scale Cantonese Speech Corpus with Multi-dimensional Annotation

SheetDesigner: MLLM-Powered Spreadsheet Layout Generation with Rule-Based and Vision-Based Reflection

Autonomous Code Evolution Meets NP-Completeness

Reinforcement Learning Foundations for Deep Research Systems: A Survey

Reinforced Visual Perception with Tools

Does DINOv3 Set a New Medical Vision Standard?

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents

Reverse-Engineered Reasoning for Open-Ended Generation

OSC: Cognitive Orchestration through Dynamic Knowledge Alignment in Multi-Agent LLM Collaboration

CURE: Controlled Unlearning for Robust Embeddings -- Mitigating Conceptual Shortcuts in Pre-Trained Language Models

MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting

LuxDiT: Lighting Estimation with Video Diffusion Transformer

WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning

Set Block Decoding is a Language Model Inference Accelerator

Symbolic Graphics Programming with Large Language Models

P3-SAM: Native 3D Part Segmentation

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning

3D and 4D World Modeling: A Survey

RewardDance: Reward Scaling in Visual Generation

Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing

FinReflectKG: Agentic Construction and Evaluation of Financial Knowledge Graphs

A Survey of Reinforcement Learning for Large Reasoning Models

Measuring and mitigating overreliance is necessary for building human-compatible AI

F1: A Vision-Language-Action Model Bridging Understanding and Generation to Actions

UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward

Reconstruction Alignment Improves Unified Multimodal Models

Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search

Visual Representation Alignment for Multimodal Large Language Models

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

WenetSpeech-Yue: A Large-scale Cantonese Speech Corpus with Multi-dimensional Annotation

SheetDesigner: MLLM-Powered Spreadsheet Layout Generation with Rule-Based and Vision-Based Reflection

Autonomous Code Evolution Meets NP-Completeness

Reinforcement Learning Foundations for Deep Research Systems: A Survey

Reinforced Visual Perception with Tools

Does DINOv3 Set a New Medical Vision Standard?

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents

Reverse-Engineered Reasoning for Open-Ended Generation

OSC: Cognitive Orchestration through Dynamic Knowledge Alignment in Multi-Agent LLM Collaboration

CURE: Controlled Unlearning for Robust Embeddings -- Mitigating Conceptual Shortcuts in Pre-Trained Language Models

MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting

LuxDiT: Lighting Estimation with Video Diffusion Transformer

WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning

Set Block Decoding is a Language Model Inference Accelerator

Symbolic Graphics Programming with Large Language Models