HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned

Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned

Preference Modeling

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification

MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification

Convolutional Neural Network

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into
Multimodal LLMs at Scale

Visual Question Answering

Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.

ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

Image Generation

Diffusion Model

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

Toward long-range ENSO prediction with an explainable deep learning model

Convolutional Neural Network

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch: Building Foundation Model for Scientific Computing

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

VA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

Hao Chen, Han Tao, Guo Song, et al.

UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding

Supervised Fine-Tuning

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework

Natural Language Processing

Kuiye Ding, Fanda Fan, Yao Wang, et al.

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token
Compression across Images, Videos, and Audios

Computer Vision

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker: A Family of Efficient Large Language Models Natively
Trained for Local Deployment

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

Reconstructing 4D Spatial Intelligence: A Survey

Computer Vision

Video Understanding

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL: Unleashing the Power of Representation-level Task Saliency for
Multi-Task Learning

Multi-Task Learning

Neural Networks

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B: Structured Video Comprehension of Real-World
Shorts

Video Understanding

Video Captioning

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agentic Reinforced Policy Optimization

Reinforcement Learning

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration

Retrieval-Augmented Generation

Keyan Ding, Jing Yu, Junjie Huang, et al.

Specification Self-Correction: Mitigating In-Context Reward Hacking
Through Test-Time Refinement

Víctor Gallego

PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving

Autonomous Driving

Computer Vision

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

Chat with AI: The Surprising Turn of Real-time Video Communication from Human to AI

Video Understanding

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI: Hierarchical Multi-Platform Evaluation Framework for GUI
Agents

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

Deep Researcher with Test-Time Diffusion

Retrieval-Augmented Generation

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment

Medical Imaging

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth?

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Reinforcement Learning

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

Captain Cinema: Towards Short Movie Generation

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

NABLA: Neighborhood Adaptive Block-Level Attention

Video Generation

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned

Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned

Preference Modeling

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification

MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification

Convolutional Neural Network

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into
Multimodal LLMs at Scale

Visual Question Answering

Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.

ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

Image Generation

Diffusion Model

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

Toward long-range ENSO prediction with an explainable deep learning model

Convolutional Neural Network

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch: Building Foundation Model for Scientific Computing

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

VA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

Hao Chen, Han Tao, Guo Song, et al.

UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding

Supervised Fine-Tuning

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework

Natural Language Processing

Kuiye Ding, Fanda Fan, Yao Wang, et al.

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token
Compression across Images, Videos, and Audios

Computer Vision

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker: A Family of Efficient Large Language Models Natively
Trained for Local Deployment

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

Reconstructing 4D Spatial Intelligence: A Survey

Computer Vision

Video Understanding

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL: Unleashing the Power of Representation-level Task Saliency for
Multi-Task Learning

Multi-Task Learning

Neural Networks

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B: Structured Video Comprehension of Real-World
Shorts

Video Understanding

Video Captioning

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agentic Reinforced Policy Optimization

Reinforcement Learning

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration

Retrieval-Augmented Generation

Keyan Ding, Jing Yu, Junjie Huang, et al.

Specification Self-Correction: Mitigating In-Context Reward Hacking
Through Test-Time Refinement

Víctor Gallego

PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving

Autonomous Driving

Computer Vision

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

Chat with AI: The Surprising Turn of Real-time Video Communication from Human to AI

Video Understanding

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI: Hierarchical Multi-Platform Evaluation Framework for GUI
Agents

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

Deep Researcher with Test-Time Diffusion

Retrieval-Augmented Generation

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment

Medical Imaging

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth?

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Reinforcement Learning

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

Captain Cinema: Towards Short Movie Generation

Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

Hang Yan, Fangzhi Xu, Rongman Xu, et al.

NABLA: Neighborhood Adaptive Block-Level Attention

Video Generation

Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

Toward long-range ENSO prediction with an explainable deep learning model

OmniArch: Building Foundation Model for Scientific Computing

VA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding

DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

SmallThinker: A Family of Efficient Large Language Models Natively Trained for Local Deployment

Reconstructing 4D Spatial Intelligence: A Survey

Rep-MTL: Unleashing the Power of Representation-level Task Saliency for Multi-Task Learning

ARC-Hunyuan-Video-7B: Structured Video Comprehension of Real-World Shorts

Agentic Reinforced Policy Optimization

SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration

Specification Self-Correction: Mitigating In-Context Reward Hacking Through Test-Time Refinement

PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving

Chat with AI: The Surprising Turn of Real-time Video Communication from Human to AI

MMBench-GUI: Hierarchical Multi-Platform Evaluation Framework for GUI Agents

Deep Researcher with Test-Time Diffusion

The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm

MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment

OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth?

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Captain Cinema: Towards Short Movie Generation

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

NABLA: Neighborhood Adaptive Block-Level Attention

HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale

ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels

AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data

Toward long-range ENSO prediction with an explainable deep learning model

OmniArch: Building Foundation Model for Scientific Computing

VA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting

UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding

DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

SmallThinker: A Family of Efficient Large Language Models Natively Trained for Local Deployment

Reconstructing 4D Spatial Intelligence: A Survey

Rep-MTL: Unleashing the Power of Representation-level Task Saliency for Multi-Task Learning

ARC-Hunyuan-Video-7B: Structured Video Comprehension of Real-World Shorts

Agentic Reinforced Policy Optimization

SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration

Specification Self-Correction: Mitigating In-Context Reward Hacking Through Test-Time Refinement

PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving

Chat with AI: The Surprising Turn of Real-time Video Communication from Human to AI

MMBench-GUI: Hierarchical Multi-Platform Evaluation Framework for GUI Agents

Deep Researcher with Test-Time Diffusion

The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm

MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment

OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth?

Hierarchical Budget Policy Optimization for Adaptive Reasoning

Captain Cinema: Towards Short Movie Generation

LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

NABLA: Neighborhood Adaptive Block-Level Attention