HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Main

GPU

Console
Studio
Docs
Pricing

Pulse

News

Resources

Papers
Notebooks
Datasets
Wiki

Benchmarks

SOTA
LLM Models
GPU Leaderboard

Community

Events

Utility

About Terms of Service Privacy Policy
English

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Daily updated cutting-edge AI research papers to help you keep up with the latest AI trends

Build the Future of Artificial Intelligence

About

About Us Support Dataset Help

Products

News Papers Notebooks Datasets Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

Using Learning Progressions to Guide AI Feedback for Science Learning

Using Learning Progressions to Guide AI Feedback for Science Learning

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Embodied Intelligence

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Preference Modeling

Patrick Gerard, Svitlana Volkova

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

Adam Dorian Wong, John D. Hastings

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

The Design Space of Tri-Modal Masked Diffusion Models

Diffusion Model

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Aligning Model-Generated Rubrics with Human Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML Library for NLU

Natural Language Processing

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

Video Generation

Yiying Yang, Wei Cheng, Sijin Chen, et al.

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Image Generation

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Multi-agent cooperation through in-context co-player inference

Reinforcement Learning

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Mode Seeking meets Mean Seeking for Fast Long Video Generation

Video Generation

Diffusion Model

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Code Generation

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Enhancing Spatial Understanding in Image Generation via Reward Modeling

Image Generation

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: Simple Diffusion Language Modeling

Diffusion Model

Text Generation

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Reinforcement Learning

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

Visual Question Answering

You Li, Chi Chen, Yanghao Li, et al.

OmniGAIA: Towards Native Omni-Modal AI Agents

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios

Intelligent Question Answering

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

The Trinity of Consistency as a Defining Principle for General World Models

Multimodal Representation

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

Supervised Fine-Tuning

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model

Diffusion Model

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Reinforcement Learning

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

Diffusion Model

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec: A Hybrid Temporal-Aware Attention Architecture for Long Behavior Sequential Recommendation

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

Using Learning Progressions to Guide AI Feedback for Science Learning

Using Learning Progressions to Guide AI Feedback for Science Learning

Xin Xia, Nejla Yuruk, Yun Wang, et al.

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations

Embodied Intelligence

Xiaomeng Xu, Jisang Park, Han Zhang, et al.

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Preference Modeling

Patrick Gerard, Svitlana Volkova

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

Adam Dorian Wong, John D. Hastings

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

Marc Finzi, Shikai Qiu, Yiding Jiang, et al.

The Design Space of Tri-Modal Masked Diffusion Models

Diffusion Model

Louis Bethune, Victor Turrisi, Bruno Kacper Mlodozeniec, et al.

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

Xinyu Zhu, Yihao Feng, Yanchao Sun, et al.

RubricBench: Aligning Model-Generated Rubrics with Human Standards

Qiyuan Zhang, Junyi Zhou, Yufei Wang, et al.

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

Jiachun Li, Shaoping Huang, Zhuoran Jin, et al.

OpenAutoNLU: Open Source AutoML Library for NLU

Natural Language Processing

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

Video Generation

Yiying Yang, Wei Cheng, Sijin Chen, et al.

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Image Generation

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

Multi-agent cooperation through in-context co-player inference

Reinforcement Learning

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Retrieval-Augmented Generation

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

Mode Seeking meets Mean Seeking for Fast Long Video Generation

Video Generation

Diffusion Model

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Code Generation

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

Enhancing Spatial Understanding in Image Generation via Reward Modeling

Image Generation

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM: Simple Diffusion Language Modeling

Diffusion Model

Text Generation

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Reinforcement Learning

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

Visual Question Answering

You Li, Chi Chen, Yanghao Li, et al.

OmniGAIA: Towards Native Omni-Modal AI Agents

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios

Intelligent Question Answering

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

The Trinity of Consistency as a Defining Principle for General World Models

Multimodal Representation

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

Supervised Fine-Tuning

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model

Diffusion Model

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

Reinforcement Learning

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

Diffusion Model

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec: A Hybrid Temporal-Aware Attention Architecture for Long Behavior Sequential Recommendation

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

The Design Space of Tri-Modal Masked Diffusion Models

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

RubricBench: Aligning Model-Generated Rubrics with Human Standards

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

OpenAutoNLU: Open Source AutoML Library for NLU

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Multi-agent cooperation through in-context co-player inference

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Mode Seeking meets Mean Seeking for Fast Long Video Generation

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Enhancing Spatial Understanding in Image Generation via Reward Modeling

dLLM: Simple Diffusion Language Modeling

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

OmniGAIA: Towards Native Omni-Modal AI Agents

MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

The Trinity of Consistency as a Defining Principle for General World Models

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

HyTRec: A Hybrid Temporal-Aware Attention Architecture for Long Behavior Sequential Recommendation

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence

The Design Space of Tri-Modal Masked Diffusion Models

CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

RubricBench: Aligning Model-Generated Rubrics with Human Standards

MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

OpenAutoNLU: Open Source AutoML Library for NLU

OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

Multi-agent cooperation through in-context co-player inference

ACTIONENGINE: From Reactive to Programmatic GUI Agents via State Machine Memory

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

Mode Seeking meets Mean Seeking for Fast Long Video Generation

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Enhancing Spatial Understanding in Image Generation via Reward Modeling

dLLM: Simple Diffusion Language Modeling

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Imagination Helps Visual Reasoning, But Not Yet in Latent Space

OmniGAIA: Towards Native Omni-Modal AI Agents

MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

The Trinity of Consistency as a Defining Principle for General World Models

GUI-Libra: Training Native GUI Agents to Reason and Act with Action-aware Supervision and Partially Verifiable RL

SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model

ARLArena: A Unified Framework for Stable Agentic Reinforcement Learning

DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

HyTRec: A Hybrid Temporal-Aware Attention Architecture for Long Behavior Sequential Recommendation