HyperAIHyperAI

Command Palette

Search for a command to run...

SSRB 半结构化数据自然语言查询数据集

Date

25 天前

Organization

Harbin Institute of Technology, Shenzhen
The Hong Kong Polytechnic University
Tsinghua University(清华大学)

Paper URL

LuMGoG6lBA

License

Apache 2.0

SSRB 是由哈尔滨工业大学(深圳)联合香港理工大学、清华大学等机构于 2025 年发布的一个面向半结构化数据自然语言查询的大规模基准数据集,相关论文成果为 SSRB: Direct Natural Language Querying to Massive Heterogeneous Semi-Structured Data,已入选 NeurIPS 2025 Datasets and Benchmarks,旨在评估和推动模型在复杂自然语言查询条件下对半结构化数据的检索能力。

该数据集包含约 1,400 万条半结构化数据对象和 8,485 条测试查询,覆盖 6 个不同领域,并涉及 99 种不同的模式。数据集中的每条查询均对应对半结构化数据的检索需求,查询条件通常结合精确的字段匹配约束与模糊的语义匹配要求,并可能涉及多个字段及隐式推理,用于系统性评估模型在复杂查询条件下对半结构化数据的检索与理解能力要求。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供