HyperAIHyperAI

Command Palette

Search for a command to run...

StreakMind:利用自动化数据库集成进行天文图像中卫星条纹的AI检测与分析

Rafael Carrillo René Duffard Pablo García-Martín Javier Romero Nicolás Morales Luis Gonçalves

摘要

人造卫星和空间碎片对天文图像的污染日益严重,不仅干扰科学巡天观测,还产生了大量带有拖尾痕迹的曝光图像。随着数据量的激增,人工逐张检查已不再具有可行性,因此,实现对拖尾痕迹的可靠识别与特征提取,已成为数据质量控制及近地轨道物体监测的关键环节。本文提出了一种名为 StreakMind 的自动化流程(pipeline),旨在检测天文图像中的近地天体(NEOs)和卫星拖尾,提取其几何特征,并与已知的轨道物体进行交叉匹配(cross-identification)。该系统将所有推理结果整合至结构化数据库中,适用于大规模巡天项目。我们基于包含 2335 张图像的混合人工与合成数据集,训练了一个 YOLO-OBB 模型,用于检测经过处理的 FITS 帧中的拖尾痕迹。随后,通过几何优化、帧间关联、卫星交叉识别以及基于高斯分布的置信度评分,生成最终识别结果,并存储于标准化的关系型数据库中。本研究利用拉萨格拉天文台(L98)搭载 Celestron C14+Fastar 望远镜获取的图像,对自动化的拖尾检测与特征提取方法进行了开发与测试。在测试集上,该模型实现了 94% 的精确率(precision)和 97% 的召回率(recall)。

一句话总结

StreakMind 是一个自动化流水线,采用在包含 2335 张图像的人工 - 合成混合数据集上训练的 YOLO-OBB 模型,用于检测和表征处理后的 FITS 帧中的卫星条纹和近地物体,与已知轨道物体进行交叉识别,并将结果集成到标准化关系数据库中以支持数据质量控制和轨道监测,在使用 Celestron C14+Fastar 望远镜获取的拉萨格拉天文台测试数据上实现了 94% 的精确率和 97% 的召回率。

核心贡献

  • 本工作提出了 StreakMind,这是一个端到端流水线,旨在检测地面天文图像中的线性条纹,细化其几何形状,并使用外部星历交叉识别候选人造物体。该系统将测量标准化为小行星中心风格的记录,并将所有输出集成到适合大规模分析的关系数据库中。
  • YOLO-OBB 模型是在包含 2335 张图像的人工 - 合成混合数据集上训练的,用于检测处理后的 FITS 帧中的条纹。应用帧间关联和高斯置信度评分以生成最终识别结果。
  • 使用 Celestron C14+Fastar 望远镜在拉萨格拉天文台获取的图像用于开发和测试自动条纹检测方法。该模型在测试集上实现了 94% 的精确率和 97% 的召回率。

引言

广角天文调查现在产生大量受人造卫星和空间碎片污染的图像,使得近地物体检测和轨道监测的人工检查不可行。虽然现有的检测方法可以识别线性特征,但它们通常缺乏大规模数据库管理和精确几何表征的稳健端到端集成。作者提出了 StreakMind,这是一个自动化流水线,利用在人工和合成混合数据上训练的 YOLO-OBB 模型来检测和表征线性条纹。该系统细化几何测量,关联连续帧中的检测,并在将所有输出集成到标准化关系数据库之前,根据外部星历交叉识别候选对象。

数据集

数据集组成与来源

  • 作者结合了来自拉萨格拉天文台的 2055 张真实天文 FITS 图像和 280 张合成生成的图像。
  • 真实观测于 2019 年 4 月至 6 月进行,使用配备 SBIG ST-10 3 CCD 相机的 Celestron C14+Fastar 望远镜。
  • 图像以 2x2 合并方式获取,以减少数据量并便于夜间传输。
  • 引入合成数据专门用于通过增加长条纹的表示来平衡数据集。

各子集的关键细节

  • 真实图像分辨率为 1092 x 736 像素,包含 765 个手动识别的条纹,长度范围从 8.5 到 1161.7 像素。
  • 图像根据从条纹长度分布的第 75 百分位数得出的 269.1 像素阈值进行分类。
  • 此分类产生 1523 张无条纹图像、412 张短条纹图像和 120 张长条纹图像。
  • 合成子集包括 280 张图像,其中条纹最小长度为 269 像素,并遵循高斯角度分布。

训练划分与数据使用

  • 最终数据集使用分层采样划分为训练集(70%)、验证集(20%)和测试集(10%)。
  • 分层确保每个子集保留原始短条纹、长条纹和无条纹图像的分类分布。
  • FITS 文件转换为 PNG 格式并进行 ZScale 归一化,以增强微弱结构的对比度。
  • 通过 Tycho Tracker 软件进行手动标记,为每个检测到的条纹生成定向边界框 (OBBs)。

处理与元数据构建

  • 图像对齐到公共参考帧,导致由望远镜指向变化引起的死区边缘。
  • 在转换为 PNG 期间应用垂直翻转校正,以将 FITS 原点与标准 PNG 光栅惯例对齐。
  • 使用 40 像素边缘阈值来确定条纹相对于图像边框是完整还是不完整。
  • 元数据构建包括天文台代码、望远镜详细信息、天体测量坐标以及合成的 MPC 格式观测记录。

方法

StreakMind 流水线的核心建立在用于实时目标检测的 You Only Look Once (YOLO) 系列模型之上,具体利用 2024 年引入的 YOLO11 架构。选择这种单阶段检测器是因为它能够在一个传递中预测目标位置和类别,这对于高效处理大量天文图像至关重要。该模型保留了标准的三部分结构:用于特征提取的主干、用于多尺度特征组合的颈部以及用于最终预测的头部。针对此特定应用,网络配置为输出定向边界框 (OBBs),而不是标准轴对齐框,从而能够准确捕捉线性条纹的任意方向。

这些检测的几何表示是流水线准确性的核心。如下图中所示,OBB 由四个顶点(v1v_1v1v4v_4v4)、一个中心点(ccc)、一个长度(LLL)、一个宽度(www)以及相对于图像轴线的方向角(θ\thetaθ)定义。

虽然 YOLO11 模型提供了初始检测,但作者指出标准回归器通常会低估长条纹的真实范围。为了缓解这一问题,实施了一个光度预分析阶段以纵向扩展 OBBs。此过程涉及将图像区域转换为光度增强格式,并沿主轴采样一维通量分布 I(s)I(s)I(s)。只要测量的通量保持在由 I(s)>Ibg+kσI(s) > I_{\mathrm{bg}} + k \sigmaI(s)>Ibg+kσ 定义的动态阈值之上,框就会迭代扩展,其中 IbgI_{\mathrm{bg}}Ibg 是背景电平,σ\sigmaσ 是噪声估计。这确保了捕捉到条纹的微弱翼部,如图中扩展的绿色虚线边界所示。

训练过程利用最初在 DOTAv1.0 数据集上预训练的 YOLO11 模型,然后在包含真实和合成生成的天文图像的增强数据集上进行微调。训练在基于云的 NVIDIA A100 GPU 上进行。检测和几何细化之后,流水线采用基于星表的过滤阶段,通过与 Gaia DR3 星表交叉匹配来消除由恒星衍射尖峰引起的误报。最后,细化的检测经过帧间关联,利用几何外推和时间元数据链接连续帧中的条纹,从而实现移动物体的识别。

实验

评估框架结合了在保留数据集上的定量测试和定性视觉检查,以验证受控天文条件下的检测准确性。随后对真实观测数据的应用证实,在可扩展性、对微弱特征的敏感性以及可重复的数据库集成方面,自动化流水线优于人工检查。几何表征证明在大多数条纹长度上都很稳健,确立了该系统作为处理大量调查数据的可行端到端解决方案。

该表格详细说明了数据集的组成,划分为训练、验证和测试子集,按条纹的存在和长度或无条纹进行分类。无条纹的背景类在所有子集中占数据的大多数,而长条纹和短条纹代表较小且平衡的部分。这种一致的划分确保模型在具有代表性的正检测和负背景帧样本上进行训练和测试。无条纹类在每个子集中包含大多数样本。长条纹和短条纹类别在整个数据集划分中保持一致的相对比例。该分布确保了条纹类型和背景图像在模型评估中的平衡表示。

该表格显示了检测到的条纹长度(像素)的百分位数分布,范围从第 25 百分位数到第 95 百分位数。文本指出,该模型对于长达图像宽度一半的条纹表现稳健,而更长的条纹需要额外的几何后处理。此分布反映了观测数据中遇到的各种条纹大小。数据显示条纹长度存在显著差异,上百分位数代表比中位数长得多的特征。几何准确性报告表明,对于长度分布的低到中等范围内的条纹非常可靠。对于最长的条纹,检测稳定性得以保持,但需要特定的基于光度的后处理步骤。

该表格详细说明了实验所用数据集的组成,划分为训练、验证和测试子集。数据严重不平衡,大多数样本在所有划分中都属于无条纹类。训练、验证和测试集中条纹长度和无条纹图像的分布保持一致。无条纹类是最普遍的类别,占每个子集数据的大多数。短条纹是第二常见的类别,占总样本的相当一部分。长条纹是最罕见的类别,在所有子集的图像中出现的比例非常小。

评估设置包括训练、验证和测试子集,分布一致,无条纹背景类占主导地位,同时伴有平衡的短条纹和长条纹部分。实验结果表明,该模型对于低到中等长度范围内的条纹实现了稳健的几何准确性,通常延伸至图像宽度的一半。虽然对于最长条纹的检测稳定性得以保持,但这些实例需要特定的几何和光度后处理步骤,以确保在整个数据频谱上实现可靠的性能。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
StreakMind:利用自动化数据库集成进行天文图像中卫星条纹的AI检测与分析 | 论文 | HyperAI超神经