4 个月前

水声:从倾倒液体中推断物理特性

水声:从倾倒液体中推断物理特性

摘要

我们研究了视听观察与一种日常但引人入胜的活动——液体倾倒——背后的物理原理之间的联系。仅凭液体倒入容器时产生的声音,我们的目标是自动推断出诸如液位、容器形状和大小、倾倒速率以及填满时间等物理特性。为此,我们:(i) 从理论上证明这些特性可以通过基频(音高)来确定;(ii) 使用模拟数据和具有物理启发目标的视觉数据监督训练一个音高检测模型;(iii) 引入一个新的大规模真实倾倒视频数据集,以进行系统性的研究;(iv) 展示训练后的模型确实可以对真实数据推断出这些物理特性;最后,(v) 我们展示了该模型在各种容器形状、其他数据集以及野外YouTube视频中的强大泛化能力。我们的工作展示了对声学、物理学和学习交叉领域中一个狭窄而丰富的问题的深刻理解。它为增强机器人倾倒过程中的多感官感知开辟了应用前景。

代码仓库

bpiyush/SoundOfWater
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
physical-attribute-prediction-on-sound-ofPouringNet
Mean Squared Error: 0.60

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
水声:从倾倒液体中推断物理特性 | 论文 | HyperAI超神经