6 个月前

摘要

在本研究中，我们提出了一种新的谱聚类框架，能够在说话人辨识（speaker diarization）任务中自动调节聚类算法的参数。该框架利用归一化最大特征间隙（Normalized Maximum Eigengap, NME）值，无需在开发集上进行参数调优，即可自动估计聚类数量以及谱聚类过程中邻接矩阵每行元素阈值的参数。尽管采用这种“免调参”的方法，我们在多个评估集上的表现仍与传统聚类方法相当，甚至更优。传统方法通常依赖于精细的参数调优和开发数据。在著名的CALLHOME评估集上，说话人错误率（speaker error rate）相对降低了17%，充分验证了所提出的自适应调参谱聚类方法的有效性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

摘要

在本研究中，我们提出了一种新的谱聚类框架，能够在说话人辨识（speaker diarization）任务中自动调节聚类算法的参数。该框架利用归一化最大特征间隙（Normalized Maximum Eigengap, NME）值，无需在开发集上进行参数调优，即可自动估计聚类数量以及谱聚类过程中邻接矩阵每行元素阈值的参数。尽管采用这种“免调参”的方法，我们在多个评估集上的表现仍与传统聚类方法相当，甚至更优。传统方法通常依赖于精细的参数调优和开发数据。在著名的CALLHOME评估集上，说话人错误率（speaker error rate）相对降低了17%，充分验证了所提出的自适应调参谱聚类方法的有效性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

基于归一化最大特征值间距的LLM自动调优谱聚类用于说话人分离

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

基于归一化最大特征值间距的LLM自动调优谱聚类用于说话人分离

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

基于归一化最大特征值间距的LLM自动调优谱聚类用于说话人分离

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

摘要

用 AI 构建 AI

HyperAI Newsletters