项目名称: 基于波内频率调制的音色模型研究以及在单通道音源分离中的应用

项目编号: No.61501410

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 无线电电子学、电信技术

项目作者: 王雨田

作者单位: 中国传媒大学

项目金额: 19万元

中文摘要: 非线性欠定音源分离技术是音频技术中的热点和难点问题之一。本课题针对音色的非线性本质,从非线性信号的波内频率调制现象入手,对乐器声音信号的频率结构进行分析,通过Hilbert-Huang Transform得到对信号的非线性表征,并以此为基础提出新的音色模型。我们的初步研究结果表明,这种新的音色模型可以将音源的非线性部分转化为线性部分,从而将大大提高非线性欠定音源分离的效果和鲁棒性。本课题的研究对于音乐信息理论,核心软件产品和新一代音频编码技术等方面具有重要的意义。

中文关键词: 音色模型;音色模型;贝叶斯蒙特卡罗方法;单通道音源分离

英文摘要: The under-determined blind source separation is one of the most important problem of audio signal processing technology. In our work, we use a time-frequency joint analysis method named Hilbert Huang Transform (HHT) to review the instruments sound signal structure and find out a novel timbre expression based on the intra-wave modulation. Furthermore, a novel timbre model based on Intra-wave Frequency Modulation is developed. The tentative experiments show that the model can transfer the nonlinear part of the signal into linear expression, which will improve the results and performance of the under-determined blind source separation. Our work has the potential to benefit music information theory, core software production and next generation audio code technology.

英文关键词: timbre model;intra-wave frequency modulation;Bayesian Monte Carlo method;polyphony source separation

成为VIP会员查看完整内容
0

相关内容

基于文档的对话技术研究
专知会员服务
20+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
36+阅读 · 2022年2月7日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
56+阅读 · 2021年4月20日
专知会员服务
15+阅读 · 2021年3月26日
基于生理信号的情感计算研究综述
专知会员服务
66+阅读 · 2021年2月9日
百度事件图谱技术与应用
专知会员服务
59+阅读 · 2020年12月30日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
43+阅读 · 2020年9月8日
基于文档的对话技术研究
专知
2+阅读 · 2022年2月20日
一文带你了解语音信号处理技术
PaperWeekly
9+阅读 · 2022年1月26日
你的哪类电子产品换新频率最高?
ZEALER订阅号
0+阅读 · 2022年1月11日
语音合成:模拟最像人类声音的系统
PaperWeekly
2+阅读 · 2021年11月30日
Interspeech 2019 | 基于多模态对齐的语音情感识别
AI科技评论
23+阅读 · 2019年9月21日
【工业智能】风机齿轮箱故障诊断 — 基于振动信号
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Differentiable Time-Frequency Scattering in Kymatio
Arxiv
0+阅读 · 2022年4月19日
Arxiv
1+阅读 · 2022年4月19日
Deformable Style Transfer
Arxiv
14+阅读 · 2020年3月24日
小贴士
相关VIP内容
基于文档的对话技术研究
专知会员服务
20+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
36+阅读 · 2022年2月7日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
56+阅读 · 2021年4月20日
专知会员服务
15+阅读 · 2021年3月26日
基于生理信号的情感计算研究综述
专知会员服务
66+阅读 · 2021年2月9日
百度事件图谱技术与应用
专知会员服务
59+阅读 · 2020年12月30日
【ACM MM2020】跨模态分布匹配的半监督多模态情感识别
专知会员服务
43+阅读 · 2020年9月8日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
微信扫码咨询专知VIP会员