由于对数字信号处理方面了解较少,主要使用librosa处理音频
- 分析整个音频,找到节奏区域(能量强度变化最大的区域)(暂未找到适合方法确定节奏区间)
- 在节奏内跟踪节拍,确定卡点时间
- 程序判断beat与演奏者不一定合拍,需对节拍做误差分析
- 节拍的1/4、2/4、3/4、4/4均可能为卡点,将其与信号峰值做交集,为卡点
- 不能判断出哪段音乐更适合卡点
- 准确率不高,容易受杂音干扰,人声影响特别大(尤其是连续的节奏较快的高音)
基于上述问题,深耕《数字信号处理》寻找解决办法
picture_get.py是我在网上随便找的图片爬虫,随便改了一下没图的同学可以参考一下