2025年基于工业音频的降噪算法

科技前沿 • 2025-04-11 10:20 • 阅读 42

基于工业音频的降噪算法基于 IBM 的音频降噪算法首先本文主要是介绍工业音频的数据处理方式跟语音的处理方式有些许的不同工业上常见的噪声包括但不限于一下设备报警声音人声排风扇声杂物托运和设备检修等等当我们采集目标音频时这些都会噪声都会成为一定的干扰对工业上监控设备运行状态产品质量具有很大的挑战

大家好，我是讯享网，很高兴认识大家。

基于IBM的音频降噪算法

首先，本文主要是介绍工业音频的数据处理方式，跟语音的处理方式有些许的不同。工业上常见的噪声包括但不限于一下：设备报警声音、人声、排风扇声、杂物托运和设备检修等等，当我们采集目标音频时，这些都会噪声都会成为一定的干扰，对工业上监控设备运行状态、产品质量具有很大的挑战。文献上对工业音频异常分析相对较少，因此，本文针对以上问题，先简单介绍一下一个比较实用的音频降噪算法。 其次，工业音频的特点可以分为：连续和离散 最后，工业异常音频太少且不好模拟。

算法思想

讯享网语音在时频域上是稀疏分布的，很多噪声相对于正常音频是离散的，因此大多数噪声的时频单元上的信噪比极高或极低。IBM 是对这种现实情况的简化描述，将连续的时频单元信噪比离散化为两种状态 1 和0，即，将噪声和正常音频二值化，形成一个mask掩膜，在一个时频单元内：如果语音占主导（高信噪比），则被标记为 1；反之如果噪声占主导（低信噪比），则标记为 0。最后将 IBM 和带噪语音相乘，实际上就是将低信噪比的时频单元置零，以此达到消除噪声的目的

Python实战

// feature

讯享网def generateDataset(): mix, sr = librosa.load("./noisy.wav", sr=32000) clean,sr = librosa.load("./clean.wav", sr=32000) win_length = 256 hop_length = 128 nfft = 512 mix_spectrum = librosa.stft(mix, win_length=win_length, hop_length=hop_length, n_fft=nfft) clean_spectrum = librosa.stft(clean, win_length=win_length, hop_length=hop_length, n_fft=nfft) mix_mag = np.abs(mix_spectrum).T clean_mag = np.abs(clean_spectrum).T frame_num = clean_mag.shape[0] - frame_sub # mix_mag.shape[0] - frame_sub feature = np.zeros([frame_num, dim*frame_len]) k = 0 for i in range(frame_num-frame_sub): frame = mix_mag[k:k+frame_len] feature[i] = np.reshape(frame, dim*frame_len) k += 1 # print(k) if len(clean_mag) > len(mix_mag): snr = np.divide(clean_mag[:len(mix_mag)], mix_mag) if len(clean_mag) <= len(mix_mag): snr = np.divide(clean_mag, mix_mag[:len(clean_mag)]) mask = np.around(snr, 0) mask[np.isnan(mask)] = 1 mask[mask > 1] = 1 label = mask[2:-2] ss = StandardScaler() feature = ss.fit_transform(feature) return feature, label

// DNN

讯享网model = Sequential() model.add(Dense(10240, input_dim=dim*frame_len)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(5120)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(2048)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(2048)) model.add(BatchNormalization()) model.add(LeakyReLU(alpha=0.1)) model.add(Dropout(0.1)) model.add(Dense(dim)) model.add(BatchNormalization()) model.add(Activation('sigmoid')) return model

注意事项

frame_num，frame_sub，frame = mix_mag[k:k+frame_len] 相互关联，不对应的话就会报错

结束

讯享网今天先到这里，过几天再补充，大家有什么问题，可以相互交流

小讯

2025年“OneNote由于某种原因,无法连接到服务器。请尝试检查您的连接以查看服务器是否可用。”的解决方案

上一篇 2025-01-25 13:33

神经网络 II：神经元模型

下一篇 2025-01-28 19:23

2025年“OneNote由于某种原因,无法连接到服务器。请尝试检查您的连接以查看服务器是否可用。”的解决方案 1735985750
redis槽道原理 1735985749
2025年初二因式分解奥数竞赛题_初中数学培优七年级下第九讲因式分解的应用许多竞赛题讲解... 1735985749
什么是恒流二极管：工作原理和应用 1735985748
2025年EAST系统主要功能及作用 1735985748
模式识别：第一章概论 1735985748
2025年emv交易流程介绍,简易波动指标EMV基础知识介绍：EMV的计算公式_EMV应用法则 1735985747
802.11X用户身份验证 EAPOL 1735985747
直播类 APP 项目开发实战（原理篇） 1735985745
神经网络 II：神经元模型 1735985750
最优解的理解 1735985751
无处不在的蓝牙—真的很危险吗？ 1735985751
for、while、do while循环的流程图表示及相应continue、break的流程图表示 1735985752
Redis String、List、Set、Hash、ZSet常用命令 1735985753
2025年Python实战：python操作GZ文件，实现文件压缩与解压缩 1735985753
Linux内核超级装备eBPF技术详细研究 1735985753
2025年硬件知识：条码打印机5大接口类型介绍 1735985755
2025年如何外包软件开发 1735985755

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/23561.html