Reference-Based Speech Enhancement via Feature Alignment and Fusion Network

Introduction

This repo provides a PyTorch implementation of the paper: Reference-Based Speech Enhancement via Feature Alignment and Fusion Network.

Requirements

pytorch>=1.10.0

torchaudio>=0.10.0

numpy>=1.21.0

tqdm>=4.64.0

pesq>=0.0.3

Usage

Replace the vbd dataset path in dataset.py and ref_prepare.py .
python ref_prepare.py to generate 15s reference clips.
python test_stage_1.py to get the result of one stage model.
python test_stage_2.py to get the result of two stage model.

Citation

If you find the code useful in your research, please cite:

@inproceedings{yue2022reference,
  title={Reference-based speech enhancement via feature alignment and fusion network},
  author={Yue, Huanjing and Duo, Wenxin and Peng, Xiulian and Yang, Jingyu},
  booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
  volume={36},
  number={10},
  pages={11648--11656},
  year={2022}
}

LICENSE

MIT-LICENSE

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
figure		figure
LICENSE		LICENSE
README.md		README.md
ckpt_1.pth		ckpt_1.pth
ckpt_2.pth		ckpt_2.pth
complex_nn.py		complex_nn.py
dataset.py		dataset.py
model.py		model.py
ref_prepare.py		ref_prepare.py
requirements.txt		requirements.txt
test_stage_1.py		test_stage_1.py
test_stage_2.py		test_stage_2.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reference-Based Speech Enhancement via Feature Alignment and Fusion Network

Introduction

Requirements

Usage

Citation

LICENSE

About

Releases

Packages

Languages

License

HieDean/FAF-Net

Folders and files

Latest commit

History

Repository files navigation

Reference-Based Speech Enhancement via Feature Alignment and Fusion Network

Introduction

Requirements

Usage

Citation

LICENSE

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages