Requirements

This repository is the official implementation of Towards Exact Gradient-based Training on Analog In-memory Computing (arXiv preprint).

Requirements

This project is built on the analog in-memory computing open-source library IBM Analog Hardware Acceleration Kit, AIHWKit.

Conda installation (Recommanded)

To install requirements:

conda create -n analog python=3.10
conda activate analog
conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
conda install -c conda-forge aihwkit-gpu
pip install tensorboard matplotlib numpy

Pip installation

pip install -r requirements.txt

Running

In the bash following commands, replace the ${CUDA_IDX} variable with specific GPU index, e.g.

CUDA_IDX=0

Simulation 1

Figure 1. Simulation 1 compares digital / analog SGD under different learnable rate

python S1-SGD-diff-lr.py

Simulation 2

Figure 3. Comparison between digital SGD dynamic, proposed analog SGD dynamic and analog SGD simulated by AIHWkit under different $\tau$ (dynamic range radius)

python S2-dynamic-verification.py

Simulation 3

Figure 4. Ablation study on different parameters, including: $\tau$, noise variance, and initialization

python S3.1-ablation-tau.py
python S3.2-ablation-sigma.py
python S3.3-ablation-init.py

Simulation 4

Figure 5. Analog training on MNIST dataset. The network archetecture can be fully-connected network (FCN) or convolutional neural network (CNN)

Perform simulations on FCN

python S4.1-mnist-FCN.py --SETTING="FP SGD" --CUDA=${CUDA_IDX}
python S4.1-mnist-FCN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.6
python S4.1-mnist-FCN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.78
python S4.1-mnist-FCN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.8
python S4.1-mnist-FCN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.6
python S4.1-mnist-FCN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.78
python S4.1-mnist-FCN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.8

Perform simulations on CNN

python S4.2-mnist-CNN.py --SETTING="FP SGD" --CUDA=${CUDA_IDX}
python S4.2-mnist-CNN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.6
python S4.2-mnist-CNN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.7
python S4.2-mnist-CNN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.8
python S4.2-mnist-CNN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.6
python S4.2-mnist-CNN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.7
python S4.2-mnist-CNN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.8

After all simulations, the figures can be plotted by

python S4.1-plot-FCN.py
python S4.2-plot-CNN.py

Simulation 5

Table 2. Finetuning Resnet family models on CIFAR10 dataset.

python S5-resnet-finetune.py --model="Resnet18" -FFT --optimizer="FP SGD" --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet18" -FFT --optimizer="Analog SGD" --tau=0.8 --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet18" -FFT --optimizer="TT-v1" --tau=0.8 --CUDA=${CUDA_IDX} 

python S5-resnet-finetune.py --model="Resnet34" -FFT --optimizer="FP SGD" --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet34" -FFT --optimizer="Analog SGD" --tau=0.8 --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet34" -FFT --optimizer="TT-v1" --tau=0.8 --CUDA=${CUDA_IDX} 

python S5-resnet-finetune.py --model="Resnet50" -FFT --optimizer="FP SGD" --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet50" -FFT --optimizer="Analog SGD" --tau=0.8 --CUDA=${CUDA_IDX} 
python S5-resnet-finetune.py --model="Resnet50" -FFT --optimizer="TT-v1" --tau=0.8 --CUDA=${CUDA_IDX}

Simulation 6

Figure 7. Illustration of weight distribution of FCN model. To plot the figure, we need to first save the checkpoint of the models.

python S4.2-mnist-CNN.py --SETTING="FP SGD" --CUDA=${CUDA_IDX} --save-checkpoint
python S4.1-mnist-FCN.py --SETTING="Analog SGD" --CUDA=${CUDA_IDX} --tau=0.7 --save-checkpoint
python S4.1-mnist-FCN.py --SETTING="TT-v1" --CUDA=${CUDA_IDX} --tau=0.7 --save-checkpoint

We could plot the weight distributions after that.

python S6-plot-distribution.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Requirements

Conda installation (Recommanded)

Pip installation

Running

Simulation 1

Simulation 2

Simulation 3

Simulation 4

Simulation 5

Simulation 6

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
utils		utils
.gitignore		.gitignore
README.md		README.md
S1-SGD-diff-lr.py		S1-SGD-diff-lr.py
S2-dynamic-verification.py		S2-dynamic-verification.py
S3.1-ablation-tau.py		S3.1-ablation-tau.py
S3.2-ablation-sigma.py		S3.2-ablation-sigma.py
S3.3-ablation-init.py		S3.3-ablation-init.py
S4.1-mnist-FCN.py		S4.1-mnist-FCN.py
S4.1-plot-FCN.py		S4.1-plot-FCN.py
S4.2-mnist-CNN.py		S4.2-mnist-CNN.py
S4.2-plot-CNN.py		S4.2-plot-CNN.py
S5-resnet-finetune.py		S5-resnet-finetune.py
S6-plot-distribution.py		S6-plot-distribution.py
requirements.txt		requirements.txt

Zhaoxian-Wu/analog-training

Folders and files

Latest commit

History

Repository files navigation

Requirements

Conda installation (Recommanded)

Pip installation

Running

Simulation 1

Simulation 2

Simulation 3

Simulation 4

Simulation 5

Simulation 6

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages