GitHub

Controlled Generation of Natural Adversarial Documents for Stealthy Retrieval Poisoning

This is code for paper "Controlled Generation of Natural Adversarial Documents for Stealthy Retrieval Poisoning"

Requirements

pip install -r requirements.txt
conda install -c pytorch -c nvidia faiss-gpu=1.8.0

Usage

Please make sure you have at least 40GB gpu memory

Make the data directory first

mkdir data

Experiments

# to generate the trigger attack adversarial documents
python experiment.py trigger

# to generate the no trigger attack adversarial documents
python experiment.py no_trigger

Prepare the vector db

If you want to run ASR eval, please first generate the vector dataset, this takes about 4 hours on A40

You can still run perplexity and naturalness eval doesn't rely on this

python sentence_create_emb_db.py

Eval trigger attack

# to evaluate the ASR
cd measurements
python measure_asr.py trigger
python measure_asr_trigger_post.py

# to evaluate perplexity
python measure_perplexity.py

# to evaluate naturalness
export OPENAI_API_KEY=[your_openai_key]
python measure_naturalness.py trigger

Eval no trigger attack

# to evaluate the ASR
cd mesurements
python measure_asr.py no_trigger
python measure_asr_cluster_post.py

# to evaluate naturalness
export OPENAI_API_KEY=[your_openai_key]
python measure_naturalness.py no_trigger

Measre Real Doc naturalness

cd measurements
python measure_naturalness.py real_docs

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
measurements		measurements
.gitignore		.gitignore
README.md		README.md
adversarial_decoding.py		adversarial_decoding.py
basic_adversarial_decoding.py		basic_adversarial_decoding.py
bert_layers.py		bert_layers.py
bert_models.py		bert_models.py
cold.py		cold.py
experiment.py		experiment.py
hotflip.py		hotflip.py
notrigger_results.json		notrigger_results.json
requirements.txt		requirements.txt
sentence_create_emb_db.py		sentence_create_emb_db.py
trigger_results.json		trigger_results.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Controlled Generation of Natural Adversarial Documents for Stealthy Retrieval Poisoning

Requirements

Usage

Experiments

Prepare the vector db

Eval trigger attack

Eval no trigger attack

Measre Real Doc naturalness

About

Releases

Packages

Languages

collinzrj/adversarial_decoding

Folders and files

Latest commit

History

Repository files navigation

Controlled Generation of Natural Adversarial Documents for Stealthy Retrieval Poisoning

Requirements

Usage

Experiments

Prepare the vector db

Eval trigger attack

Eval no trigger attack

Measre Real Doc naturalness

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages