Doodling Is All You Need

Tip-of-the-tongue – when a person fails to retrieve a word from memory – poses a difficulty for image search, such as for online shopping. We propose a workaround to query images from a database by doodling the object of interest.

We do so by constructing a model that represents doodles and real images in the same embedding space, then select real images that are closest to the doodle drawn. We believe our proof-of-concept can complement Google's existing reverse image search that does not take in doodles as input.

We aim to build an image vector search engine, consisting of a database of real-life images, that takes in a doodle sketch and returns the top real-life images most relevant or similar. We study the effect of model architecture (MLP, CNN, ConvNeXt) and learning paradigm (supervised, contrastive learning) on deep learning training for our problem.

Documentation

Dataset Information and Set-up

Name		Name	Last commit message	Last commit date
Latest commit History 175 Commits
.idea		.idea
.ipynb_checkpoints		.ipynb_checkpoints
__pycache__		__pycache__
exp_data		exp_data
images		images
logs/tsne		logs/tsne
mlp_trained		mlp_trained
models		models
v2cnn_trained		v2cnn_trained
v5_trained_real_imgs_classification		v5_trained_real_imgs_classification
.gitignore		.gitignore
DATASET.md		DATASET.md
Final Report.ipynb		Final Report.ipynb
Group 1 - Doodle-based Image Search.ipynb		Group 1 - Doodle-based Image Search.ipynb
Group1_Final_Report.ipynb		Group1_Final_Report.ipynb
README.md		README.md
Untitled.ipynb		Untitled.ipynb
Untitled1.ipynb		Untitled1.ipynb
analyse_mlp.ipynb		analyse_mlp.ipynb
analyse_v2_cnn.ipynb		analyse_v2_cnn.ipynb
convnext.py		convnext.py
dataset.ipynb		dataset.ipynb
dataset.py		dataset.py
dataset_analysis.py		dataset_analysis.py
dataset_collection.py		dataset_collection.py
deenotejet.ipynb		deenotejet.ipynb
demo.py		demo.py
driver.sh		driver.sh
eda.ipynb		eda.ipynb
engine.py		engine.py
error_analysis.py		error_analysis.py
generate-doodle.ipynb		generate-doodle.ipynb
gradCAM.py		gradCAM.py
gradcam_demo.ipynb		gradcam_demo.ipynb
hyperparameter_tuning.py		hyperparameter_tuning.py
image-20220428-131357.png		image-20220428-131357.png
image-20220429-214455.png		image-20220429-214455.png
image-20220429-214642.png		image-20220429-214642.png
image-20220429-220721.png		image-20220429-220721.png
image-20220429-221026.png		image-20220429-221026.png
image-20220429-221720.png		image-20220429-221720.png
image-20220429-223605.png		image-20220429-223605.png
img_proc.py		img_proc.py
losses.py		losses.py
main.py		main.py
mlp_training.ipynb		mlp_training.ipynb
model_analysis.py		model_analysis.py
model_evaluation.py		model_evaluation.py
model_training.py		model_training.py
models.py		models.py
output.png		output.png
scrape_google.ipynb		scrape_google.ipynb
spec-file.txt		spec-file.txt
test.pkl		test.pkl
test_engine.ipynb		test_engine.ipynb
train_v2_cnn.ipynb		train_v2_cnn.ipynb
training.py		training.py
training_config.py		training_config.py
training_utils.py		training_utils.py
tuner.py		tuner.py
utils.py		utils.py
v1_tune.py		v1_tune.py
v2.ipynb		v2.ipynb
v2.py		v2.py
v2_new.ipynb		v2_new.ipynb
v3.py		v3.py
v4.py		v4.py
v5.py		v5.py
v5_train.ipynb		v5_train.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Doodling Is All You Need

Documentation

About

Releases

Packages

Contributors 3

Languages

rish-16/cs4243-project

Folders and files

Latest commit

History

Repository files navigation

Doodling Is All You Need

Documentation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages