Add `--examples` Argument for Fine-Grained Task Evaluation in `lm-evaluation-harness`. This feature is the first step towards efficient multi-prompt evaluation with PromptEval [1,2] #4018

Job	Run time
Scan for changed tasks	1m 23s
	1m 23s

Provide feedback