Common Flaws in Running Human Evaluation Experiments in NLP (2024)

First Author: Thomson C

Attributed to: ReproHum: Investigating Reproducibility of Human Evaluations in Natural Language Processing funded by EPSRC

No abstract provided

Type: Journal Article/Review

Parent Publication: Computational Linguistics