La correction participative de l’OCR par crowdsourcing au profit des bibliothèques numériques. Andro, M. & Saleh, I. Bulletin des bibliothèques de France, June, 2015.
La correction participative de l’OCR par crowdsourcing au profit des bibliothèques numériques [link]Paper  abstract   bibtex   
Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes.
@article{andro_correction_2015,
	title = {La correction participative de l’{OCR} par crowdsourcing au profit des bibliothèques numériques},
	issn = {1292-8399},
	url = {http://bbf.enssib.fr/contributions/la-correction-participative-de-l-ocr},
	abstract = {Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes.},
	language = {FR},
	journal = {Bulletin des bibliothèques de France},
	author = {Andro, Mathieu and Saleh, Imad},
	month = jun,
	year = {2015},
	keywords = {Crowdsourcing},
}

Downloads: 0