La correction participative de l’OCR par crowdsourcing au profit des bibliothèques numériques. Andro, M. & Saleh, I. Bulletin des bibliothèques de France, June, 2015. 🏷️ /unread、Crowdsourcing
Paper abstract bibtex Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes. 【摘要翻译】在图书数字化项目中,书库的 OCR 识别率很低,经常出现错误,这些错误随后可由提供商以较低的成本进行更正。此外,图书馆还可以向受惠者(众包说明)、受薪者(亚马逊机械土耳其市场)、以游戏形式进行 OCR 识别的受访者(游戏化)以及无知 OCR 识别的受访者(隐含 reCAPTCHA 的众包)发出呼吁。在本文中,我们对这些方法进行了研究,并比较了它们的实用性。
@article{andro2015,
title = {La correction participative de l’{OCR} par crowdsourcing au profit des bibliothèques numériques},
issn = {1292-8399},
shorttitle = {通过众包实现 {OCR} 的参与式修正,使数字图书馆受益},
url = {http://bbf.enssib.fr/contributions/la-correction-participative-de-l-ocr},
abstract = {Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes.
【摘要翻译】在图书数字化项目中,书库的 OCR 识别率很低,经常出现错误,这些错误随后可由提供商以较低的成本进行更正。此外,图书馆还可以向受惠者(众包说明)、受薪者(亚马逊机械土耳其市场)、以游戏形式进行 OCR 识别的受访者(游戏化)以及无知 OCR 识别的受访者(隐含 reCAPTCHA 的众包)发出呼吁。在本文中,我们对这些方法进行了研究,并比较了它们的实用性。},
language = {en},
journal = {Bulletin des bibliothèques de France},
author = {Andro, Mathieu and Saleh, Imad},
month = jun,
year = {2015},
note = {🏷️ /unread、Crowdsourcing},
keywords = {/unread, Crowdsourcing},
}
Downloads: 0
{"_id":"MLqAJQTZDvQW5RrSf","bibbaseid":"andro-saleh-lacorrectionparticipativedelocrparcrowdsourcingauprofitdesbibliothquesnumriques-2015","author_short":["Andro, M.","Saleh, I."],"bibdata":{"bibtype":"article","type":"article","title":"La correction participative de l’OCR par crowdsourcing au profit des bibliothèques numériques","issn":"1292-8399","shorttitle":"通过众包实现 OCR 的参与式修正,使数字图书馆受益","url":"http://bbf.enssib.fr/contributions/la-correction-participative-de-l-ocr","abstract":"Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes. 【摘要翻译】在图书数字化项目中,书库的 OCR 识别率很低,经常出现错误,这些错误随后可由提供商以较低的成本进行更正。此外,图书馆还可以向受惠者(众包说明)、受薪者(亚马逊机械土耳其市场)、以游戏形式进行 OCR 识别的受访者(游戏化)以及无知 OCR 识别的受访者(隐含 reCAPTCHA 的众包)发出呼吁。在本文中,我们对这些方法进行了研究,并比较了它们的实用性。","language":"en","journal":"Bulletin des bibliothèques de France","author":[{"propositions":[],"lastnames":["Andro"],"firstnames":["Mathieu"],"suffixes":[]},{"propositions":[],"lastnames":["Saleh"],"firstnames":["Imad"],"suffixes":[]}],"month":"June","year":"2015","note":"🏷️ /unread、Crowdsourcing","keywords":"/unread, Crowdsourcing","bibtex":"@article{andro2015,\n\ttitle = {La correction participative de l’{OCR} par crowdsourcing au profit des bibliothèques numériques},\n\tissn = {1292-8399},\n\tshorttitle = {通过众包实现 {OCR} 的参与式修正,使数字图书馆受益},\n\turl = {http://bbf.enssib.fr/contributions/la-correction-participative-de-l-ocr},\n\tabstract = {Dans le cadre de leurs projets de numérisation, les bibliothèques génèrent une OCR brute comportant souvent des erreurs qui peuvent ensuite être corrigées par des prestataires faisant appel à de la main d’œuvre à bas coût. Mais les bibliothèques peuvent aussi faire appel à des internautes bénévoles (crowdsourcing explicite), à des internautes rémunérés (Amazon Mechanical Turk Marketplace), à des internautes qui corrigent l’OCR sous la forme de jeux (gamification) ou encore à des internautes qui corrigent de l’OCR sans le savoir (crowdsourcing implicite de reCAPTCHA). Dans cet article, nous étudions ces approches et comparons la rentabilité de ces expérimentations concrètes.\n\n【摘要翻译】在图书数字化项目中,书库的 OCR 识别率很低,经常出现错误,这些错误随后可由提供商以较低的成本进行更正。此外,图书馆还可以向受惠者(众包说明)、受薪者(亚马逊机械土耳其市场)、以游戏形式进行 OCR 识别的受访者(游戏化)以及无知 OCR 识别的受访者(隐含 reCAPTCHA 的众包)发出呼吁。在本文中,我们对这些方法进行了研究,并比较了它们的实用性。},\n\tlanguage = {en},\n\tjournal = {Bulletin des bibliothèques de France},\n\tauthor = {Andro, Mathieu and Saleh, Imad},\n\tmonth = jun,\n\tyear = {2015},\n\tnote = {🏷️ /unread、Crowdsourcing},\n\tkeywords = {/unread, Crowdsourcing},\n}\n\n","author_short":["Andro, M.","Saleh, I."],"key":"andro2015","id":"andro2015","bibbaseid":"andro-saleh-lacorrectionparticipativedelocrparcrowdsourcingauprofitdesbibliothquesnumriques-2015","role":"author","urls":{"Paper":"http://bbf.enssib.fr/contributions/la-correction-participative-de-l-ocr"},"keyword":["/unread","Crowdsourcing"],"metadata":{"authorlinks":{}}},"bibtype":"article","biburl":"https://api.zotero.org/groups/2386895/collections/L5DPTH6D/items?format=bibtex&limit=100","dataSources":["YXnKxykgewaZSWfRw"],"keywords":["/unread","crowdsourcing"],"search_terms":["correction","participative","ocr","par","crowdsourcing","profit","des","biblioth","ques","num","riques","andro","saleh"],"title":"La correction participative de l’OCR par crowdsourcing au profit des bibliothèques numériques","year":2015}