Bullingers Briefwechsel zugänglich machen: Stand der Handschriftenerkennung. Ströbel, P., Hodel, T., Fischer, A., Scius, A., Wolf, B., Janka, A., Widmer, J., Scheurer, P., & Volk, M. March, 2023. Publisher: [object Object]
Bullingers Briefwechsel zugänglich machen: Stand der Handschriftenerkennung [link]Paper  doi  abstract   bibtex   
"Anhand des Briefwechsels Heinrich Bullingers (1504-1575), das rund 10'000 Briefe umfasst, demonstrieren wir den Stand der Forschung in automatisierter Handschriftenerkennung. Es finden sich mehr als hundert unterschiedliche Schreiberhände in den Briefen mit sehr unterschiedlicher Verteilung. Das Korpus ist zweisprachig (Latein/Deutsch) und teilweise findet der Sprachwechsel innerhalb von Abschnitten oder gar Sätzen statt. Auf Grund dieser Vielfalt eignet sich der Briefwechsel optimal als Testumgebung für entsprechende Algorithmen und ist aufschlussreiche für Forschungsprojekte und Erinnerungsinstitutionen mit ähnlichen Problemstellungen. Im Paper werden drei Verfahren gegeneinander gestellt und abgewogen. Im folgenden werde drei Ansätze an dem Korpus getestet, die Aufschlüsse zum Stand und möglichen Entwicklungen im Bereich der Handschriftenerkennung versprechen. Erstens wird mit Transkribus eine etablierte Plattform genutzt, die zwei Engines (HTR+ und PyLaia) anbietet. Zweitens wird mit Hilfe von Data Augmentation versucht die Erkennung mit der state-of-the-art Engine HTRFlor zu verbessern und drittens werden neue Transformer-basierte Modelle (TrOCR) eingesetzt." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
@article{strobel2023a,
	title = {Bullingers {Briefwechsel} zugänglich machen: {Stand} der {Handschriftenerkennung}},
	copyright = {Creative Commons Attribution 4.0 International, Open Access},
	shorttitle = {Bullingers {Briefwechsel} zugänglich machen},
	url = {https://zenodo.org/record/7715357},
	doi = {10.5281/ZENODO.7715357},
	abstract = {"Anhand des Briefwechsels Heinrich Bullingers (1504-1575), das rund 10'000 Briefe umfasst, demonstrieren wir den Stand der Forschung in automatisierter Handschriftenerkennung. Es finden sich mehr als hundert unterschiedliche Schreiberhände in den Briefen mit sehr unterschiedlicher Verteilung. Das Korpus ist zweisprachig (Latein/Deutsch) und teilweise findet der Sprachwechsel innerhalb von Abschnitten oder gar Sätzen statt. Auf Grund dieser Vielfalt eignet sich der Briefwechsel optimal als Testumgebung für entsprechende Algorithmen und ist aufschlussreiche für Forschungsprojekte und Erinnerungsinstitutionen mit ähnlichen Problemstellungen. Im Paper werden drei Verfahren gegeneinander gestellt und abgewogen. Im folgenden werde drei Ansätze an dem Korpus getestet, die Aufschlüsse zum Stand und möglichen Entwicklungen im Bereich der Handschriftenerkennung versprechen. Erstens wird mit Transkribus eine etablierte Plattform genutzt, die zwei Engines (HTR+ und PyLaia) anbietet. Zweitens wird mit Hilfe von Data Augmentation versucht die Erkennung mit der state-of-the-art Engine HTRFlor zu verbessern und drittens werden neue Transformer-basierte Modelle (TrOCR) eingesetzt." Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.},
	urldate = {2024-04-22},
	author = {Ströbel, Phillip and Hodel, Tobias and Fischer, Andreas and Scius, Anna and Wolf, Beat and Janka, Anna and Widmer, Jonas and Scheurer, Patricia and Volk, Martin},
	collaborator = {Trilcke, Peer and Busch, Anna and Helling, Patrick and Plum, Alistair and Wolter, Vivien and Weis, Joëlle and Chudoba, Hendrik},
	month = mar,
	year = {2023},
	note = {Publisher: [object Object]},
	keywords = {Annotieren, Bewertung, DHd2023, Data augmentation, Daten, Handschriftenerkennung, Manuskript, Transkription, maschinelles Lernen},
}

Downloads: 0