NER: Von lexikon-bis chatbasiert. Beyer, A. & Schulz, K. June, 2025.
NER: Von lexikon-bis chatbasiert [link]Paper  abstract   bibtex   6 downloads  
Named Entity Recognition (NER) stellt eine zentrale Methode des Information Retrieval dar, die darauf abzielt, in Textkorpora eindeutig identifizierbare Entitäten wie Personen, Orte, Organisationen und politische oder religiöse Gruppen zu erkennen und zu klassifizieren. Der Vortrag untersucht die Entwicklung und Anwendung von NER-Methoden im Kontext der historischen Sprachen Latein und Altgriechisch und vergleicht traditionelle Ansätze – wie lexikonbasierte, regelbasierte und merkmalbasierte Verfahren – mit modernen neuronalen Netzwerken und KI-gestützten Chatbots. Am Beispiel des pseudo-sallustischen Werks In Ciceronem wird der Einsatz von NER zur Analyse von Diskursstruktur, Adressatensystemen und sozialen Netzwerken vorgestellt. Die Studie zeigt, dass Chatbots wie Claude-Sonnet-4 eine hohe Genauigkeit bei der Identifikation und Klassifikation von Entitäten, jedoch bei der Aggregation und Interpretation von Daten sowie bei der Visualisierung von Ergebnissen erhebliche Einschränkungen aufweisen. Die Analyse verdeutlicht zudem die Herausforderungen durch sprachliche Variabilität, Ambiguität und fehlende Ressourcen in Low-Resource-Languages. Zuletzt werden potentielle Forschungsanwendungen in der digitalen Edition, Quellenforschung und computergestützten literarischen Studien aufgezeigt, wobei die Notwendigkeit standardisierter Annotationen und erweiterter Korpora betont wird.
@misc{beyer_ner_2025,
	address = {Universität Freiburg},
	type = {Talk},
	title = {{NER}: {Von} lexikon-bis chatbasiert},
	url = {https://zenodo.org/records/15722725},
	abstract = {Named Entity Recognition (NER) stellt eine zentrale Methode des Information Retrieval dar, die darauf abzielt, in Textkorpora eindeutig identifizierbare Entitäten wie Personen, Orte, Organisationen und politische oder religiöse Gruppen zu erkennen und zu klassifizieren. Der Vortrag untersucht die Entwicklung und Anwendung von NER-Methoden im Kontext der historischen Sprachen Latein und Altgriechisch und vergleicht traditionelle Ansätze – wie lexikonbasierte, regelbasierte und merkmalbasierte Verfahren – mit modernen neuronalen Netzwerken und KI-gestützten Chatbots. Am Beispiel des pseudo-sallustischen Werks In Ciceronem wird der Einsatz von NER zur Analyse von Diskursstruktur, Adressatensystemen und sozialen Netzwerken vorgestellt. Die Studie zeigt, dass Chatbots wie Claude-Sonnet-4 eine hohe Genauigkeit bei der Identifikation und Klassifikation von Entitäten, jedoch bei der Aggregation und Interpretation von Daten sowie bei der Visualisierung von Ergebnissen erhebliche Einschränkungen aufweisen. Die Analyse verdeutlicht zudem die Herausforderungen durch sprachliche Variabilität, Ambiguität und fehlende Ressourcen in Low-Resource-Languages. Zuletzt werden potentielle Forschungsanwendungen in der digitalen Edition, Quellenforschung und computergestützten literarischen Studien aufgezeigt, wobei die Notwendigkeit standardisierter Annotationen und erweiterter Korpora betont wird.},
	author = {Beyer, Andrea and Schulz, Konstantin},
	month = jun,
	year = {2025},
	keywords = {AI, LLM, NER, NLP, Pseudo-Sallust},
}

Downloads: 6