B4 Otfrid

Link:

https://doi.org/10.25592/uhhfdm.1719

Autor/in:

Petrova, Svetlana

Beteiligte Person:

Petrova, Svetlana

Verlag/Körperschaft:

Universität Hamburg

Erscheinungsjahr:

2015

Medientyp:

Datensatz

Schlagworte:

historical texts
religious texts
information structure
linguistics
Old High German

Beschreibung:

Das Referenzkorpus Altdeutsch erfasst und annotiert die ältesten Sprachdenkmäler des Deutschen vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. 650 000 Textwörtern. Aufgenommen werden alle in dieser Zeit überlieferten Texte des Althochdeutschen und des Altsächsischen in einer möglichst genauen Wiedergabestufe. Dabei werden die handschriftengetreuesten gedruckten Texteditionen zugrundegelegt. Die Annotation erfasst Header-Informationen, strukturelle (Wort, Satz, Zeile, Absatz etc.) und linguistische Annotationen (Part of Speech-Tagging, Flexionsmorphologie) sowie syntaktische Satzinformationen und erfolgt mit Unterstützung einer semi-automatischen Vorannotation, die mit Hilfe der digitalisierten Sprachstufen- und Textwörterbücher und Glossare zum Althochdeutschen und zum Altsächsischen erzeugt wurde. Die verschiedenen Stufen der Annotation werden in Form einer Mehrebenenarchitektur aufeinander bezogen.
The reference corpus Old German contains (annotated) data from the oldest language monuments of German before the continuous written transduction around 750 until 1050 with approx. 650,000 text words.
CLARIN Metadata summary for B4 Otfrid (CMDI-based)

Title: B4 Otfrid
Description: Das Referenzkorpus Altdeutsch erfasst und annotiert die ältesten Sprachdenkmäler des Deutschen vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. 650 000 Textwörtern. Aufgenommen werden alle in dieser Zeit überlieferten Texte des Althochdeutschen und des Altsächsischen in einer möglichst genauen Wiedergabestufe. Dabei werden die handschriftengetreuesten gedruckten Texteditionen zugrundegelegt. Die Annotation erfasst Header-Informationen, strukturelle (Wort, Satz, Zeile, Absatz etc.) und linguistische Annotationen (Part of Speech-Tagging, Flexionsmorphologie) sowie syntaktische Satzinformationen und erfolgt mit Unterstützung einer semi-automatischen Vorannotation, die mit Hilfe der digitalisierten Sprachstufen- und Textwörterbücher und Glossare zum Althochdeutschen und zum Altsächsischen erzeugt wurde. Die verschiedenen Stufen der Annotation werden in Form einer Mehrebenenarchitektur aufeinander bezogen.
Description: The reference corpus Old German contains (annotated) data from the oldest language monuments of German before the continuous written transduction around 750 until 1050 with approx. 650,000 text words.
Publication date: 2015
Data owner: Prof. Dr. Svetlana Petrova
Contributors: Svetlana Petrova (editor)
Project: Special Research Centre 632 Information structure, German Research Foundation
Keywords: historical texts, religious texts, information structure
Language: Old High German (goh)
Size: 300000 Token
Segmentation units: other
Genre: historic manuscript
Modality: written

Beziehungen:

DOI 10.25592/uhhfdm.1718

Lizenzen:

https://creativecommons.org/licenses/by-nc/3.0/legalcode
info:eu-repo/semantics/openAccess

Quellsystem:

Forschungsdatenrepositorium der UHH

Interne Metadaten

Quelldatensatz: oai:fdr.uni-hamburg.de:1719