Das Hinzufügen interpretativer linguistischer Daten zu Dokumenten in einem Korpus wird als Korpusannotation bezeichnet. Das Annotieren eines Korpus wird als einer der wichtigsten Beiträge zum Nutzen eines Korpus verstanden, da Annotationen den Korpus mit zusätzlichen Daten anreichern, die für bestimmte Aufgaben nützlich sein können, die mit dem Korpus durchgeführt werden. In den letzten sechzig Jahren wurden verschiedene Arten von Annotationen eingeführt. Allen Annotationen ist gemeinsam, dass sie einen Mehrwert für Aufgaben darstellen sollen wie z.B. der Informationsgewinnung aus Dokumenten eines Korpus. Im Allgemeinen werden interpretative Annotationen aus dem Textverständnisses gewonnen und sind daher nicht objektiv. Ob eine Annotation eine Erklärung über eine im Text vorkommende Handlung darstellt, hängt vom jeweiligen Annotator ab, sodass es unterschiedlich geeignete Annotationen geben kann. Dadurch, dass das manuelle Hinzufügen interpretativer Daten zu Dokumenten zeitaufwendig ist, wurden in den letzten Jahren zunehmend semi-automatische Annotationssysteme eingeführt. Die verfügbaren Annotationssysteme sind dokumentenorientiert und ignorieren den Kontext eines Dokuments, der durch die jeweilige Sammlung der Dokumente repräsentiert wird. Das in dieser Dissertation untersuchte Problem ist daher das Problem der Bestimmung von kontextbewussten subjektiven Inhaltsbeschreibungen (SCDs) für Dokumente in einem Korpus, sodass die Inhaltsbeschreibungen einen Mehrwert für korpusspezifische Aufgaben bieten. Wir kombinieren die Idee der sog. Themenmodellierung mit einer neuen Kategorie von Korpusannotation, die wir als subjektive Inhaltsbeschreibung bezeichnen, mit dem Ziel, das genannte Problem zu lösen und die Performanz von unterschiedlichen Aufgaben der Annotation zu erhöhen. Wir konzentrieren uns auf den Ansatz der Latent Dirichlet Allocation (LDA)-Themenmodellierung. Bei dieser Modellierung werden die Dokumente mittels einer Wahrscheinlichkeitsverteilung über Themen darstellt, um die kontextbezogene Ähnlichkeit zwischen Dokumenten in einem Korpus auf der Grundlage der Themen sowie der Inhaltsbeschreibungen zu identifizieren. Wir gliedern die Arbeit in die nachfolgenden zwei Teile. Zunächst präsentieren wir Grundlagen der subjektiven Inhaltsbeschreibungen, gefolgt von einem Ansatz zur kontextspezifischen Korpusanreicherung neuer Dokumente. Anschließend präsentieren wir einen Ansatz, um einen dokumentenspezifischen Relevanzwert von SCDs zu errechnen, und wir nutzen diesen Relevanzwert in einem korpusgesteuerten Prozess zur Anreicherung von schwach annotierten Dokumenten mit zusätzlichen Inhaltsbeschreibungen, die mit ähnlichen Dokumenten innerhalb desselben Korpus assoziiert sind. Da Inhaltsbeschreibungen auch direkt im Text kodiert sein können, stellen wir ebenfalls einen Ansatz vor, um kodierte Inhaltsbeschreibungen innerhalb eines Texts zu identifizieren. Schließlich stellen wir einen Ansatz vor, um Inhaltsbeschreibungen für Dokumente, basierend auf den Inhaltsbeschreibungen eines anderen Korpus, automatisch zu generieren. Im zweiten Teil dieser Arbeit konzentrieren wir uns auf Ergebnisse zu Themenmodellierungstechniken im Bereich der Inhaltsbeschreibungen und stellen Techniken zum Vergleich von Themenverteilungen vor, die sich aus verschiedenen Themenmodellen ergeben. Wir präsentieren Ergebnisse zur Erweiterung eines relationalen Themenmodells mit Verknüpfungen zwischen Entitäten die im Text der Dokumente vorkommen.