Text und Text Mining

Link:
Autor/in:
Verlag/Körperschaft:
Springer
Erscheinungsjahr:
2022
Medientyp:
Text
Beschreibung:
  • Text repräsentiert Wissen. Im Unterschied zu den strukturierten Daten in einer Datenbank stellen Texte unstrukturierte Daten dar. Eine wichtige Eigenschaft natürlicher Sprachen ist Redundanz. Im Text Mining werden verschiedene Arten von Redundanz genutzt, um Wörter oder ganze Texte zu klassifizieren sowie strukturelle oder inhaltliche Zusammenhänge zwischen Wörtern zu ermitteln. Dabei ist zu unterscheiden zwischen der Makro-Sicht auf ein ganzes Textkorpus und der Mikro-Sicht auf einzelne Wörter. Text Mining verwendet regelbasierte, statistische sowie neuronale Verfahren und erlaubt somit innovative Anwendungen, bei denen sehr große Mengen an Text sehr schnell und sehr umfangreich ausgewertet werden. Für das Text Mining ist es meist erforderlich, die linguistische Struktur von Texten zu berücksichtigen. Die Beschreibung linguistischer Strukturen setzt voraus, dass sich Texte in verschiedene linguistische Ebenen untergliedern lassen. Wichtige Ebenen für das Text Mining sind die Ebenen der Morpheme, der Wörter, der Phrasen und der Sätze. Auf allen Ebenen finden sich Mehrdeutigkeiten, sprachstatistische Gesetzmäßigkeiten und sprachliche Dynamiken.
Lizenz:
  • info:eu-repo/semantics/closedAccess
Quellsystem:
Forschungsinformationssystem der UHH

Interne Metadaten
Quelldatensatz
oai:www.edit.fis.uni-hamburg.de:publications/fc299bc7-4515-4aa8-8eb7-a3927140c72e