Toward better Subjective Content Descriptions: A Spiral of Estimation, Enrichment, Usage, and Improvement

Link:
Autor/in:
Erscheinungsjahr:
2024
Medientyp:
Text
Schlagwort:
  • Betreuer-rm
Beschreibung:
  • In der heutigen Welt interagieren Menschen nicht nur miteinander, sondern auch mit intelligenten Systemen, die aus Agenten bestehen und im Auftrag von Menschen handeln. Natürliche Sprache ist die intuitivste Form menschlicher Kommunikation, und es ist anzunehmen, dass Menschen bei der Interaktion mit Agenten natürliche Sprache bevorzugen. Trotz jüngster Fortschritte im Bereich der Mensch-Maschine-Interaktion ist die Verarbeitung natürlicher Sprache für Maschinen jedoch bekanntermaßen komplex und schwer zu realisieren.

    In dieser Dissertation geht es darum, Agenten zu ermöglichen, mit Menschen über natürlichsprachliche Texte zu kommunizieren und dabei den Kontext zu berücksichtigen, in dem sich ein Mensch gerade befindet. Heutige Dienste zum standardmäßigen Information Retrieval (IR) oder große Sprachmodelle (LLMs) sind jedoch nicht ausreichend, um dieses Ziel zu erreichen. Wir betrachten in dieser Dissertation „Kommentare" verbunden mit Textdokumenten im Korpus. Diese „Kommentare“ haben möglicherweise keinen direkten Bezug zum Text und erschließen sich erst durch den Kontext. Wenn „Kommentare“ in natürlicher Sprache formuliert sind, kann ein Mensch dadurch leicht auf relevante Dokumente und darin auf Absätze oder Sätze verwiesen werden, jeweils bezogen auf den Kontext, wie z. B. ein ganz neues wissenschaftliches Problem.

    Diese einem Textdokument beigefügten „Kommentare“ sind subjektiv, da der Kontext und nicht nur das Textdokument selbst für die Interpretation entscheidend ist. Daher nennen wir diese „Kommentare“ subjektive Inhaltsbeschreibungen (SCDs). Ein Mensch kann den Kontext nun zweifach spezifizieren, zum einen mit Hilfe von SCDs, die mit dem Korpus verbunden sind, und zum anderen als Teil der Anfragen an den Agenten. Ein weiterer Vorteil von SCDs ist, dass Techniken für SCDs weniger Ressourcen als LLMs benötigen und effizient auf Standard-Hardware laufen.

    Diese Dissertation stellt Techniken vor, die für einen SCD-basierten IR-Agenten benötigt werden. Ein solcher Agent zeichnet sich durch die Fähigkeit aus, den Kontext und die Subjektivität von Menschen zu berücksichtigen. Zunächst muss der Agent für einen Korpus initiale SCDs einschließlich Labels bestimmen. Anschließend werden die SCDs, z. B. durch menschliches Feedback, verbessert. Eine Aktualisierung der SCDs ist auch erforderlich, wenn sich Kontext oder Menschen verändern. Schließlich gibt es noch Relationen zwischen SCDs, z. B. die Komplementarität. Wir zeigen, wie solche Relationen bestimmt und im IR-Agenten genutzt werden können.
Lizenz:
  • info:eu-repo/semantics/openAccess
Quellsystem:
Forschungsinformationssystem der UHH

Interne Metadaten
Quelldatensatz
oai:www.edit.fis.uni-hamburg.de:publications/67bbef6c-34da-4479-af71-856ae6cbc5f6