Im LinguistikDisambiguierung ist der Prozess der Bestimmung, welcher Sinn von a Wort wird in einem bestimmten verwendet Kontext. Auch als lexikalische Begriffsklärung bekannt.
In der Computerlinguistik wird dieser Unterscheidungsprozess genannt Wortsinn-Disambiguierung (WSD).
Beispiele und Beobachtungen
"Es kommt vor, dass unsere Kommunikationin anders Sprachen Ebenso ermöglicht es, dass dieselbe Wortform verwendet wird, um in einzelnen Kommunikationstransaktionen unterschiedliche Bedeutungen zu haben. Die Konsequenz ist, dass man in einer bestimmten Transaktion die beabsichtigte Bedeutung eines gegebenen Wortes unter seinen potentiell assoziierten Sinnen herausfinden muss. Während Mehrdeutigkeiten aus solchen multiplen formbedeutenden Assoziationen ergeben sich die lexikalisch Ebene müssen sie oft mittels eines größeren Kontextes aus dem gelöst werden Diskurs das Wort einbetten. Daher könnten die verschiedenen Sinne des Wortes "Dienst" nur dann auseinandergehalten werden, wenn man über das Wort selbst hinausblicken könnte, wie im Gegensatz zu "dem" Spielerservice in Wimbledon 'mit' Kellnerservice in Sheraton '. Dieser Prozess der Identifizierung von Wortbedeutungen in einem Diskurs ist im Allgemeinen bekannt als
Wortsinn Begriffsklärung (WSD). "(Oi Yee Kwong, Neue Perspektiven für rechnergestützte und kognitive Strategien zur Begriffsklärung. Springer, 2013)Lexikalische Disambiguierung und Wortsinn-Disambiguierung (WSD)
"Lexikalisch Begriffsklärung in seiner weitesten Definition ist nichts weniger als die Bestimmung der Bedeutung jedes Wortes im Kontext, was bei Menschen ein weitgehend unbewusster Prozess zu sein scheint. Als Rechenproblem wird es oft als "AI-vollständig" beschrieben, dh als ein Problem, dessen Lösung eine vollständige Lösung voraussetzt Natürliche Sprache Verständnis oder vernünftiges Denken (Ide und Véronis 1998).
"Auf dem Gebiet der Computerlinguistik wird das Problem allgemein als Wortsinn-Disambiguierung (WSD) bezeichnet und definiert als das Problem der rechnerischen Bestimmung, welcher "Sinn" eines Wortes durch die Verwendung des Wortes in einem bestimmten aktiviert wird Kontext. WSD ist im Wesentlichen eine Aufgabe der Klassifizierung: Wortsinne sind die Klassen, der Kontext liefert die Beweise, und jedes Vorkommen eines Wortes wird einer oder mehreren seiner möglichen Klassen basierend auf dem zugeordnet Beweise. Dies ist die traditionelle und übliche Charakterisierung von WSD, die es als expliziten Prozess der Disambiguierung in Bezug auf ein festes Inventar der Wortsinne betrachtet. Es wird angenommen, dass Wörter einen endlichen und diskreten Satz von Sinnen von a haben Wörterbuch, eine lexikalische Wissensbasis oder eine Ontologie (in letzterer entsprechen die Sinne Konzepten, die ein Wort lexikalisiert). Anwendungsspezifische Bestände können ebenfalls verwendet werden. Beispielsweise kann man in einer maschinellen Übersetzungseinstellung (MT) Wortübersetzungen als Wortsinne behandeln Ansatz, der aufgrund der Verfügbarkeit von großen mehrsprachigen immer realisierbarer wird parallel Korpora das kann als Trainingsdaten dienen. Das feste Inventar der traditionellen WSD verringert die Komplexität des Problems, es gibt jedoch alternative Felder.. .. "(Eneko Agirre und Philip Edmonds," Einführung. " Wortsinn-Disambiguierung: Algorithmen und Anwendungen. Springer, 2007)
Homonymie und Begriffsklärung
"Lexikalisch Begriffsklärung ist besonders für Fälle von gut geeignet Homonymiezum Beispiel ein Auftreten von Bass muss auf eines der lexikalischen Elemente Bass abgebildet werden1 oder Bass2, abhängig von der beabsichtigten Bedeutung.
"Lexikalische Disambiguierung impliziert eine kognitive Wahl und ist eine Aufgabe, die Verständnisprozesse hemmt. Es sollte von Prozessen unterschieden werden, die zu einer Differenzierung der Wortsinne führen. Die erstere Aufgabe wird ziemlich zuverlässig auch ohne viele Kontextinformationen erfüllt, während die letztere nicht (vgl. Veronis 1998, 2001). Es wurde auch gezeigt, dass gleichnamige Wörter, die eine Begriffsklärung erfordern, den lexikalischen Zugriff verlangsamen. während polysemische Wörter, die eine Vielzahl von Wortsinnen aktivieren, den lexikalischen Zugriff beschleunigen (Rodd e.a. 2002).
"Allerdings haben sowohl die produktive Modifikation semantischer Werte als auch die einfache Wahl zwischen lexikalisch unterschiedlichen Elementen gemeinsam, dass sie zusätzliche nicht-lexikalische Informationen benötigen. "(Peter Bosch," Produktivität, Polysemie und Prädikatenindexizität ". Logik, Sprache und Berechnung: 6. Internationales Tiflis-Symposium über Logik, Sprache und Berechnung, ed. von Balder D. zehn Cate und Henk W. Zeevat. Springer, 2007)
Lexikalische Kategorie Disambiguierung und das Prinzip der Wahrscheinlichkeit
"Corley und Crocker (2000) präsentieren ein breit gefächertes Modell von lexikalische KategorieBegriffsklärung basierend auf Prinzip der Wahrscheinlichkeit. Insbesondere schlagen sie das für einen Satz vor, der aus Wörtern besteht w0... wnnimmt der Satzverarbeiter am wahrscheinlichsten an Teil der Rede Reihenfolge t0... tn. Insbesondere nutzt ihr Modell zwei einfache Wahrscheinlichkeiten:ich) die bedingte Wahrscheinlichkeit des Wortes wich einen bestimmten Teil der Rede gegeben tich, und (ii) die Wahrscheinlichkeit von tich angesichts des vorherigen Teils der Rede ti-1. Wenn jedes Wort des Satzes angetroffen wird, weist das System ihm diesen Teil der Sprache zu tich, was das Produkt dieser beiden Wahrscheinlichkeiten maximiert. Dieses Modell nutzt die Erkenntnisse, die viele haben syntaktisch Mehrdeutigkeiten haben eine lexikalische Grundlage (MacDonald et al., 1994), wie in (3):
(3) Die Lagerpreise / Marken sind günstiger als die übrigen.
"Diese Sätze sind vorübergehend mehrdeutig zwischen einer Lesung, in der Preise oder macht ist der Hauptverb oder Teil eines zusammengesetztes Substantiv. Nach dem Training auf einem großen Korpus sagt das Modell den wahrscheinlichsten Teil der Sprache für voraus Preise, richtig zu berücksichtigen, dass die Menschen verstehen Preis als Substantiv aber macht als Verb (siehe Crocker & Corley, 2002, und darin zitierte Referenzen). Das Modell berücksichtigt nicht nur eine Reihe von Disambiguierungspräferenzen, die in der lexikalischen Kategorie verwurzelt sind Mehrdeutigkeit, es erklärt auch, warum Menschen im Allgemeinen sehr genau sind, um solche Mehrdeutigkeiten zu lösen. " (Matthew W. Crocker, "Rationale Modelle des Verständnisses: Adressierung des Leistungsparadoxons." Psycholinguistik des 21. Jahrhunderts: Vier Eckpfeiler, ed. von Anne Cutler. Lawrence Erlbaum, 2005)