Parsing ist ein grammatikalisch Übung, bei der ein Text in seine Bestandteile der Sprache zerlegt wird, mit einer Erklärung der Form, Funktion und syntaktisch Beziehung jedes Teils, so dass der Text verstanden werden kann. Der Begriff "Parsing" stammt aus dem Lateinischen pars für "Teil (der Rede)".
In der zeitgenössischen Linguistik bezieht sich das Parsen normalerweise auf die computergestützte syntaktische Analyse der Sprache. Computerprogramme, die automatisch Parsing-Tags zu a hinzufügen Text werden genannt Parser.
Key Takeaways: Parsen
- Beim Parsen wird ein Satz in seine Elemente zerlegt, damit der Satz verstanden werden kann.
- Das traditionelle Parsen erfolgt von Hand, manchmal unter Verwendung von Satzdiagrammen. Das Parsen ist auch an komplexeren Analyseformen wie Diskursanalyse und Psycholinguistik beteiligt.
Analyse analysieren
Im Linguistikzu analysieren bedeutet, einen Satz in seine zu zerlegen Bauteile damit die Bedeutung des Satzes verstanden werden kann. Manchmal wird das Parsen mit Hilfe von Werkzeugen wie Satzdiagrammen (visuelle Darstellungen syntaktischer Konstruktionen) durchgeführt. Beim Parsen eines Satzes nimmt der Leser die Satzelemente und ihre Wortarten zur Kenntnis (ob ein Wort ein Substantiv, ein Verb, ein Adjektiv usw. ist). Der Leser bemerkt auch andere Elemente wie die Verbform (Gegenwart, Vergangenheitsform, Zukunftsform usw.). Sobald der Satz aufgeschlüsselt ist, kann der Leser anhand seiner Analyse die Bedeutung des Satzes interpretieren.
Einige Linguisten unterscheiden zwischen "vollständiger Analyse" und "Skelettanalyse". Ersteres bezieht sich auf die vollständige Analyse eines Textes, einschließlich einer möglichst detaillierten Beschreibung seiner Elemente. Letzteres bezieht sich auf eine einfachere Form der Analyse, mit der die Grundbedeutung eines Satzes erfasst wird.
Traditionelle Analysemethoden
Traditionell wird das Parsen durchgeführt, indem ein Satz in verschiedene Teile der Sprache zerlegt wird. Die Wörter werden in verschiedene grammatikalische Kategorien eingeteilt, und dann werden die grammatikalischen Beziehungen zwischen den Wörtern identifiziert, so dass der Leser den Satz interpretieren kann. Nehmen Sie zum Beispiel den folgenden Satz:
- Der Mann öffnete die Tür.
Um diesen Satz zu analysieren, klassifizieren wir zuerst jedes Wort nach seinem Wortbestandteil: das (Artikel), Mann (Substantiv), geöffnet (Verb), das (Artikel), Tür (Substantiv). Der Satz hat nur ein Verb (geöffnet); wir können dann das Subjekt und Objekt dieses Verbs identifizieren. In diesem Fall ist das Subjekt, da der Mann die Aktion ausführt Mann und das Objekt ist Tür. Weil das Verb ist geöffnet-eher, als öffnet oder wird Öffnen- Wir wissen, dass der Satz in der Vergangenheitsform ist, was bedeutet, dass die beschriebene Aktion bereits stattgefunden hat. Dieses Beispiel ist einfach, zeigt jedoch, wie das Parsen verwendet werden kann, um die Bedeutung eines Textes zu beleuchten. Herkömmliche Analysemethoden können Satzdiagramme enthalten oder nicht. Solche visuellen Hilfsmittel sind manchmal hilfreich, wenn die zu analysierenden Sätze besonders komplex sind.
Diskursanalyse
Im Gegensatz zum einfachen Parsen bezieht sich die Diskursanalyse auf ein breiteres Studienfeld, das sich mit den sozialen und psychologischen Aspekten der Sprache befasst. Diejenigen, die Diskursanalysen durchführen, interessieren sich unter anderem für Sprachgenres (diejenigen mit bestimmten Konventionen in verschiedenen Bereichen festlegen) und die Beziehungen zwischen Sprache und sozialem Verhalten, Politik und Erinnerung. Auf diese Weise geht die Diskursanalyse weit über den Rahmen der traditionellen Analyse hinaus, die auf diese einzelnen Texte beschränkt ist.
Psycholinguistik
Psycholinguistik ist ein Studienbereich, der sich mit Sprache und ihrer Beziehung zu Psychologie und Neurowissenschaften befasst. Wissenschaftler, die auf diesem Gebiet arbeiten, untersuchen die Art und Weise, wie das Gehirn Sprache verarbeitet und Zeichen und Symbole in aussagekräftige Aussagen umwandelt. Als solche interessieren sie sich hauptsächlich für die zugrunde liegenden Prozesse, die das traditionelle Parsen ermöglichen. Sie interessieren sich zum Beispiel dafür, wie unterschiedliche Gehirnstrukturen den Spracherwerb und das Sprachverständnis erleichtern.
Computergestütztes Parsen
Computerlinguistik ist ein Forschungsgebiet, in dem Wissenschaftler einen regelbasierten Ansatz verwendet haben, um Computermodelle menschlicher Sprachen zu entwickeln. Diese Arbeit kombiniert Informatik mit Kognitionswissenschaft, Mathematik, Philosophie und künstlicher Intelligenz. Mit computergestütztem Parsen können Wissenschaftler Algorithmen verwenden, um Textanalysen durchzuführen. Dies ist besonders für Wissenschaftler nützlich, da solche Tools im Gegensatz zum herkömmlichen Parsen schnell verwendet werden können Analysieren Sie große Textmengen und enthüllen Sie Muster und andere Informationen, die nicht einfach zu erhalten waren Andernfalls. Im aufstrebenden Bereich der digitalen Geisteswissenschaften wurde beispielsweise computergestütztes Parsen verwendet, um die Werke von Shakespeare zu analysieren. 2016 folgerten Literaturhistoriker aus einer Computeranalyse des Stücks, dass Christopher Marlowe war der Co-Autor von Shakespeares "Heinrich VI."
Eine der Herausforderungen beim computergestützten Parsen besteht darin, dass Computermodelle der Sprache regelbasiert sind, was bedeutet, dass Wissenschaftler Algorithmen mitteilen müssen, wie bestimmte Strukturen und Muster zu interpretieren sind. In der tatsächlichen menschlichen Sprache haben solche Strukturen und Muster jedoch nicht immer die gleiche Bedeutung, und Linguisten müssen einzelne Beispiele analysieren, um die Prinzipien zu bestimmen, die sie regeln.
Quellen
- Dowty, David R. et al. "Parsing in natürlicher Sprache: Psychologische, rechnergestützte und theoretische Perspektiven." Cambridge University Press, 2005.
- Halley, Ned. "Das Wordsworth Dictionary of Modern English: Grammatik, Syntax und Stil für das 21. Jahrhundert." Wordsworth Editions, 2001.