Manfred Stede - Korpusgestützte Textanalyse

Здесь есть возможность читать онлайн «Manfred Stede - Korpusgestützte Textanalyse» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на немецком языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Korpusgestützte Textanalyse: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Korpusgestützte Textanalyse»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Viele Arbeitsgebiete der Linguistik haben in den letzten Jahren von einer Hinwendung zu empirischen Daten profitiert: Allgemein verfügbare Korpora erlauben die nachvollziehbare Prüfung von Hypothesen. Der vorliegende Band geht diesen Weg für die Textlinguistik. Die wesentlichen Ebenen der Textanalyse werden systematisch erläutert und Textualität als das Ergebnis der Interaktion dieser Ebenen gedeutet. Anhand einer linguistischen Datenbank und eines auf mehreren Ebenen annotierten Textkorpus können praktische Recherchen durchgeführt und die Mechanismen der Textkohärenz gründlicher untersucht werden als bisher sowohl qualitativ als auch quantitativ. Die 2. Auflage wurde vollständig überarbeitet und an vielen Stellen ergänzt, u.a. um ein eigenständiges Kapitel zur Argumentationsstruktur. Zudem steht jetzt für die Korpusrecherche das Potsdamer Kommentarkorpus online bereit und ist in die Übungsaufgaben des Buches integriert.
Stimmen zum Buch:
"… eine uneingeschränkte Empfehlung für alle, die sich mit moderner Textanalyse in praktischer Hinsicht befassen wollen." Info DaF 36, 2/3 (2009)
"Studierende der Sprachwissenschaft im allgemeinen und der Textlinguistik sowie der Computerlinguistik im besonderen werden dieses Buch als ein gutes Lernmittel erleben" ZfS 26 (2007)

Korpusgestützte Textanalyse — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Korpusgestützte Textanalyse», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Wenn eine Annotationsaufgabe so schwierig ist, dass sie einstweilen nicht oder nur mit ungenügender Ergebnisqualität automatisierbar ist, dann muss sie manuell durch geschulte Annotatoren ausgeführt werden. Dies ist bei allen in diesem Buch besprochenen Ebenen der Fall, auch wenn für einige davon bereits automatische Lösungen mit durchaus beachtlicher – aber eben nicht perfekter – Qualität existieren. Auch für die manuelle Annotation sind aber geeignete Software-Werkzeuge erforderlich, die vor allem diese zwei Zwecke erfüllen:

Das Werkzeug kann den jeweiligen Typus der Annotation durch eine geeignete Visualisierung und ein zugeschnittenes Bedienungskonzept optimal unterstützen und dadurch hohe Effizienz ermöglichen.

Die entstehenden Daten können in geeigneten Formaten abgespeichert werden, die eine einfache Weiterverarbeitung erlauben.

Mit anderen Worten: Linguistische Annotation sollte in aller Regel nicht mit dem gebräuchlichen Textverarbeitungs- oder Tabellenkalkulationsprogramm erfolgen. In den späteren Kapiteln gehen wir jeweils am Ende auf die konkrete Annotationsaufgabenstellung ein, nennen geeignete Werkzeuge, und geben weitere Hinweise auf der Homepage.

Aufwändige Annotationen entfalten ihre Wirkung freilich erst, wenn man nach ihnen auch recherchieren kann. Für die Syntax bedeutet dies vor allem die Suche in Datenbanken, die speziell auf Baumstrukturen zugeschnitten sind. Ebenso gibt es aber auch Korpora, die auf der Text-Ebene annotiert sind, beispielsweise für die Koreferenz zwischen Nominalphrasen (siehe Kap. 4 Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenen-orientierten Textlinguistik A. Francke Verlag Tübingen [bad img format] ). Auch dafür benötigt man dann spezielle Abfrage- und Auswertungswerkzeuge, um aus den Daten Erkenntnisse zu ziehen. (In manchen Fällen gestattet bereits das Annotationswerkzeug auch die Recherche, oft ist das aber nicht der Fall.)

Von besonderem Interesse ist es nun, wenn dieselben Primärdaten mit einer Reihe von ganz unterschiedlichen Annotationen versehen sind, aus deren Kombination sich dann – sei es durch manuelle Recherche oder durch statistische Auswertung – neue Erkenntnisse gewinnen lassen. Dies entspricht dem oben (S. 14) wiedergegebenen Zitat von Brandt u. Rosengren (1992), wonach Ebenen zueinander in Beziehung gesetzt werden, indem man sie an authentischem Material prüft. Möchte man dies an einigermaßen umfangreichem Textmaterial tun, so ist eine Automatisierung mittels einer Datenbank unerlässlich.

Damit dieses Szenario der MehrebenenannotationMehrebenen-Annotation (engl. multi-level annotation ) funktioniert, muss eine gewisse Systematik eingehalten werden, damit diese Ebenen einerseits separat recherchiert und ggf. auch verändert werden können. Um andererseits Korrelationen zwischen einzelnen Annotationsebenen aufdecken zu können, müssen alle Annotationen technisch mit den Primärdaten in derselben Weise verbunden sein. Dies wird durch eine sogenannte standoff-AnnotationStandoff-Annotation erreicht, bei der sowohl der Primärtext als auch jede Analyse-Ebene jeweils in einer einzelnen Datei gespeichert und die Verbindungen zwischen den Ebenen durch „Zeiger“ realisiert werden. Eine technische Grundlage dafür ist XMLXML (‚eXtensible Markup Language‘) als standardisiertes Austauschformat für Daten zwischen verschiedenen Software-Systemen. Der große Vorteil ist, dass man für die verschiedenen Analyse-Ebenen jeweils spezielle Werkzeuge benutzen kann, die auf die zugrunde liegenden Strukturen zugeschnitten sind und damit ein möglichst effektives Arbeiten erlauben.

Abbildung 11 Architektur der DatenAnnotation mit ANNIS Annotiert man nun - фото 1Abbildung 1.1:

Architektur der Daten-Annotation mit ANNIS

Annotiert man nun jeweils denselben Text mit verschiedenen Werkzeugen auf verschiedenen inhaltlichen Ebenen, müssen anschließend alle resultierenden Annotationen wieder zusammengefügt werden. Dies geschieht in einer linguistischen Datenbank, die dann die Recherche erlaubt. Abb. 1.1illustriert diese Konzeption: Die Annotationswerkzeuge auf der linken Seite (die dort genannten werden im Verlauf des Buches kurz angesprochen werden) erzeugen jeweils eigene XML-Dateien, die dann in einem geeigneten Austauschformat (wie zum Beispiel PAULA, Dipper (2005)) zusammengeführt und in die Datenbank (wie zum Beispiel ANNIS; siehe unten) eingespeist werden. Zusätzlich können weitere Werkzeuge für die statistische Auswertung der Daten benutzt werden; dieses Thema werden wir in diesem Buch aber nicht weiter besprechen.

Eine Alternative besteht darin, ein universelleres Annotationswerkzeug zu benutzen, mit dem sich unterschiedliche Typen von Information annotieren lassen; in diesem Fall entfällt die Zusammenführung der verschiedenen Annotationsformate. Es sollte aber stets abgewogen werden, ob dieser Vorteil nicht dadurch gemindert wird, dass das Werkzeug für einige der Annotationsschritte möglicherweise nur bedingt geeignet ist oder eine umständliche Handhabung mit sich bringt.

ANNIS

Weil die Datenbank in der Lage sein muss, für dieselben Primärtexte ganz unterschiedliche Annotationsschemata recherchierbar bereitzustellen und die Suchergebnisse angemessen zu visualisieren, sind Standard-Textdatenbanken für unseren Zweck nicht verwendbar. Die für dieses spezielle Szenario konzipierte linguistische Datenbank ANNIS entstand in einer ersten Version in den frühen 00er Jahren an der Universität Potsdam4 (Dipper u.a., 2004) und wurde später an der Humboldt Universität zu Berlin ausgiebig weiterentwickelt (Krause u. Zeldes, 2016). Es handelt sich um eine open-source software, die in der aktuellen Version ANNIS3 von der Webseite ‚corpus-tools.org‘ bezogen werden kann.5

Abbildung 12 Bildschirmabzug von ANNIS3 Ausschnitt ANNIS zeigt die - фото 2Abbildung 1.2:

Bildschirmabzug von ANNIS3 (Ausschnitt)

ANNIS zeigt die verschiedenen Annotationsebenen zu einem Text jeweils in einer Form, die dem Annotationstyp entspricht. In dem Bildschirmabzug in Abbildung 1.2(der nur einen Ausschnitt der Benutzeroberfläche zeigt) sind für denselben Textausschnitt die morphosyntaktischen Informationen, Syntax-Bäume, sowie die Koreferenz-Markierungen (vgl. Kap. 4 Manfred Stede Korpusgestützte Textanalyse Grundzüge der Ebenen-orientierten Textlinguistik A. Francke Verlag Tübingen [bad img format] ) angezeigt. Weitere Annotationsebenen können nach Wunsch aufgeklappt werden.

Die Suchfunktion von ANNIS gestattet die Formulierung von Anfragen, die mehrere Annotationsebenen miteinander verbinden. Angenommen, zu den gespeicherten Texten liegen Annotationen zur Syntax, zum Informationsstatus der Diskursgegenstände und zur rhetorischen Struktur vor, so ist es beispielsweise möglich, alle Textstellen zu finden, in denen

1 eine Präpositionalphrase am Satzanfang steht,

2 der in der dort eingebetteten NP denotierte Diskursgegenstand brand-new ist, und

3 die PP als Satellit der Kohärenzrelation Concession verwendet wird.

Ein entsprechender Satz könnte lauten: Trotz einer Verwarnung durch die Schiedsrichterin ging Leonie weiter mit großem Elan in die Zweikämpfe. Wie die Suchsprache AQL (‚ANNIS Query Language‘) benutzt wird, ist in den Hilfeseiten beschrieben, die in ANNIS integriert sind. Einführende Hinweise für den Start finden sich auch auf der Homepage zu diesem Buch (unter www.narr-studienbuecher.de), wo auch die URL einer öffentlich nutzbaren ANNIS-Installation angegeben ist, mit der das Potsdamer Kommentarkorpus bearbeitet werden kann.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Korpusgestützte Textanalyse»

Представляем Вашему вниманию похожие книги на «Korpusgestützte Textanalyse» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Korpusgestützte Textanalyse»

Обсуждение, отзывы о книге «Korpusgestützte Textanalyse» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x