Konstanze Marx - Internetlinguistik

Здесь есть возможность читать онлайн «Konstanze Marx - Internetlinguistik» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на немецком языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Internetlinguistik: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Internetlinguistik»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Rasante technologische Entwicklungen, die Ausweitung der digitalen Kommunikation und deren Auswirkungen auf Sprache und Interaktion kreieren einen dynamischen Datenpool für eines der spannendsten Teilgebiete der modernen Sprachwissenschaft: die Internetlinguistik. Ziel dieses Lehr- und Arbeitsbuches ist es, umfassend über diesen lebendigen Forschungsbereich zu informieren und zu zeigen, wie sprach- und kommunikationswissenschaftliche Methoden sinnvoll kombiniert werden können, um die Eigenheiten sprachlich-kommunikativen Handelns im Internet zu analysieren. Auf leserfreundliche Weise werden aktuelle Forschungsergebnisse mit zahlreichen Anwendungsbeispielen und Übungen didaktisch aufbereitet. Das Buch ist als Einführung konzipiert und eignet sich gleichermaßen für die Seminargestaltung und das Selbststudium.
Über die 1. Auflage:
"Beschreibung und Analyse internetbasierter Formen der Sprachverwendung werden jeweils rückgebunden an konkretes Anschauungsmaterial, sodass auch hier Begriffliches und Illustrierendes eine gelungene Synthese eingehen." – Weiterbildung 3/2015

Internetlinguistik — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Internetlinguistik», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

MiniGlossar Korpuslinguistik annotierenzusätzlich zu den sprachlichen Daten - фото 24 Mini-Glossar Korpuslinguistik

annotieren:zusätzlich zu den sprachlichen Daten innerhalb einer Datenbank werden sprachwissenschaftlich relevante Daten gespeichert, z. B. Wortarten (‚taggingtagging‘) oder die syntaktische Struktur bei komplexen Äußerungen (‚parsing‘). Das ist ein mühsamer manueller Vorgang, der deshalb häufig von automatischen Verfahren übernommen wird. Diese sind wiederum sehr fehleranfällig, so dass eine manuelle Nachbearbeitung notwendig ist.

lemmatisieren:die einem Lexem zugehörige unflektierte Grundform wird notiert, z. B. für das Lexem ging das Lemma gehen oder für Räume das Lemma Raum .

KonkordanzKonkordanz:Liste von Kotexten für ein Schlüssel-Lexem

Bruchpilot in: „Die Bilanz von Bruchpilot Wowereit“ (n-tv.de, 2013-03-19); „Streicht dem Bruchpiloten Wowereit die Pension“ (berliner-kurier.de, 2012-07-21); „Bruchpilot Wowereit tauft den A380“ (bz.de, 2012-05-22); „Die Nähe zur Partei wurde der Zeitung jedoch spätestens mit dem Grounding der Swissair und ihrer [sic!] freisinnigen Bruchpiloten zum Verhängnis“ (zeit.de, 2010-04-08)

KollokationKollokationen:Ausdruck aus mehreren Wörtern mit (statistisch) starkem Zusammenhalt

auf Nummer sicher gehen in: „Die Flughafenplaner wollen auf Nummer sicher gehen: Die endgültige Entscheidung für den Termin werde der Aufsichtsrat nun voraussichtlich erst im August fällen, erklärte Berlins Regierender Bürgermeister Klaus Wowereitals Chef des Kontrollgremiums.“ (spiegel.de, 2012-06-22)

Part-of-speech-Tagging (POS-tagging):regelbasiertes Etikettieren von Token im KorpusKorpus mit entsprechenden Wortarten

In/PRÄP Berlin/N sprach/VFIN man/PRONINDEF über/PRÄP den/ART Rücktritt/N von/PRÄP Klaus/EIGENN Wowereit/EIGENN1.

TokenToken:Kleinste Einheit in einem Korpus. Über die Anzahl der Tokens wird die Korpusgröße bestimmt.

Von 1Anfang 2an 3war 4der 5massive 6politische 7Einfluss 8von 9Wowereit 10und 11Platzeck 12das 13Todesurteil 14für 15das 16Bauprojekt 17an 18Berlins 19Stadtrand 20.

TypeType:Identische Tokens in einem KorpusKorpus. Über die Anzahl der Types wird die Vokabelgröße bestimmt.

Von 1Anfang 2an 3war 4der 5massive 6politische 7Einfluss 8von Wowereit 9und 10Platzeck 11das 12Todesurteil 13für 14das Bauprojekt 15an Berlins 16Stadtrand 17.

Ausgewählte Korpora im Überblick DiDiKorpus - фото 25 Ausgewählte Korpora im Überblick

DiDi-Korpus: https://commul.eurac.edu/annis/didi

deWac: http://wacky.sslmit.unibo.it/doku.php?id=corpora

Chat-Korpus: www.chatkorpus.tu-dortmund.de

MoCoDa: https://mocoda.spracheinteraktion.de

MoCoDa2: https://db.mocoda2.de/#/c/home

SMS: www.mediensprache.net/archiv/corpora/sms_os_h.pdf

Wikipedia: https://cosmas2.ids-mannheim.de/cosmas2-web/

Blogs und Webkorpus: www.dwds.de/d/k-spezial#blogsLiveticker und Blogs: https://fussballlinguistik.linguistik.tu-berlin.de

Aufgabe 13 Welche Schwierigkeiten können sich bei der Arbeit mit bereits - фото 26 Aufgabe 1-3

Welche Schwierigkeiten können sich bei der Arbeit mit bereits bestehenden Korpora ergeben?

Mit bestehenden, annotierten Korpora zu arbeiten, birgt durchaus Nachteile, insbesondere wenn man die Linguistik als Wissenschaft auffasst, die „regelmäßige Beziehungen zwischen sprachlichen Formen und kommunikativen Funktionen beschreiben will“ (Consten 2014). So können bei der Annotation nicht nur formale Zuordnungsfehler entstehen. Wenn es den Personen, die annotieren, nicht gelingt, eine Äußerung ohne eigene Interpretation, in eine vorgegebene Maske einzupassen, kann das Datenmaterial gar verfälscht werden. Die Interpretation wiederum ist ein natürlicher mit dem Verstehen von Text verbundener Prozess (vgl. Consten 2014 und auch Kapitel 4.3.1). Unter anderem darin liegt die Ursache, dass sich selbst aufwändig generierten und annotierten Korpora keine Antworten auf spezifische Fragen, wie „die Funktion syntaktischer Satzmodi als Marker für Sprechakttypen, die informationsstrukturierende Wirkung von Wortstellungsvariationen, die semantisch-logisch kaum beschreibbare Bedeutung mancher Modalpartikeln [oder] der referenzsemantische Effekt von Definitheit“ (Consten 2014) entnehmen lassen. Auch intentionale Normabweichungen lassen sich z. B. nur schwer von Fehlern abgrenzen. Unmöglich ist es zudem, vom Nicht-Vorkommen eines Phänomens im Korpus auf ein generelles Nicht-Vorkommen im Sprachgebrauch zu schließen (Schlobinski 2011: 133 f.).

Unabhängig davon, ob man nun explorativ vorgehen oder einer Hypothese nachgehen möchte, ist es also durchaus ratsam, selbst Daten zu erheben und zu einem Korpus zusammenzustellen. Nicht zuletzt aus forschungspraktischen Erwägungen (Kosten- und Ressourcenersparnis) drängt sich die Frage auf, inwieweit nicht auch das gesamte WWW als Korpus genutzt und entsprechend ausgewertet werden kann.

Exploratives Vorgehen dient dem Abstecken eines Forschungsfeldes und soll zu - фото 27 Exploratives Vorgehen dient dem Abstecken eines Forschungsfeldes und soll zu Hypothesen führen.

Das World Wide Web verfügt über eine unüberschaubare Datenmenge, die frei verfügbar und leicht zugänglich ist. Zudem entfällt ein mühsames Transkribieren, weil sie bereits in schriftlicher Form vorliegen. Theoretisch kann das WWW also für alle möglichen sprachwissenschaftlichen Forschungsfragen genutzt werden. Die Texte sind jedoch zumeist in Dokumente eingebettet, die weitere Kodierungen aufweisen (Menüführungen, Werbung, sog. Boilerplates usw.), vgl. Schulte im Walde/Zinsmeister (2006).

Boilerplatessind gleichbleibende TextElemente Zudem sind oftmals keine - фото 28 Boilerplatessind gleichbleibende (Text-)Elemente.

Zudem sind oftmals keine Meta-Informationen verfügbar. Wer ist beispielsweise der*die Autor*in eines Textes? Wie sind seine*ihre Sprachkompetenzen einzuschätzen? Zu berücksichtigen ist auch, welche Sprache im Web vorherrschend ist und ob das Web überhaupt repräsentativ ist für den Sprachgebrauch, den man untersuchen möchte. Damit einher geht die Frage nach den Textsorten, die im Web vorkommen (siehe auch Kapitel 5.4, vgl. auch Bubenhofer 2011). Auch die rechtlichen Grundlagen erschweren die Anwendung des WWW als Korpus.

Aufgabe 14 Geben Sie in drei Suchmaschinen Ihrer Wahl das Stichwort - фото 29 Aufgabe 1-4

Geben Sie in drei Suchmaschinen Ihrer Wahl das Stichwort Persuasion ein. Welche Ergebnisse erhalten Sie?

Problematisch ist zudem, dass die Suchmaschinen nicht die Funktionalitäten aufweisen, die für sprachwissenschaftliche Zwecke vonnöten sind. Die Defizite im Hinblick auf die Abfragesprache, die Annotationen, die Repräsentativität der erfassten Webseiten und Intransparenz beim Indizieren und Ranking werden bei Bubenhofer (2011) erläutert und werden hier zusammengefasst wiedergegeben:

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Internetlinguistik»

Представляем Вашему вниманию похожие книги на «Internetlinguistik» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Internetlinguistik»

Обсуждение, отзывы о книге «Internetlinguistik» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x