Computerlinguistik
Auswahl Branchen-Buchstabe
|
In der Computerlinguistik (CL), oder linguistischen Datenverarbeitung (LDV),[1] wird untersucht, wie natürliche Sprache in Form von Text- oder Sprachdaten mit Hilfe des Computers algorithmisch verarbeitet werden kann. Sie ist Schnittstelle zwischen Sprachwissenschaft und Informatik.
Geschichte
Computerlinguistik lässt sich als Terminus (oder dessen Umschreibung) jedenfalls in die sechziger Jahre des 20. Jahrhunderts zurückverfolgen.[2] Als Aufgabenstellung war sie mit den Anfängen der künstlichen Intelligenz eigentlich schon nahegelegt und Chomskys Syntactic Structures von 1957 präsentierte die Sprache in einem entsprechend passenden neuen formalen Gerüst. Hinzu kamen die Sprachlogiken von Saul Kripke und Richard Montague. Aber die teilweise aus dem US-Verteidigungsbudget sehr hoch geförderten Forschungen brachten nicht die erhofften Durchbrüche. Gerade auch die Koryphäen Chomsky und Weizenbaum beschwichtigten die Erwartungen an Automatisierungen von Sprachübersetzung. Der Wende von behavioristischen Wissenschaftskonzeptionen zu mentalistischen (Chomsky) folgten umfassende Konzipierungen in den Kognitionswissenschaften.
In den siebziger Jahren erschienen dann zunehmend häufiger Publikationen mit dem Begriff Computerlinguistik im Titel. Es gab bereits finanziell aufwändige Versuche exegetischer Anwendungen (Konkordanzen, Wort- und Formstatistik), aber auch schon größere Projekte zur maschinellen Sprachanalyse und zu Übersetzungen. Die ersten Computerlinguistik-Studiengänge in Deutschland wurden an der Universität des Saarlandes und in Stuttgart eingerichtet. Die Computerlinguistik bekam mit der Verbreitung von persönlich gebrauchten Computern (PC) und mit dem Aufkommen des Internets neue Anwendungsgebiete. Im Gegensatz zu einer Internetlinguistik, die insbesondere menschliches Sprachverhalten und die darüber induzierten Sprachbildungen im und mittels Internet untersucht, entstand in der Computerlinguistik eine stärkere informatisch-praktische Ausrichtung. Doch gab das Fach die klassischen philosophisch-linguistischen Fragen nicht ganz auf und wird heute in theoretische und praktische Computerlinguistik unterschieden.
Gegenwärtige Aufgabe der Computerlinguistik
"Computerlinguistik erforscht die maschinelle Verarbeitung natürlicher Sprachen. Sie erarbeitet die theoretischen Grundlagen der Darstellung, Erkennung und Erzeugung gesprochener und geschriebener Sprache durch Maschinen."
- Universität München
Das Saarbrücker Pipelinemodell
Computer sehen Sprache entweder in der Form von Schallinformation (wenn die Sprache akustisch vorliegt) oder in der Form von Buchstabenketten (wenn die Sprache in Schriftform vorliegt). Um die Sprache zu analysieren, arbeitet man sich schrittweise von dieser Eingangsrepräsentation in Richtung Bedeutung vor und durchläuft dabei verschiedene sprachliche Repräsentationsebenen. In praktischen Systemen werden diese Schritte typischerweise sequentiell durchgeführt, daher spricht man vom Pipelinemodell, mit folgenden Schritten:
Spracherkennung
Falls der Text als Schallinformation vorliegt, muss er erst in Textform umgewandelt werden.
Tokenisierung
Die Buchstabenkette wird in Wörter, Sätze etc. segmentiert.
Morphologische Analyse
Personalformen oder Fallmarkierungen werden analysiert, um die grammatische Information zu extrahieren und die Wörter im Text auf Grundformen zurückzuführen, wie sie z. B. im Lexikon stehen.
Syntaktische Analyse
Die Wörter jedes Satzes werden auf ihre strukturelle Funktion im Satz hin analysiert (z. B. Subjekt, Objekt, Modifikator, Artikel, etc.)
Semantische Analyse
Den Sätzen bzw. ihren Teilen wird Bedeutung zugeordnet. Dieser Schritt umfasst potentiell eine Vielzahl verschiedener Einzelschritte, da Bedeutung schwer fassbar ist.
Dialog- und Diskursanalyse
Die Beziehungen zwischen aufeinander folgenden Sätzen werden erkannt: Im Dialog könnte das z. B. Frage ? Antwort sein, im Diskurs beispielsweise eine Aussage und ihre Begründung, oder eine Aussage und ihre Einschränkung.
Es ist allerdings nicht der Fall, dass sämtliche Verfahren der Computerlinguistik diese komplette Kette durchlaufen. Die zunehmende Verwendung von maschinellen Lernverfahren hat zu der Einsicht geführt, dass auf jeder der Analyseebenen statistische Regelmäßigkeiten existieren, die zur Modellierung sprachlicher Phänomene genutzt werden können. Beispielsweise verwenden viele aktuelle Modelle der maschinellen Übersetzung Syntax nur in eingeschränktem Umfang und Semantik so gut wie gar nicht; stattdessen beschränken sie sich darauf, Korrespondenzmuster auf Wortebene auszunutzen.[3]
Beispiele für Probleme der Sprachverarbeitung
Auflösung syntaktischer Mehrdeutigkeiten. In einigen Fällen lässt sich ein Satz auf mehrere Arten analysieren und deuten. Die Richtige auszuwählen, erfordert manchmal semantische Information über den Sprechakt und die Intention der Sprecher, mindestens jedoch statistisches Vorwissen über das gemeinsame Auftreten von Wörtern.
Beispiel: "Peter sah Maria mit dem Fernglas" - hier ist nicht zwangsläufig klar, ob Peter Maria gesehen hat, die ein Fernglas in der Hand hielt, oder ob Peter Maria mit Hilfe eines Fernglases sehen konnte.
Bestimmen der Semantik. Die gleiche Wortform kann je nach Kontext eine andere Bedeutung aufweisen (vergleiche Homonym, Polysem). Man muss die für den Kontext zutreffende Bedeutung auswählen. Auf der anderen Seite braucht man Formalismen zur Repräsentation von Wortbedeutungen.
Erkennen der Absicht einer sprachlichen Äußerung (siehe Pragmatik). Manche Sätze sind nicht wörtlich gemeint. Beispielsweise erwartet man auf die Frage "Können Sie mir sagen, wie spät es ist?" nicht eine Antwort wie "Ja" oder "Nein", sondern bittet damit um Auskunft über die Uhrzeit.
Anwendungen in der Praxis
Praktische Computerlinguistik ist ein Begriff, der sich im Lehrangebot einiger Universitäten etabliert hat. Solche Ausbildungsgänge sind nahe an konkreten Berufsbildern um die informatisch-technische Wartung und Entwicklung von sprachverarbeitenden Maschinen und ihrer Programme. Dazu gehören zum Beispiel:
Die Unterstützung des Computerbenutzers bei der Textverarbeitung, beispielsweise die automatische Korrektur von Tipp- und Rechtschreibfehlern, die Prüfung auf grammatische Richtigkeit oder die Umwandlung in Bedeutungszeichen in Japanisch oder Chinesisch.
Das Auffinden von Informationen in großen sprachlichen Datenmengen (Data-Mining, Informationsextraktion), von der automatische Suche nach relevanten Textstellen (Information Retrieval und Suchmaschinen) bis hin zur direkter Beantwortung von Fragen (Question Answering (QA)).
Die Unterstützung beim Übersetzen von Texten in eine andere Sprache (Computer-aided Translation (CAT)) oder auch die vollständige automatische Übersetzung.
Die Verarbeitung von gesprochener Sprache (Spracherkennung und Sprachsynthese), zum Beispiel bei digitalen Diktiergeräten oder Lesegeräten für Blinde.
Die Generierung von natürlichsprachlichen Texten wie Wegbeschreibungen oder Wettervorhersagen.
Die Aufbereitung von sprachlich vorliegenden Daten, beispielsweise die automatische Verschlagwortung von Literatur, die Anfertigung von Registern und Inhaltsverzeichnissen, die Herstellung von Zusammenfassungen und Abstracts.
Die Unterstützung von Autoren beim Verfassen von Texten, zum Beispiel das Finden des treffenden Ausdrucks oder der richtigen Terminologie, etwa bei der Verwendung eines kontrollierten Vokabulars in der technischen Dokumentation.
Die sprachliche Interaktion mit einem Benutzer im Rahmen eines Dialogsystems, z. B. bei telefonischen Auskunftsdiensten, aber auch zur Sprachsteuerung technischer Geräte oder Computer.
Die automatisierte Messung von persönlichen Stärken anhand natürlicher Gespräche wie offenen Interviews, Bewerbungsgesprächen, Talkshows, Podiumsdiskussionen oder Gruppendiskussionen.
Institutionen
Studienmöglichkeiten
Computerlinguistik kann man im deutschsprachigen Raum an verschiedenen Hochschulen als eigenständiges Fach mit verschiedenen Abschlussmöglichkeiten studieren. Diplom- und Magisterprogramme sind dabei inzwischen am Auslaufen und können im Allgemeinen nicht mehr neu begonnen werden. Sie wurden durch Bachelor- und Masterprogramme ersetzt. Die Studiengänge können sehr unterschiedliche Namen haben und haben unterschiedliche Profile (mehr/weniger Sprachwissenschaft bzw. Informatik, Anbindung an die Kognitionswissenschaft etc.). Als Studiengang wird die CL auch als linguistische Datenverarbeitung oder maschinelle Sprachverarbeitung[4] bezeichnet. Die Computerlinguistik als Studienfach ist als Kleines Fach eingestuft, eine Übersicht über die Studienmöglichkeiten zeigt die Kartierung der Arbeitsstelle Kleine Fächer.[5]
Die folgende Liste ist nicht vollständig, umfasst aber die größten Institute im deutschsprachigen Raum mit grundständigen Studiengängen:
Bielefeld: B.A./B.Sc. Nebenfach Texttechnologie und Computerlinguistik
Heidelberg: B.A. Computerlinguistik, M.A. Computerlinguistik
München: B.Sc./M.Sc. Computerlinguistik, auch B.Sc. Informatik plus Computerlinguistik
Potsdam: B.Sc. Computerlinguistik
Saarbrücken: B.Sc. Computerlinguistik, M.Sc. Language Science and Technology
Stuttgart: B.Sc. Maschinelle Sprachverarbeitung, M.Sc. Computational Linguistics
Trier: B.A. Sprach- und Texttechnologie, M.A. Sprach- und Texttechnologie
Tübingen: B.A./M.A. International Studies in Computational Linguistics
Zürich: B.A. Computerlinguistik (+Sprachtechnologie), M.A. Computerlinguistik (+Sprachtechnologie)
Schulen
Computational Linguistics Fall School: Seit 2001 regelmäßig alle zwei Jahre stattfindende Herbstschule der Deutschen Gesellschaft für Sprachwissenschaft in englischer Sprache.
ESSLLI: European Summer School in Logic, Language and Information
EMA Summerschool: European Masters in Language and Speech Technology Summerschool
Tagungen
ACL jährlich stattfindende Konferenz der "Association of Computational Linguistics"
COLING seit 1965 in zweijährigem Abstand stattfindende, internationale Konferenz[6]
Recent Advances in Computational Linguistics (RANLP) ging aus einer Sommerschule hervor, seit 2001 in zweijährigem Abstand[7]
Die International Joint Conference on Natural Language Processing (IJCLP) findet in unregelmäßigen
Abständen seit 2004 im asiatischen Raum statt[8]
Jährlich stattfindende Studentische Tagung Sprachwissenschaft (StuTS) - drei- bis viertägige Tagung von Studenten für Studenten;
Tagung der Computerlinguistik-Studierenden (TaCoS) deutschsprachiger Universitäten, die seit 1992 jährlich an jeweils an einer anderen Universität stattfindet;
Alle zwei Jahre stattfindende Jahrestagung der Gesellschaft für linguistische Datenverarbeitung (GLDV) bzw. (seit 2008) Gesellschaft für Sprachtechnologie und Computerlinguistik (GSCL).
KONVENS - Konferenz zur Verarbeitung natürlicher Sprache seit 1992 in zweijährigem Abstand
stattfindende Konferenz, abwechselnd organisiert von den Gesellschaften ÖGAI, DGfS-CL und GSCL
Organisationen
Association for Computational Linguistics (ACL)
AFNLP (Asian Federation of Natural Language Processing Associations)
Deutsche Gesellschaft für Sprachwissenschaft (DGfS) / Sektion Computerlinguistik
Gesellschaft für Sprachtechnologie und Computerlinguistik (GSCL), bis 2008 "Gesellschaft für linguistische Datenverarbeitung (GLDV)"
Österreichische Gesellschaft für Artificial Intelligence / (ÖGAI) / Bereich Sprachverarbeitung
Siehe auch
Algebraische Linguistik
Korpuslinguistik
Mathematische Linguistik
Quantitative Linguistik
Quantitative Literaturwissenschaft
Sprachstatistik
Text-Quelle Wikipedia: https://de.wikipedia.org/ wiki/Computerlinguistik
|
IN IST WER DRIN IST ...
Online-Werbung im Internet-Netzwerk www.spessartland.de
Die Homepage Spessartland ist als Netzwerk für die Wirtschafts-Region Mainviereck mit dem Ziel konzipiert, die
kontinuierliche Weiterentwicklung und Stärkung der Wettbewerbsfähigkeit der Region SPESSART als aktiven
sowie attraktiven Lebens- und Wirtschaftsraum zu fördern.

Das Portal liefert Ihnen einen Überblick über
Gewerbe
(Handwerker, Handel, Dienstleister, Geschäfte verschiedenster Art),
regionale Produkte, Branchen von A bis Z, Natur, Kultur, Events, Aktivitäten wie wandern, radfahren etc.
sowie sonstige Informationen aus der Region.
Somit wird die Möglichkeit geboten, effizient und günstig zu werben indem Sie
Ihr Unternehmen und Ihre Produkte in www.spessartland.de präsentieren.
Ihr Unternehmen in der Homepage Spessartland oder in proSpessart zu präsentieren bedeutet,
effizient und günstig online werben auf einer besucherstarken Internetseite
für die Spessartregion
im gesamten Mainviereck.
 Wir besprechen mit Ihnen Ihre Homepage-Wünsche und individuellen
Anforderungen, definieren diese Ziele und setzen sie dann in ein
mediengerechtes und zielgruppenorientiertes Konzept um. Sie erhalten eine
sinnvolle Struktur, informative Inhalte und ein einheitliches und
ästhetisches Erscheinungsbild.
Somit kreieren wir aus Ihren Firmendaten eine Designer-Seite mit
Beschreibung und Fotos, präsentieren ihr Unternehmen und steigern Ihren Bekanntheitsgrad incl.
Optimierung von Image und Wettbewerbsfähigkeit, indem Ihre Werbung auf einer
besucherstarken Internetseite platziert wird.
Darüber hinaus werden individuelle Firmenbegriffe für Suchmaschinen
gespeichert (z.B. "Bau"), die Ihre Seitenpräsentation in Suchmaschinen
finden lassen.

Gefunden werden Sie jedoch nur, wenn wir Ihre Seite mit spezifischen
Suchmaschinen-Schlagwörtern füllen. Und verstanden werden Sie im Anschluss
nur, wenn wir dementsprechend aussagekräftig gestalten.
Denn Ihre Seiten-Besucher sollen nicht nur Interessenten sondern
letztendlich auch Neukunden werden.
Und wenn Sie dann in Google nach " bau im spessart" oder " bau im
mainviereck" suchen, so erscheint proSpessart & Spessartland von jeder Menge Auswertungsseiten
meistens vorne. Und vorne bedeutet, unter den ersten drei Ergebnisseiten aufgeführt zu sein.
P R E I S / LEISTUNG
-
Beschreibung mehrerer DIN A4 Seiten kreiert auf eine
Scroll-Seite (Seitenanfang / Seitenende per Scrollsystem und Button)
-
Internetgerechte Bildbearbeitung
-
10 Fotos wobei bei Anklick auf ein Foto dieses in Großformat erscheint (bei Bedarf auch mehr Fotos)
-
automatischer Bildwechsel im Seitenkopf (wie diese Seite)
-
Verlinkung mit Ihrer vorhandenen Homepage
-
Suchmaschinenoptimierung
-
Seitenbehandlung wie ein eigenständiger Internetauftritt (mit Domain proSpessart
oder Spessartland und Ihren Firmennamen)
Nutzen Sie die Chancen dieser Internetwerbung und präsentieren Sie Ihr
erfolgreiches Unternehmen, denn nur wer präsent ist, bleibt auch weiterhin
im Gespräch.
Und das für nur 5,-- € monatlich mit jederzeitiger Kündigung spätestens drei
Monate vor Jahresabschluss.
Sollten Sie eine eigene Homepage mit Domaine wünschen so stehen wir für ein
unverbindliches Beratungsgespräch gerne zu Verfügung.
Branchen-Internetauftritte
bitte hier klicken ...
Setzen Sie sich mit
Spessartland in Verbindung unter eMail:
info@spessartland.de und Telefon 01575 / 587 1668.
|