Der Zauber der Sprache aus informationstheoretischer Sicht

Die Sprache ist ein, was die informationstheoretische Betrachtung betrifft, hochgradig redundantes Konstrukt. Wenn wir jemandem eine Information auf Basis der Sprache übermitteln, so liefern wir unserem Gegenüber gleich ein Vielfaches der relevanten Informationsmenge. Diese Tatsache wird bei computerbasierten Komprimierungsverfahren ausgenutzt um Texte zu komprimieren . Völlig klar, dass solch ein Kompressionsverfahren nicht die semantischen Redundanzen und Irrelevanzen, sondern nur jene auf der „Zeichenebene“ entfernt. Diese Redundanz der Sprache hat, und darum soll es nun hier gehen, jedoch noch einen ganz anderen witzigen Nebeneffekt: Es lassen sich im Text „geheime“ Nachrichten verstecken, wobei hierbei die Informationsmenge ausgenutzt werden kann, die nicht zur Übertragung der primären Information notwendig ist. Um das zu erreichen wird der irrelevanten Informationsmenge eine „geheime“ Information aufgeprägt.

kleines Beispiel: „das Wetter gefällt niemandem“
das Metrum könnte man so bestimmen: xXxxXXxx

Nun steckt in diesem Metrum bereits ein einfacher digitaler Binärcode mit dessen Hilfe man im Metrum selber Informationen codieren könnte.
(Hier könnte man das Metrum als ein Datenbyte mit 8 Bit verstehen: 01001100)
Übrigens: Unser Gehirn verarbeitet auch diese 8 Datenbits (meist unterbewusst), da uns der „Klang“ des Metrums ja auch beeinflusst.
Aber nicht nur Metren enthalten dieses ,zur Chiffrierung notwendige, Informationspotenzial. Auch das gesamte hochkomplexe Geflecht der klang bestimmenden Vokale oder Konsonanten ist hochgradig informationsgeladen und ließe sich sicherlich ausnutzen. Das Interessante ist nun aber, dass dies nicht nur eine witzige und verschrobene Spielerei ist, sondern Alltag. Ohne dass wir uns dessen bewusst sind, verarbeitet unser Hirn ständig solche, nicht direkt erkennbaren, Subinformationen, welche sich irgendwo im Dickicht der Sprache verbergen. Beim gesprochenen oder gar gesungenen Wort wird diese Subinformationsvielfalt besonders krass spürbar. Wenn wir in ein Konzert gehen, wollen wir ja nicht nur den Informationsgehalt des gesungenen Textes genießen, sondern die gigantische Subinformationsfülle, welche sich in den klanglichen Nuancen verbirgt.

Ich glaube das der „Zauber“ der Lyrik in der kunstvollen Ausnutzung der „Subinformationsmenge“ besteht, also darin dem Hirn neben der einfachen ersten Bedeutungsschicht auch weitere Informationsschichten zu präsentieren, die dann oft unterbewusst wirken und uns daher so sprachlos machen. Wer kennt es nicht: Das Gefühl des fassungslosen Staunens und Ergriffenseins nach dem Lesen eines sehr guten Gedichtes. Nein: wir sind nicht ergriffen weil uns der oberflächliche Informationsgehalt beeinflusst, sondern weil uns Informationen auf unterschwellig verlaufenden Kanälen erreicht. Irgendwo in den Texten steckt Information, welche uns so stimuliert, dass wir vom Text begeistert sind. Besonders gut sind Texte, bei denen wir nicht erklären können warum wir so ergriffen sind. Der Text wirkt einfach, ob wir wollen oder nicht.

Was mich an der Sprache so fasziniert ist eben ihre undurchschaubare Tiefe, welche letztlich auf ihrer Informationsdichte beruht, von der wir nur einen kleinen Teil bewusst verarbeiten. Eventuell empfindet ihr das ähnlich – Über Hinweise, Denkanstöße, weiterführende oder vervollständigende Anmerkungen und Anregungen würde ich mich sehr freuen.

Liebe Grüße
GEO

8 Kommentare zu “Der Zauber der Sprache aus informationstheoretischer Sicht”

  1. LeV
    Januar 1st, 2007 18:00
    1

    Sprache vermittelt ja, wie du schon schreibst, mehr als die rein referentiellen Informationen. Ein Referent ist der „Gegenstand“, über den man spricht, z.B. ein grüner Baum oder schönes Wetter. Er kann durchaus abstrakt sein. Referentielle Informationen sind die sprachlichen Inhalte, die zu diesem Referenten übermittelt oder gesendet werden. In einer Diskussion, in der ein Diskutant fordert, die sachliche Ebene nicht zu verlassen, wünscht er sich, bei den referentiellen Informationen zu bleiben.

    Aber Sprache kann freilich mehr. Roman Jakobson rechnet ihr noch fünf weitere Funktionen zu, wobei sich sicherlich noch mehr sinnvolle Aspekte herausfiltern lassen. Da gibt es die konative Funktion, die einen Appell vermittelt, die emotive, die unseren Gegenüber etwas von unserer Befindlichkeit erfahren läßt, die phatische, die den Kommunikationskanal prüft, die metasprachliche, die den Kommunikationscode prüft und die poetische.

    Diese Funktionen treten in einer sprachlichen Äußerung nicht in Reinform auf, sondern immer in einer Mischung mit unterschiedlicher Gewichtung. So gilt z.B. für die schöngeistige Literatur, dass sie an erster Stelle poetische Funktion hat, also um das Spiel mit, die Arbeit an der Sprache selbst bemüht ist und diese Bemühungen auch vermittelt. Auch eine alltagssprachliche Äußerung kann poetisch sein, doch ist das nicht ihr erstes Anliegen.

    So beschränkt sich also das Geheimnis meiner „Geheimbotschaft“, die ich als Sender in meiner sprachlichen Äußerung „mitkodiere“ auf sprachinhärente Faktoren, die vom Empfänger nur nicht so bewußt [sic!] wahrgenommen werden. Unterbewußt wirken sie dennoch und dies ist eine Sprachkompetenz, die man einer Maschine (noch) nicht beibringen kann. Beispiel: Wenn sich zwei Leute in einem Raum befinden, in dem das Fenster offen steht und der eine bemerkt, dass es aber sehr kalt sei, dann registriert die Maschine, dass der anderes es kalt findet, der Mensch aber geht und schließt das Fenster. Tut er das nicht und erweist sich als unkoorperativer Zuhörer (was unter einigen meiner Freunde zu einem neuen Trendsport geworden ist), könnte der Sender das als Beleidigung oder soziale Inkompetenz deuten.

    Es sind solche nicht-referentiellen Inhalte, die auch in der Form eines Gedichtes mittransportiert werden. Es sind Inhalte, die wir nicht begrifflich fassen können. Man kann sich das vorstellen, wie ein instrumentales Musikstück, das uns in irgendeiner Form bewegt. Da gibt es Figuren, die uns auf’s Herz drücken, andere wirken gruselig oder quicklebendig. Aber es gibt keinen Text, der uns das vermittelt, es gibt nur die musikalische Form.

    Im Gedicht gibt es die musikalische Form, die sprachlich gebildet wird, zugleich vermittelt die Sprache selbst aber auch begrifflich faßbare Inhalte. Darin liegt ein Mehrwert, den viele Dichter heute gar nicht mehr erkennen, wenn sie die Form eines poetisches Textes als für den persönlichen künstlerischen Ausdruck irrelevant erachten.

  2. Antineutrino
    September 21st, 2007 22:25
    2

    Aus informationstheoretischer Sicht ist die Sprache ein informationsübertragendes Medium , welches seinen Informationsgehalt an dem Grade der Geordnetheit / Ungeordnetheit bestimmt. Das heißt je Geordneter ( Poetischer, Durchdachter, Rhytmischer usw.) desto größer ist die Transportierte Information. Umgekehrt funktioniert dieser Effekt jedoch nicht, denn die Unordnung ist nach Unten beschränkt.

    Irie.

  3. LeV
    September 21st, 2007 22:55
    3

    Moment, wenn der Informationsgehalt eines geordneten Textes höher ist als der eines ungeordneten Textes (was logisch ist, da die ganze Info über dessen Ordnung ja zusätzlich mitgeliefert wird), dann ist das doch aber etwas, das in beide Richtungen funktioniert. Oder meinst du mit „nach unten beschränkt“, man könne einen Text nicht unordentlicher machen? Wenn er vorher geordnet ist, denke ich nämlich schon. Interessanter Wikipedia-Artikel zu diesem Thema Entropie in der Informationstheorie. Was ich auch nicht verstehe, ist, wie bestimmt man den Grad der Entropie? Ist nun „der Erlkönig“ geordneter und also informativer als „Die Bürgschaft“?

  4. GEO
    September 22nd, 2007 16:32
    4

    Zunächst einmal ist der Informationsgehalt eines Textes umso größer, je ungeordneter die Symbole, aus welchen er besteht, angeordnet sind. Möchte man einen Text auf einer Datenleitung von A nach B senden, so dauert die Übertragung eines ungeordneten „Buchstabensalates“ am längsten. Ein geordneter Text kann entsprechend seines Odnungsgrades komprimiert werden und benötigt weniger Zeit. Die maximale Entropie (Entscheidungsgehalt eines Symboles) berechnet sich wie folgt: H0= ld(n) wobei n=Anzahl der untersch. Symbole ist. Der Entscheidungsgehalt wird in Bit/Symbol angegeben. Die maximale Entropie wird dann erreicht, wenn alle Symbole gleich warscheinlich auftreten.

    Krasses Beispiel zum Thema Gedicht:

    Hallo Hallo Hallo
    Hallo Hallo Hallo
    Hallo Hallo Hallo

    Hallo Hallo Hallo
    Hallo Hallo Hallo
    Hallo Hallo Hallo

    dies ist ein sehr geordnetes Gedicht mit sehr geringem Infogehalt denn ich kann es auch verkürzt notieren:

    18X Hallo

    Nun das krasse Gegenteil:

    45rte dfjfh 89dwg
    de13o 5dzhd 5edf5
    34edw wscdh 008ec

    dwsee 23rfs 234dw
    xghrs 22wrg 33edw
    23dsr 23rdw 24ftu

    In diesem Gedicht steckt sehr viel Information drinnen, denn es lässt sich kaum verkürzt notieren. Es gibt jedoch eine markanten Unterschied: Der relevante Informationsgehalt ist Null. Man muss also unbedingt zwischen Informationsgehalt im Allgemeinen und relevantem/irrelevantem Infogehalt im speziellen unterscheiden. Aus sicht meines Faxgerätes, ist ein Blatt mit geordneten Bildern weniger informationsgeladen als eines mit wirrem Pixelsalat!

    Gruß
    GEO

  5. Antineutrino
    Oktober 30th, 2007 01:00
    5

    Nun ja es kommt wie so oft auf die Sichtweise an. Nun ja es ist zwar richtig das ein Werk in dem alle Zeichen gleichwarscheinlich auftreten nicht komprimiert werden kann, oder doch ? Also wenn wirklich die maximale Entrophie erreicht ist (Pixel – Salat, weißes Rauschen) dann besteht ja die Notwendigkeit der Übertragung nicht mehr, da ja keine Information enthalten ist. Um ein solches Werk zu übertragen könnte man ja einfach ein Programm nehmen das ein solches Werk erzeugt. Bei dem 18x Hallo bsp. müsste ich mindestens ein Programm übertragen das die Zeichkette 18xHallo erzeugt. Dieses Sichtweise der Entropie nennt man auch Kolmogorov Komplexität. Und Jetzt der Hacken, die Kolmogorov Komplexität ist nicht berechenbar. Daher flogt, das die Entropie zwar nach unten Beschränkt ist (maximal ungeordent), aber dennoch kann man nie von einem Werk sagen das es diese erreicht hat. Die entscheidung welche Information relevant ist kann eine Maschiene nicht treffen, aber der Grad der Abweichung vom „Null Punkt“ kann gemessen werden.

    Irie

  6. LeV
    Oktober 30th, 2007 17:36
    6

    Was ich an GEOs Beispielen interessant finde, ist, dass das erste „Gedich“ (18 x Hallo) poetischer ist, als das zweite und zwar, weil es einem bestimmten eigengesetzlichen Muster folgt. Dieses Muster ist in der Tat soweit zu abstrahieren, dass man locker ein Programm schreiben kann, das einem einen solchen „Text“ generiert. Für metrische Gedichte kann man z.B. Schemen-Formeln schreiben, in denen Verse auf ihre Hebungen/Silben, den Auftakt und die Kadenz reduziert werden – da lassen sich also auch bestimmte Informationen abstrahieren.

    Aber das Beispiel ist für die Bestimmung des Informationsgehaltes einer solchen Zeichenkette trotzdem verwirrend, zumindest für mich. Jeder Buchstabe, jede Zahl ist ein Symbol und hat für sich Bedeutungsinhalt. Im Falle „Hallo“ entsteht aber durch die sehr spezielle Kombination der Zeichen deutlich Nährboden für die Assoziation. Hallo – das ist eine Begrüßung, relativ neutral, weder förmlich, noch besonders informell, kann man zu jeder Tageszeit sagen, gestern hat Anna „Hallo“ zu mir gesagt, etc… Natürlich kann man auch über das häufige Auftreten der Zahl 23 im zweiten Beispiel spekulieren, aber im Kontext der übrigen Zeichen führt das zu keinem sinnvollen Ergebnis.

    Für mich ergeben sich daraus zwei Aspekte von „Informationsgehalt eines Textes“, zum einen die Quantität der Informationen, zum anderen deren Qualität betreffend. Ein geordneter Text ist quantitativ weniger informativ als ein ungeordneter, weil sich seine Zeichenkombinationen formelhaft abstrahieren lassen. Die Informationen sind aber qualitativ wertvoller in Bezug auf deren kommunikativen Gehalt.

  7. Sigmar Erics
    März 20th, 2009 10:20
    7

    Das letztere ist sicher ein wichtiger Teil der Lösung dieses Problems. In der unterschiedlichen Betrachtungsweise von GEO und Antineutrino zeigt sich die unterschiedliche Konnotation des Informationsbegriffs in der Informatik und in der Sprachwissenschaft. Wenn wir von Gedichten sprechen, glaube ich, daß der Informationsgehalt im Sinne des (bewußt oder intuitiv) gesendeten kommunikativen Gehalts relevanter ist als die abstrakte und zufällig entstandene Informationsmenge, welche den Aufwand beim elektronischen Datenversand bestimmt.
    Ich bin mir jedoch gerade nicht sicher, ob sich der Grad der Geordnetheit und die Menge an kommunikativem Gehalt überhaupt proportional zueinander verhalten. Der „Hallo“-Text kommt wohl der maximal möglichen Geordnetheit nahe, den man erreichen kann, ohne den kommunikativen Gehalt ganz zu eliminieren. Er hat auch mehr kommunikativen Gehalt als der Zufallszeichentext. Aber es ließe sich noch mehr Informationsgehalt erzeugen, wenn der Text wieder ungeordneter gemacht würde, indem weitere Wörter bzw. Sätze hinzugesetzt, die Form ausdifferenziert würde etc. Der kommunikative Gehalt hängt demnach nicht so sehr mit der Entropie zusammen, sondern damit, welche Informationen mit (absichtlich oder unbewußt) gesetzten Signalen im Sinne eines bestimmten Zeichensystems in den Text integriert wurden. Ein Qualitätsmerkmal eines Gedichtes ist nach meiner Auffassung, inwieweit jedes einzelne Zeichen eine erkennbare Relevanz in Bezug auf die Kernbotschaft trägt, ohne, daß Zeichen durch unnötige Redundanzen irrelevant wären. Das ist auch eine Ebene der Geordnetheit, die aber nicht mit der von GEO angesprochenen identisch ist.
    Was sagst Du zu diesen Überlegungen?

  8. LeV
    April 14th, 2009 11:55
    8

    Ein Qualitätsmerkmal eines Gedichtes ist nach meiner Auffassung, inwieweit jedes einzelne Zeichen eine erkennbare Relevanz in Bezug auf die Kernbotschaft trägt, ohne, daß Zeichen durch unnötige Redundanzen irrelevant wären.

    Ich halte diesen Satz für eine gute Definition von poetischer (oder generell künstlerischer) Qualität eines wie auch immer zusammengesetzten Kunstwerks. Ich kenne mich zu wenig mit Informatik aus, als dass ich über die verschiedenen Ebenen von Informationsgehalt spekulieren könnte. Was die Sprache anbetrifft, gibt es diese auf jeden Fall. Wir haben in einem Gedicht den formalen Informationsgehalt (18xhallo in 2 Absätzen à 3 Zeilen à 3 Hallo). Wir haben den semantischen Gehalt (Begrüßung) und den grammatischen (Partikel), wobei Grammatik generell ein problematisches Ding ist, weil sich hier durch die Vermischung von Form und Inhalt neue Informationsgehalte in beide Richtungen ergeben können.

    Im Gedicht erquickt (mich) weder eine zu lasche Informationsdichte, das erzeugt Langeweile, noch eine zu hohe, das erzeugt Unordnung. Es geht vielmehr um das Maß der Zeichen im Verhältnis zueinander, die Mensura, die Komposition von Wiederholung und Variation unter dem Gesichtspunkt der Verhältnismäßigkeit.

    Wenn wir jemandem eine Information auf Basis der Sprache übermitteln, so liefern wir unserem Gegenüber gleich ein Vielfaches der relevanten Informationsmenge.

    Generell halte ich GEOs Anfangsbehauptung für fragwürdig, da die Frage der Relevanz von Informationsgehalten gesprochener Rede überhaupt noch nicht so weit untersucht ist, als dass man sicher davon ausgehen könnte, sie enthielte in jedem Falle überrelevante Informationen. Dies klingt nur logisch, wenn man davon ausgeht, das Sprache ausschließlich referentiellen Wert hat, was m. E. nicht der Fall ist. Die ganze Signalverarbeitung von Sprache im Gehirn ist hochkomplex und ebenso komplex sind die mentalen Analogien und Marker, die bewußt oder un(ter)bewußt beim Zuhörer erzeugt werden, seien es emotionale, phatische, referentielle, etc. Vermutlich müßte man erst einmal den Relevanzbegriff klären, um auf dieser Grundlage argumentieren zu können.

Kommentar abgeben: