Im folgenden wird viel von wechselseitigen Abhängigkeiten zwischen Sprache und Denken die Rede sein. Manchmal heißt es, Denken setze Sprache voraus. Das kann definitorisch gemeint sein in dem Sinne, daß jegliche kognitive Leistung, die nicht Sprache involviert, nicht Denken genannt wird. Aber das wäre eine willkürliche Unterteilung kognitiver Leistungen nach einem äußerlichen Kriterium. Wenn der Satz als empirische Generalisierung über Vorkommen von Denken gemeint ist, so muß er falsifizierbar gemacht werden. Dazu ist zunächst der Begriff des Denkens einzugrenzen. Im Sinne des Abschnitts 2 kann man bestimmte kognitive Leistungen ausschließen. Dazu gehören einerseits die Wahrnehmung und andererseits der Abruf und die Vergegenwärtigung von Gedächtnisinhalten. Das Wiedererkennen von etwas Wahrgenommenem oder das Betrachten eines mentalen Bildes – d.h. die Vergegenwärtigung eines visuellen Bildes oder das innere Abspulen einer auditiven Gestalt, z.B. einer Melodie – involvieren normalerweise keine Sprache. Man kann solche kognitiven Leistungen tatsächlich aus dem Begriff des Denkens heraushalten, läuft allerdings, solange man dafür keine unabhängigen Kriterien angibt, Gefahr, doch wieder mit einem definitorischen Satz statt mit einer empirischen Generalisierung zu tun zu haben.
Ebenso muß geklärt werden, was mit ‘Sprache’ gemeint ist. Da stellt sich sogleich heraus, daß die Behauptung sich nicht auf Lautsprache beschränkt; es wird als selbstverständlich vorausgesetzt, daß Sprache auch innere Sprache sein und daß man diese zum Denken brauchen kann. Diese Interpretation schafft jedoch gleichzeitig ein Falsifikationsproblem, weil innere Sprache jedenfalls nicht beobachtbar und einstweilen nicht einmal klar definiert ist. Eine linguistisch einigermaßen klare Definition könnte wie folgt lauten: Innere Sprache ist die mentale Erzeugung eines Textes, ohne diesen zu äußern (also ohne ihn an die für Phonetik oder Schrift zuständigen Organe weiterzuleiten). Innere Sprache wäre somit ziemlich genau dasselbe wie die Planungsphase der Redeerzegung. Es besteht auch kein Zweifel daran, daß dergleichen wirklich vorkommt. Die Operationalisierung dieses Begriffs ist nun einfach: Wenn nur noch die physische Erzeugung des Ausdrucks fehlt, kann diese ohne jeglichen Verzug geliefert werden, denn ex hypothesi ist ja keine weitere Formulierungsarbeit mehr nötig. Die Operationalisierung muß also lauten: Kriterium dafür, daß eine Person innere Sprache (als Form des Denkens) verwendet, ist, daß sie ihren Gedanken ohne weiteren Verzug in Sätze fassen kann.
Dergestalt auf den Punkt gebracht, ist die Hypothese von der Sprachgebundenheit des Denkens sehr wahrscheinlich falsch. Es gibt, wie schon in einem anderen Kapitel gesehen, eine Fülle kognitiver Leistungen, die normalerweise unter Denken subsumiert werden, aber i.a. weitgehend oder gänzlich ohne Sprache ablaufen. Dazu gehören die Orientierung im Raum, das Zusammenbauen eines Werkstücks und die Planung des nächsten Zugs im Schachspiel. Alle solche Leistungen können ohne weiteres versprachlicht werden. Aber im üblichsten Falle ist das ein zusätzlicher Aufwand.
Ferner ist Denken auch ohne Sprache ausdrückbar. Gesten – auch solche außerhalb des Systems einer Gebärdensprache – drücken Gedanken aus. Werke der bildenden Kunst wie Bilder oder Statuen können ganze Weltanschauungen ausdrücken. Es besteht also keine direkte oder totale Abhängigkeit des Denkens von der Sprache.
Um die Frage des Zusammenhangs zwischen Sprache und Denken differenziert zu behandeln, haben wir im vorigen Abschnitt den Begriff des Denkens im Rahmen einer allgemeineren Konzeption von Kognition analysiert. Ebenso müssen wir dazu mit einem differenzierten Sprachbegriff arbeiten. Hierzu eignet sich immer noch am besten die saussuresche Trichotomie von ‘langage – langue – parole’.
So gefaßt, liegen der Trichotomie allgemeinere Kriterien zugrunde, die sich durchaus auch auf andere menschliche Tätigkeiten anwenden lassen, insbesondere auch auf das Denken. Tatsächlich kann man über Sprache nur dann vernünftig reden, wenn man die saussuresche Unterscheidung beachtet. Daher muß auch die Problematik von ‘Sprache vs. Denken’ systematisch auf die drei Sprachbegriffe bezogen werden.
Auf der Ebene der ‘parole’ ist ein Zusammenhang von Sprache und Denken selbstverständlich. Man kann nicht sprechen, ohne zu denken; das gilt selbst dann, wenn man Unsinn redet. Die Rede läßt Schlüsse darauf zu, was dem Sprecher gerade durch den Kopf geht. In gewissen Fällen schließt der Hörer – ganz im Sinne von Grice' Qualitätsmaxime –, daß der Sprecher auch für wahr hält, was er sagt. Dieser Schluß kann natürlich fehlgehen, wenn der Sprecher lügt oder sich irrt. Da alle Hörer das wissen, hält niemand das, was der Sprecher sagt, für ein Abbild der Realität. Statt dessen schließt der Hörer von dem, was er hört, auf das, wovon der Sprecher will, daß der Hörer glaube, daß der Sprecher denkt.1
So konstruieren Sprecher und Hörer beim Reden eine gedachte raumzeitliche Welt, die man Redeuniversum nennt. Diese Welt wird durch die sprachlichen Ausdrücke manipuliert und verändert. Manipulation des Redeuniversums ist natürlich Denken. Tatsächlich ist es, wie von Wissenschaftlern und Schriftstellern aller Zeiten immer wieder bezeugt worden ist, eine besonders fruchtbare Form des Denkens. Sokrates pflegte die Kunst der Maieutik, die “Hebammenkunst”, bei der er seinen Mitunterredner durch geschicktes Fragen zur Erkenntnis führte. H. v. Kleist (s.a.) schrieb einen Aufsatz “Über die allmähliche Verfertigung der Gedanken beim Reden”. W. v. Humboldt schreibt:
W. Kamlah und P. Lorenzen (1967) haben eine Dialoglogik entworfen, die angibt, wie man die Wahrheit von Thesen gesprächsweise feststellt. Sie alle stimmen darin überein, daß Denken dann am fruchtbarsten ist, wenn es im Austausch mit anderen stattfindet. Auf diesem Prinzip beruht eigentlich der ganze Wissenschaftsbetrieb. Beim Schreiben, Publizieren, Lesen, Überprüfen von Thesen und beim Schreiben und Publizieren der Antwort ist der Austausch zwar zeitlich erheblich versetzt; aber zur Wissenschaft gehören ja auch Kongresse und Diskussionen.
Es geht bis zu einem gewissen Grade auch ohne Gesprächspartner. Wenn man die Aufgabe hat, einen längeren zusammenhängenden Text zu verfassen, ist es im Prinzip möglich, sich erst zu überlegen, was man schreiben will, und es erst dann zu schreiben. Zu den Zeiten vor der Ankunft von Textverarbeitungsprogrammen, als Schreiben aufwendig war, verfuhren Autoren bis zu einem gewissen Grade so. Im Verfügen über die Textverarbeitung dagegen machen viele Schreiber die Erfahrung, daß das Denken leichter vonstatten geht, wenn man schreibt, und zwar auch schon bevor der Gedanke zu Ende gedacht ist. Man schreibt zunächst eine vorläufige Version seines Gedankens hin und setzt sich dann kritisch mit dieser auseinander. Es ist, als wäre man sein eigener Mitunterredner.
Wie die Verarbeitung des Gedankens seitens des Sprechers und des Hörers im einzelnen vonstatten geht, davon handelt ein anderes Kapitel. Für alle menschlichen Handlungen, also auch für das Denken, gilt das Modell der teleonomischen Hierarchie, wo höherstufige Operationen Zwecke für niederstufige Prozesse sind, die den ersteren als Mittel dienen, und wo die höherstufigen Akte bewußt, die niederstufigen dagegen unbewußt ablaufen. Höherstufige Komponenten des Denkens sind die Bildung einer Proposition aus Argumenten und Prädikat und die Bildung zusammengesetzter Propositionen aus einzelnen. Niederstufige Komponenten sind z.B. das Aktivieren des Langzeitgedächtnisses, das Abrufen eines bestimmten Inhaltes, seine Übernahme ins Kurzzeitgedächtnis und seine Assoziation mit einem Begriff. Dem entsprechen in der ‘parole’ einerseits die Bildung von Sätzen und Texten bzw., auf seiten des Hörers, Satzverstehen und Textverstehen, und andererseits die Aktivierung des mentalen Lexikons und die Assoziation von Significans und Significatum.
Zuvor hatte ich gesagt, daß das Denken nicht belauschbar ist. Für die Rede gilt das natürlich nicht. Nicht nur der Wissenschaftler richtet seine Aufmerksamkeit ersatzweise auf die Rede, insofern er an das Denken selbst nicht herankommt. Für uns alle ist Rede eine äußerliche, wahrnehmbar gewordene Form des Denkens. Sprecher und Hörer können auf alle Bestandteile der Rede ihr Bewußtsein richten, viel einfacher und systematischer als auf das innerlich bleibende Denken.
Die Diskussion um den Zusammenhang zwischen Sprache und Denken bezieht sich i.a. auf die ‘langue’. Ihr liegt die Alltagserfahrung zugrunde, daß Angehörige anderer Völker erstens anders sprechen und sich zweitens in vielen Punkten anders verhalten als das eigene Volk. Da sowohl Sprache als auch Handeln Denken voraussetzen, legt sich der Schluß nahe, daß erstens die Angehörigen des anderen Volks anders denken und daß zweitens eine Entsprechung besteht zwischen der Struktur der Sprache und den Denkgewohnheiten. Die Hypothese ist nicht nur naheliegend, sondern, wie wir gleich sehen werden, zu einem gewissen Grade auch durch empirische Forschung bestätigt.
Es gibt mehr oder minder extreme Fassungen dieser Hypothese. Der schiere Zusammenhang zwischen ‘langue’ und Denken wurde in der wissenschaftlichen Linguistik zuerst von W. von Humboldt postuliert und – überwiegend deduktiv – untersucht. Die These gewinnt allerdings erheblich an Brisanz, wenn sie auf eine einseitige Abhängigkeit zwischen Sprache und Denken hinausläuft. Bereits im Kapitel über das Sprachzeichen hatten wir die Frage aufgeworfen, ob die Einteilungen und Kategorisierungen, die die Bedeutungsstruktur unserer Sprache in der Wirklichkeit vornimmt, gesetzmäßig durch die Struktur der Realität oder unseres Erkenntnisapparats vorgegeben oder ob sie willkürlich sind. In Platons Dialog Kratylos ist das genau die Frage, und die beiden Diskutanten nehmen die beiden entgegengesetzten Positionen ein. Platon entscheidet sich für ein zeitlos gültiges ‘sowohl – als auch’. Viel später entwerfen die Modisten (vgl. Lehmann 2002) im Anschluß an Aristoteles eine Theorie der Grammatik, die auf der Prämisse beruht, daß die Kategorien der Sprache die Kategorien des Denkens widerspiegeln. Die Theorie basiert allerdings nicht auf der empirischen Untersuchung der Frage anhand verschiedener Sprachen.
Die diametral entgegengesetzte These ist natürlich, daß die Sprache das Denken determiniert. Sie ist im 20. Jh. vor allem von Benjamin L. Whorf und Leo Weisgerber vertreten worden. Sie wird um die Wende zum 21. Jh. vor allem in der Abteilung Kognitive Anthropologie des Max-Planck-Instituts für Psycholinguistik in Nimwegen empirisch untersucht. Die These kursiert unter den Bezeichnungen ‘sprachliche Relativität’, ‘linguistischer Determinismus’2 und ‘Sapir-Whorf-Hypothese3’. In ihrer extremen Fassung bezieht sie noch die Wahrnehmung mit ein und besagt, daß wir nur das denken und wahrnehmen können, was durch die Struktur unserer Sprache vorgezeichnet ist. Wir nehmen danach die Welt nicht unmittelbar wahr, sondern nur “durch die Brille unserer Muttersprache”; diese schiebt sich als “Zwischenwelt” zwischen unsere Kognition und die Welt. Mit diesen Metaphern kann L. Weisgerber sich auf W. v. Humboldt berufen. Dieser schreibt:
Die extreme Form des linguistischen Determinismus widerspricht dem Prinzip der Effabilität. Dieses besagt schlicht:
In jeder Sprache läßt sich alles sagen.
Man kann das Prinzip auch auffassen als eines der unbegrenzten Übersetzbarkeit:
Jeder Text läßt sich in jede Sprache übersetzen.
So gefaßt, zeigt das Effabilitätsprinzip seine praktischen Konsequenzen schon klarer auf. Der Übersetzung sind durchaus praktische Grenzen gesetzt. Allein bei der Übersetzung der Bibel haben sich die Schwierigkeiten, Begriffe, Gedanken und Metaphern aus der Welt des antiken Judentums in andere Kulturen zu übertragen, vieltausendfach gezeigt. Was ist die angemessene Übersetzung von Τòν ἄρτον τòν ἐπιούσιον δòϛ ἡμῖν σήμερον “unser tägliches Brot gib uns heute” in die Sprache einer Kultur, die kein Brot kennt? Muß man je nachdem mit “unseren täglichen Reis” und “unseren täglichen Fisch” übersetzen? Jedenfalls kann man ja nicht im Zusammenhang dieses konkreten Textes zunächst den Begriff des Brotes und einen Terminus dafür einführen und ihn dann erst in diesem Satz verwenden.
Solche Beispiele widersprechen freilich bei näherer Betrachtung dem Effabilitätsprinzip nicht. Im Sinne der teleonomischen Hierarchie ist die wichtigste Frage die, worauf es in dem betreffenden Text ankommt, was denn eigentlich gesagt werden soll. Wenn in dem Text ‘Brot’ metonymisch für “was wir zum Leben brauchen” steht, dann läßt sich in jeder Sprache eine Metonymie finden, die den entsprechenden Zweck erfüllt. Wenn in dem Text aber das Backen von Brot erläutert wird, dann kann es auch nicht schaden, den Begriff vorab explizit einzuführen. Die Sprachen setzen für die Zwecke der Kognition und Kommunikation ihre je eigenen Mittel ein. Das Effabilitätsprinzip besagt nicht, daß man alles in jeder Sprache auf dieselbe Weise sagen könne.
Dies zeigt, daß Unterschiede im lexikalischen Bestand, wie sie zwischen verschiedenen Sprachen tatsächlich bestehen, grundsätzlich kein Argument gegen Effabilität und für eine unüberwindliche sprachliche Relativität abgeben können. Denn entweder die Sache ist im gegebenen Zusammenhang wörtlich gemeint; dann verfügt jede Sprache über Mittel der Wortbildung und Syntax, um den nötigen Begriff zu bilden. Oder sie ist nicht wörtlich gemeint; und dann verfügt jede Sprache über Stilmittel wie Metapher und Metonymie, um den gleichen Effekt zu erzielen. Jeder, auch ein Monolingualer, kann erkennen, daß seine Sprache ihm für einen bestimmten Begriff kein Wort zur Verfügung stellt, und den Begriff dann umschreiben. Menschen, die eine unzureichend beherrschte Fremdsprache sprechen, tun das alle Tage.
Diese extreme Fassung des linguistischen Determinismus ist also nicht haltbar. Eine schwächere Fassung besagt, daß unser Denken im Defaultfall, d.h. wo immer man keinen besonderen intellektuellen oder sprachlichen Aufwand treibt, in die elementaren Ausdrucksformen unserer Sprache – den Grundwortschatz und die fundamentalen Strukturen der Grammatik – gegossen wird, daß also die Sprache die Bahnen vorzeichnet, in denen wir im allgemeinen denken.
Ein Beispiel für diese schwächere Form des sprachlichen Relativitätsprinzips bietet die Farbterminologie. Die Wortbildungsmittel jeder Sprache erlauben die beliebig genaue Bezeichnung von Farbschattierungen, von smaragden über türkis bis kobaltfarben. Im einfachsten Falle freilich verwenden wir nicht solche sekundären Bezeichnungen, sondern primäre Farbwörter wie grün und blau zur Bezeichnung von Farben. In den primären Farbwörtern bestehen aber erhebliche Unterschiede zwischen den Sprachen. Viele Sprachen unterscheiden auf dieser Ebene nicht zwischen ‘grün’ und ‘blau’. Der extreme linguistische Determinismus würde in diesem Falle erwarten lassen, daß Sprecher solcher Sprachen in bezug auf den Unterschied zwischen ‘grün’ und ‘blau’ farbenblind sind. Diese These ist selbstverständlich widerlegt; für unser Farbensehen ist die physiologische Ausstattung des Auges von Homo sapiens und nicht unsere Farbterminologie verantwortlich. Die abgeschwächte These dagegen läßt lediglich erwarten, daß die Sprecher einer Sprache, die ‘grün’ und ‘blau’ nicht unterscheidet, für praktische Zwecke diesen Unterschied häufiger vernachlässigen werden als Sprecher einer Sprache, die den Unterschied macht.
Um diese Hypothese zu testen, wurde ein Experiment durchgeführt (vgl. Kay & Kempton 1984), an dem Probanden, deren Sprache Grün und Blau unterscheidet – nennen wir sie die Zweifarbensprecher – und Probanden, deren Sprache den Unterschied nicht macht – die Einfarbensprecher – teilnahmen. Den Probanden wurde der zweidimensionale Farbenraum in Form von Farbplättchen vorgelegt, die nach den Dimensionen des Farbtons und der Helligkeit angeordnet waren, und sie wurden aufgefordert, sich ein bestimmtes blaues Plättchen zu merken. Nach einigen Minuten sollten sie es reidentifizieren. Bei dieser Aufgabe schnitten die Einfarbensprecher ebensogut ab wie die Zweifarbensprecher, was sofort die primitive Fassung der Sapir-Whorf-Hypothese widerlegt. Nach einer Woche sollten die Probanden noch einmal das gemerkte Plättchen identifizieren. Hier nun gab es signifikante Unterschiede: die Zweifarbensprecher wählten ein blaues Plättchen, die Einfarbensprecher dagegen, weniger genau, ein Plättchen im Farbraum zwischen Grün und Blau. Das Ergebnis läßt sich so interpretieren, daß das Plättchen sowohl im visuellen als auch im semantischen Langzeitgedächtnis gespeichert wurde und daß die Probanden beim Erinnern in dem Maße, in dem das visuelle Gedächtnis versagte, auf das semantische Gedächtnis rekurrierten. In diesem aber waren elementare Begriffe, nicht detaillierte ad-hoc-Beschreibungen verwendet worden, und da wurde eben die elementare Farbterminologie der Sprache relevant. Wörter haben offenbar die Funktion, Begriffe zu stabilisieren.
In eine ähnliche Richtung weisen die Experimente, die St. Levinson und seine Mitarbeiter über die räumliche Orientierung durchgeführt haben (Levinson 2003). Sie stellten zunächst fest, daß zwar alle Sprachen Wörter für ‘links’ und ‘rechts’ (bzw. für ‘linke Hand’ und ‘rechte Hand’) haben, daß diese Begriffe in der Orientierung aber eine ganz unterschiedliche Rolle spielen. In SAE-Sprachen bezieht man sich damit nicht nur auf die beiden Seiten des (eigenen) Körpers, sondern man verortet auch Gegenstände relativ zu anderen dadurch, daß man sich entweder auf die rechte oder die linke Seite des Bezugsgegenstandes oder deiktisch auf die eigene rechte und linke Seite als Fixpunkte bezieht. Man sagt also solche Dinge wie “das Rathaus steht rechts von der Kirche”. In mehreren Sprachen wie Tzeltal (Maya, Mexiko) und Guugu Yimithirr (Pama Nyunga, Australien) werden die Begriffe ‘rechts’ und ‘links’ ausschließlich auf den Körper angewandt, um Dinge wie ‘mein linker Fuß’ zu sagen. Gegenstände werden dagegen im Raum nach den Himmelsrichtungen verortet. Man sagt also z.B. “das Rathaus steht westlich von der Kirche”. Und diese Art von Verortung kann sogar auf Körperteile angewandt werden; statt ‘mein linker Fuß’ sagt man durchaus üblicherweise Dinge wie ‘mein westlicher Fuß’ (je nachdem, wie man gerade positioniert ist).
Die Fragestellung war nun, ob diese sprachlichen Phänomene das Denken spiegeln, d.h. ob die Sprecher solcher Sprachen bei der Orientierung im Raum tatsächlich grundsätzlich auf die Himmelsrichtungen rekurrieren. Dazu wurde folgendes Experiment durchgeführt: Es wurde ein großer, ebener, strukturloser Platz gewählt. Es wurden zwei Probanden A und B herangezogen, und B bekam die Augen verbunden. Dann wurde irgendwo auf dem Platz eine Flasche deponiert. A mußte am Rand des Platzes stehen bleiben und bekam die Aufgabe, B allein mit sprachlichen Mitteln zu instruieren, daß er zu der Flasche ginge und sie aufhöbe. Wenn dieses Experiment mit Sprechern einer SAE-Sprache durchgeführt wird, sagt A z.B.: “Mach eine Vierteldrehung nach rechts! Jetzt geh etwa 10 Schritte geradeaus! Stop! Jetzt dreh dich nach links! Jetzt noch zwei Schritte vorwärts! Stop! Bück dich, da liegt sie.”
Nicht so die Tzeltal und Guugu Yimithirr. A sagte zu B: “Mach eine Vierteldrehung nach Osten! Jetzt geh etwa 10 Schritte geradeaus! Stop! Jetzt dreh dich nach Westen! Jetzt noch zwei Schritte vorwärts! Stop! Bück dich, da liegt sie.” B, der absolut nichts sehen konnte, hatte mit den Anweisungen keine Schwierigkeiten und fand die Flasche ebenso leicht wie seine SAE-Kollegen. In dieselbe Richtung weist auch die Anekdote von dem Guugu-Yimithirr-Ehepaar, das in ein Hotelzimmer kam. Die Ehefrau ging ins Badezimmer, kehrte zurück und berichtete ihrem Mann, daß das Warmwasser aus dem nördlichen Wasserhahn käme. Weitere Untersuchungen bestätigten, daß diese Menschen in der Tat in jeder Lebenslage nach den Himmelsrichtungen orientiert sind. Auch hier muß man also schließen, daß Angehörige verschiedener Kulturen durchaus gewohnheitsmäßig in verschiedenen Bahnen denken und daß diese sich in der sprachlichen Struktur niederschlagen.
Wenn statistisch abgesicherte empirische Untersuchungen von Angehörigen verschiedener Völker ergeben, daß sie mit verschiedenen Begriffen und Operationen arbeiten, besteht zur Erklärung immer die Möglichkeit, daß die kognitiven Unterschiede angeboren sind. Im Falle der räumlichen Orientierung ist die Möglichkeit nicht von der Hand zu weisen; schließlich gibt es ja auch viele Menschen, die offenbar genetisch bedingte Schwierigkeiten haben, jemals die Links-Rechts-Orientierung zu lernen. Aber der Schluß auf angeborene Unterschiede ist keinesfalls zwingend. Es ist im Gegenteil wahrscheinlich, daß kognitive Strategien von Geburt an in der Sozialisation erworben werden. Die Begriffe und Operationen prägen sich dann so stark und unverrückbar ein wie die oben erwähnten einzelsprachlichen Kategorisierungen in Phonetik und Phonologie. Sie werden automatisch zum Problemlösen verwendet. Das besagt nicht, daß die Leute nicht auch andere Strategien noch lernen könnten. Sie im Erwachsenenalter zu lernen, kann aber ebenso schwierig sein, und Perfektion kann ebensowenig erreicht werden, wie beim Erlernen einer Fremdsprache.
Ein weiterer sich nahelegender Schluß wäre, daß in allen diesen Punkten die Struktur der Sprache das Denken determinierte. Auch dieser Schluß ist nicht zwingend. Sprache und Denken wandeln sich in der Ontogenese und in der Geschichte des Volkes. Auch werden in einem Volk kognitive Strategien (vulgo “Denkgewohnheiten”) tradiert, ohne daß Sprache dazu nötig ist. Folglich kann sich im Einzelfall sowohl im Volk als auch im Einzelnen eine kognitive Strategie oder eine Kategorie entwickeln, die sodann auf konstante Weise versprachlicht wird. Und schließlich kann die Ausbildung kognitiver und sprachlicher Kategorien und Operationen Hand in Hand gehen, ohne daß eine einseitige Abhängigkeit gegeben wäre.
Auf der Satzebene, wo lexikalische Einheiten relativ frei gewählt und zu komplexen Ausdrücken kombiniert werden, ist der Sprecher durch die Struktur seiner Sprache am wenigsten gegängelt. Wenn ihm ein einfacher Satz nicht genügt, baut er einen komplexen Satz; wenn ihm ein Substantiv aus dem Inventar zur Bezeichnung des Gemeinten nicht genügt, versieht er es mit Attributen oder bildet überhaupt einen völlig unabhängigen Begriff durch Nominalisierung. Zur Zwangsjacke für den Ausdruck wird das Sprachsystem zunehmend auf den niedrigeren Ebenen der Strukturierung, am meisten auf der morphologischen Ebene. Effabilität hat damit zu tun, ob alle Sprachen dasselbe ausdrücken können; die interessantere Feststellung ist aber wohl, daß die Sprachen verschiedene Dinge ausdrücken müssen:
Thus the true difference between languages is not in what may or may not be expressed but in what must or must not be conveyed by the speakers. (Jakobson 1959:142)
So muß ich mich, wenn ich Deutsch spreche, durch Wahl des Tempus in jedem einzelnen Satz festlegen, ob ich von Vergangenem oder Nicht-Vergangenem (Gegenwärtigem oder Zukünftigem) spreche; und ebenso durch Wahl des Numerus, ob ich von einem oder mehreren Exemplaren spreche; und ebenso durch Wahl des Artikels, ob ich von einem im Redeuniversum etablierten oder noch zu etablierenden Referenten spreche. Dies alles ist dem deutschsprechenden Chinesen ein Greuel, dessen Sprache ihn nicht zu solchen oft irrelevanten Entscheidungen zwingt (z.B. in “Haben Sie vielleicht □ Reservekanister?”, wo Tempus, Numerus und Definitheit alle für die Verständigung irrelevant sind). Hier schließt sich die Frage an, inwieweit die grammatischen Kategorien einer Sprache ihren Sprechern die Bahnen ihres Denkens vorzeichnen.
Tatsächlich wurde die These von der sprachlichen Relativität auf die grammatische Struktur der Sprache mindestens ebenso häufig wie auf das Lexikon angewandt. B.L. Whorf schloß aus dem Fehlen von Tempus im Hopi darauf, daß die Hopi Zeit nicht im europäischen Sinne konzipieren. In vielen europäischen Sprachen ist im Genussystem das Maskulinum gegenüber dem Femininum unmarkiert. Wenn man z.B. sagt wer einmal lügt, dem glaubt man nicht, so bezieht man sich mit dem (statt der) nicht nur auf männliche, sondern auch auf weibliche Wesen. Dieses sog. “generische Maskulinum” wird von feministischen Linguisten (und vielen Laien) dennoch so interpretiert, daß in erster Linie männliche Wesen gemeint sind und daß sein Gebrauch Manifestation einer Gesellschaft mit fehlender Gleichstellung von Mann und Frau ist.
Aus dem Penthouse-Prinzip folgt auch, daß die den oberen Strukturebenen angehörenden Kategorien und Strategien in einer gegebenen Sprache relativ jung sein können (wenn auch nicht müssen), während die am stärksten grammatikalisierten Erscheinungen notwendigerweise vor längerer Zeit ins Sprachsystem gekommen sind. Denn es kann sich zwar innerhalb eines halben Jahrhunderts eine periphrastische Bildung im Sprachsystem etablieren. Aber eine Flexionskategorie, die durch morphologische Modifikation eines Stamms ausgedrückt wird, kann nicht ad hoc in dieser Form geschaffen werden, sondern braucht einen langen Grammatikalisierungsweg, um – vielleicht ausgehend von einer Periphrase – bis zu dieser Stufe zu gelangen. Der kreative Akt, der solche Unterscheidungen ins Sprachsystem einführt, liegt also mindestens Jahrhunderte, manchmal auch Jahrtausende zurück. Solche hochgrammatikalisierten Strukturen bleiben oft lange als Fossile in einem Sprachsystem, während sich in derselben Zeit die Kultur und Zivilisation der Sprachgemeinschaft vollständig wandeln kann. Soweit eine grammatische Eigenschaft eines Sprachsystems einen Schluß auf die Denkgewohnheiten der Sprachgemeinschaft zuläßt, ist dieser eher auf die Gemeinschaft, welche die Eigenschaft einführte, als auf die Gemeinschaft, die sie in ihrem Sprachsystem vorfindet, anzuwenden.
Grammatikalisierung bedeutet nicht nur Obligatorisierung, sondern auch Desemantisierung. Ich habe die Wahl, ob ich in der Universität im Anzug oder im Pullover erscheine, und daher kann ich durch die Wahl des Anzugs Information (genauer: Konnotationen) übermitteln. Ich habe nicht die Wahl, ob ich eine Hose anziehe oder es bleiben lasse; und folglich kann ich durch das Tragen einer Hose keine Information übermitteln. Im Lateinischen habe ich die Wahl, ob ich das Adjektivattribut prä- oder postnominal stelle. Grob gesprochen, bildet das postnominale Attribut in neutraler Weise einen spezifischeren Begriff, während das pränominale Attribut bewertet. Z.B. miles Romanus “römischer Soldat” vs. Romanus miles “Soldat von Rom, d.h. Soldat, wie er sein soll”. Im Deutschen habe ich diese Wahl nicht; und folglich kann ich durch die pränominale Stellung des Attributs in römischer Soldat keine Bewertung oder überhaupt irgendeine Information geben.
Soweit also grammatische Kategorien solche sind, die obligatorisch und automatisiert sind, läßt ihr Einsatz keinerlei Rückschlüsse auf das Denken sei es des Sprechers, sei es der Sprachgemeinschaft zu. Betrachten wir zur Illustration ein letztes Beispiel. In einer Sprache mit akkusativischem Bau hat der einzige Aktant eines intransitiven Verbs dieselbe syntaktische Funktion wie der Actor eines transitiven Verbs; m.a.W. er wird grammatisch behandelt, als wäre er ein Handelnder. In einer Sprache mit ergativischem Satzbau hat der einzige Aktant eines intransitiven Verbs dieselbe syntaktische Funktion wie der Undergoer eines transitiven Verbs; m.a.W. er wird grammatisch behandelt, als wäre er ein Leidender. Nun ist der Aktant zahlreicher intransitiver Verben ein Mensch. Nach der Satzkonstruktion zu urteilen, sehen die Sprecher einer akkusativischen Sprache den Menschen vorwiegend als Handelnden, und zwar nicht nur in ‘Erna läuft’, sondern auch in ‘Erna stirbt’, während in einer ergativischen Sprache das, was geschieht, dem Menschen vorwiegend ohne sein Zutun widerfährt, und zwar nicht nur in ‘Erna stirbt’, sondern auch in ‘Erna läuft’. Man kann das Argument noch ausbauen und darüber spekulieren, daß überall auf der Welt die akkusativischen Sprachgemeinschaften gegenüber den ergativischen auf dem Vormarsch sind, was angesichts ihrer Denkmuster auch kein Wunder ist.
Das Argument ist unbegründet. Denn weder in der akkusativischen noch in der ergativischen Sprache haben die Sprecher eine Wahl, ob sie den Aktanten des intransitiven Verbs wie einen Actor oder wie einen Undergoer darstellen wollen. Da sie nicht wählen können, können sie durch ihre Art der Darstellung der Situation auch nichts mitteilen. Da die Konstruktion vollständig automatisiert ist, haben sie auch keine Veranlassung, darüber nachzudenken, wie aktiv oder passiv der Aktant des intransitiven Verbs im allgemeinen oder im Einzelfall ist. M.a.W., diesem Strukturunterschied entspricht im Denken der Sprachgemeinschaft oder der Sprecher nichts. Es handelt sich um zwei (annähernd) gleichwertige, neutrale Mittel zum selben Zweck. Und die ergativischen Sprachen gehen nicht deswegen zurück, weil ihre Sprecher das Leben als Kismet ansehen, sondern weil die aggressivsten Völker dieser Welt zufällig akkusativische Sprachen sprechen.
Im Kapitel über Sprachstruktur ist summarisch dargestellt, daß die Gesamtheit der kognitiven und kommunikativen Konzepte und Operationen, welche überhaupt in Sprachen in grammatische Kategorien und Konstruktionen gefaßt sind, im Prinzip überschaubar ist und systematisch in Bereichen der Kognition und Kommunikation angeordnet werden kann, die man funktionale Domänen nennt. Die Konzepte und Operationen, aus denen die kognitiven und kommunikativen Domänen bestehen, sind allgemein-menschlich. Sie werden aber in verschiedenen Sprachen verschieden verknüpft und spielen daher auch eine unterschiedliche Rolle in den Sprachsystemen.
Betrachten wir als erstes Beispiel die Empathiehierarchie, die hier noch einmal dargestellt ist:
Diese Hierarchie steuert den Bau verschiedener grammatischer Kategorien in allen Sprachen. Ein geläufiges Beispiel ist die Numerusmarkierung an Substantiven, die in allen Sprachen dem Prinzip gehorcht: Wenn an Substantiven einer gegebenen Stufe der Hierarchie Numerus unterschieden wird, dann wird er auch an Substantiven und Pronomina aller höheren Stufen unterschieden. Im Chinesischen liegt der Abbruchpunkt zwischen den menschlichen und den nicht-menschlichen Individuen, im Deutschen erst zwischen den Entitäten und den Propositionen. Andere grammatische Bereiche, wo die Empathiehierarchie wirkt, sind die Passivierung, die Möglichkeit der Promotion zum dativischen Dependenten, die possessiven Konstruktionen, die Ersetzung von obliquen Pronomina durch wo und da im Deutschen u.v.a.m. Die strukturalen Ausprägungen können sehr verschieden sein; die funktionale Hierarchie ist überall dieselbe. Dies weist darauf hin, daß die Empathiehierarchie eine Komponente des ‘langage’ ist und daß sie im Denken aller Menschen eine Rolle spielt.
Zweites Beispiel: Die konstitutiven Parameter der Partizipation sind universal: alle Menschen erfassen Situationen als eine Menge von Partizipanten, die nach der Empathiehierarchie kategorisiert sind und die durch ein Netz von statischen oder dynamischen Beziehungen miteinander verbunden sind. Alle strukturieren diese Beziehungen nach zwei fundamentalen Parametern, nämlich der Zentralität (vs. Peripherizität) und der Kontrolle (vs. Affiziertheit) von Partizipanten in der Situation. Aber sie unterscheiden sich darin, welche Situationen sie als gleichartig und welche als verschieden auffassen, und folglich in der Typisierung von Situationen. Es gibt auch verschiedene Einschätzungen darüber, wer in einer Situation wieviel Kontrolle hat. Solche Einschätzungen schlagen sich dann z.B. in unterschiedlicher Verbalgrammatik nieder. Z.B. ist es in den meisten (u.a. allen romanischen) Sprachen so, daß man ‘jemandem etwas fragt’; nur im Deutschen (und weit weniger klar in anderen germanischen Sprachen) ‘fragt man jemanden etwas’. Insoweit das Valenzmuster variabel ist, kann man nach dem zuvor Gesagten damit etwas ausdrücken, und insoweit wäre der Gefragte im Deutschen ein direkt, im Italienischen jedoch ein indirekt Betroffener.
Und wiederum orientieren sich alle Menschen im Raum, und zwar in erster Linie egozentrisch. Sie unterscheiden die Hälften ihres eigenen Körpers als rechte und linke Hälfte. Sie reagieren auf die Schwerkraft und unterscheiden entsprechend zwischen ‘oben’ und ‘unten’. Sie benutzen topographische Marken (wie Berg oder Fluß) oder die Gestirne als Bezugspunkte zur Orientierung. Aber sie geben diesen Parametern eine unterschiedliche Rolle in ihrer Orientierung und kombinieren sie auf verschiedene Weise miteinander. Was das konkret besagen kann, haben wir oben gerade anhand der Experimente zur Raumorientierung gesehen.
Die funktionalen Domänen sind ein theoretischer Versuch, des dialektischen Verhältnisses zwischen Einheit und Verschiedenheit in der menschlichen Sprache Herr zu werden und die sterilen Extreme sowohl eines totalen Universalismus als auch eines totalen Relativismus zu meiden. Die kognitiven und kommunikativen Funktionen der Sprache erscheinen im Sinne einer teleonomischen Hierarchie als Aufgaben, die Sprachsysteme zu lösen da sind. Diese Aufgaben zu identifizieren, hatte bereits Humboldt der allgemein-vergleichenden Sprachwissenschaft als Programm gegeben:
Sprachen sind in dieser Sicht Problemlösungssysteme. Die Probleme oder Aufgaben stellen sich in dem Umfeld, in dem Menschen leben. Natürlich sind diese Umfelder je nach historischer, kultureller und sozialer Situation der Sprachgemeinschaft sehr verschieden. Nichtsdestoweniger kehren die gleichen Aufgaben überall wieder. Es gibt keine Sprache, in der nicht die Deixis, die possession, die Illokution, der kommunikative Dynamismus jeweils einen erheblichen Teil der Grammatik strukturierten. Wir müssen daraus schließen, daß die in diesen Domänen erfüllten kognitiven und kommunikativen Funktionen das Denken aller Menschen strukturieren.
De Saussure hatte noch gemeint:
Das Denken für sich allein genommen ist wie eine Nebelwolke, in der nichts notwendigerweise begrenzt ist. Es gibt keine von vornherein feststehenden Vorstellungen, und nichts ist bestimmt, ehe die Sprache in Erscheinung tritt. (Saussure 1916[1967]:133)
Nach fast einem Jahrhundert strukturaler Sprachwissenschaft und empirischer Erforschung der Sprachen der Welt muß das präzisiert werden: Zwar trifft es zu, daß die Bahnen des Denkens und die grammatischen Kategorien und Operationen sich erst auf dem Niveau der ‘langue’ ausbilden. Sie tun das aber nach universalen Prinzipien. Es gibt Vorgaben, die alles andere als nebulös sind und die die Erfordernisse der Kognition und Kommunikation an die Sprache qua ‘langage’ und folglich an jede einzelne ‘langue’ richten.
1 Auf dem Hintergrund der Annahme, es gebe eine direkte Beziehung des Zeichens zur Wirklichkeit (die vermutlich in einigen semiotischen Systemen wie der Bienensprache wirklich besteht), hat man (Hockett 1963) die Möglichkeit, in menschlicher Sprache zu lügen, sogar mit einem eigenen Begriff bedacht, der ‘Prävarikation’ heißt.
2 Zum rechten Gebrauch von sprachlich und linguistisch s. anderswo.
3 Whorf hat die These übrigens wirklich vertreten und gelegentlich seinen Lehrer E. Sapir als Kronzeugen angerufen, der sie aber tatsächlich nicht vertreten hat.