Die Ursprache, von der die Schwestersprachen abstammen, ist meistens nicht selbst durch Dokumente überliefert und muß daher durch historischen Vergleich rekonstruiert werden. Die Rekonstruktion wird durch die Interferenz von Sprachkontakten erschwert. Sie gelingt nie vollständig. Mithin bringen rekonstruierte Sprachen als Input für weiteren Sprachvergleich eine erhebliche methodische Unsicherheit mit sich. Linguisten unterscheiden sich darin, wie weit sie in der Rekonstruktion zurückgehen. Die vorsichtigen rekonstruieren Ursprachen ausschließlich auf der Basis historisch belegter Sprachen. Die wagemutigen errichten Stammbäume über rekonstruierten Sprachen und fassen Sprachfamilien zu Stämmen und Phyla wie z.B. Nostratisch zusammen.
Die gewissenhafte Anwendung der historisch-vergleichenden Methode, so wie zuvor dargestellt, erfordert für jede verglichene Sprache mindestens das folgende:
Wir gehen noch einmal zurück auf die Unterscheidung von Kontiguitäts- und Similaritätsbeziehungen. Wenn man darauf verzichtet, in der Unterscheidung zwischen genetischer und Lehnverwandtschaft sicher zu gehen, und sich damit begnügt, historische Verwandtschaft von typologischer Ähnlichkeit zu unterscheiden, dann kann es genügen, den Grad zu messen, zu welchem zwei Sprachen sich in arbiträren Eigenschaften, und das bedeutet für die meisten: im Vokabular, ähneln. Man wendet also statistische Methoden auf den Wortschatz an. Das wird wie folgt gemacht:
Zu Punkt 3 ist zu ergänzen, daß wenn zwei verglichene Wörter etymologisch dieselbe Wurzel haben, sie in diesem Sinne verwandt sind. Nachträgliche morphologische Modifikationen spielen keine Rolle. Daher gilt ital. fratello mit lat. frater und frz. frère, und frz. oreille gilt als mit lat. auris verwandt, obwohl die jeweils ersteren von den lateinischen Wörtern per Deminution abgeleitet sind.
Das Verfahren heißt Lexikostatistik und geht auf Morris Swadesh zurück, der es um die Mitte des 20. Jh. auf zahlreiche Sprachen Amerikas anwandte. Von der Liste gibt es mehrere Fassungen, darunter eine 100-Wort-Liste. Die Fassung mit 207 Begriffen ist hier.
Von diesem Verfahren existiert eine Variante, die nicht eine geeichte Begriffsliste, sondern einen geeichten Text verwendet, der in die zu vergleichenden Sprachen übersetzt wird. Die Methode wird von Sergej Starostin und Witold Mańczak angewandt.
Jede Sprache erneuert im Laufe der Zeit ihr Vokabular, sei es durch Neologie (i.w. Wortbildung), sei es durch Entlehnung. Das schließt auch fundamentale Begriffe der Basic Word List ein. Das Englische z.B. hat für Position 2 der Swadesh-Liste jahrtausendelang thou bzw. dessen historische Vorgänger verwendet; aber seit einigen Hundert Jahren verwendet es das – nicht etymologisch verwandte – you. Das Wort für Position 38, person, ist ein Lehnwort aus dem Französischen. Man kann annehmen, daß eine Sprache im Laufe einer langen Zeit alle Begriffe auf der Liste mit neuen Wörtern bezeichnen wird, und daß dieser Prozeß stetig ist. Das heißt, dieser Grundwortschatz hat eine Art Halbwertzeit, in der er verfällt. Diese ist meßbar, ganz ähnlich wie die Radiokarbonmethode C14 die Halbwertzeit von organischem Material mißt. Auf diese Weise ist es möglich, das Alter einer Sprache relativ zu einer als Fixpunkt angenommenen Ursprache zu bestimmen.
Angenommen, zwei Schwestersprachen haben je 80% ihres Vokabulars mit der Ursprache gemeinsam, dann haben sie miteinander mindestens 64% gemeinsam. Den Prozentsatz des beibehaltenen Wortschatzes einer Sprache erhält man also als das Zehnfache der Quadratwurzel des Prozentsatzes der Gemeinsamkeiten mit der Schwestersprache.
An Sprachen, die eine lange und gut untersuchte Geschichte haben, nämlich Spanisch und Englisch, hat Swadesh seinen “lexikalischen Chronometer” geeicht. Daraus resultiert eine “Retentionskonstante”, die glottochronologische Konstante r. Sie beträgt 0,86 für die 100-Wort-Liste und 0,81 für die 200-Wort-Liste und repräsentiert das Faktum, daß nach 1000 Jahren noch 86% bzw. 81% des Wortschatzes erhalten sind.
Somit ergibt sich für die Zeit, für welche zwei verglichene Sprachen getrennt sind, folgende Formel (nach Robert B. Lees):
t | = | ln c | |
ln r |
t: Jahrtausende der Zeittiefe einer Sprache (Abstand von der Ursprache)
t/2: zwischen zwei Schwestersprachen aufgeteilte Zeittiefe (Abstand von dem nächsten ihnen gemeinsamen Knoten)
ln: Logarithmus naturalis, d.i. Logarithmus zur Basis e*
c: Prozentsatz des gemeinsamen Basiswortschatzes (0 < c < 1)
r: glottochronologische Konstante.
* e = 2.71828 18284 59045 23536 02874 . . .; wird als logarithmische Basis für exponentielles Wachstum verwendet.
Der Wert t wird berechnet, wenn die eine der verglichenen Sprachen von der anderen abstammt. t/2 wird berechnet, wenn zwei nicht voneinander abstammende Sprachen verglichen werden (was der Normalfall ist). So werden Zeittiefen der genetischen Verwandtschaft zwischen Sprachen angegeben, also z.B. 1.500 Jahre für die Beziehung zwischen Französisch und Italienisch.
Die folgende Tabelle gibt – nach Art einer Logarithmentafel – die Ergebnisse der Formel für eine Serie von Retentionswerten. Ein Beispiel für die Anwendung der Swadesh-Liste auf einige europäische Sprachen liegt auf dem Web.
Trennungszeit in Jahren | Bewahrungsrate in % |
1000 | 74 |
2000 | 55 |
3000 | 40 |
4000 | 30 |
5000 | 22 |
6000 | 16 |
7000 | 12 |
8000 | 9 |
9000 | 7 |
10000 | 5 |
Die Methode hat eine Reihe unbestreitbarer Vorteile:
Die meisten Linguisten haben dennoch erhebliche Vorbehalte gegen Glottochronologie. Diese beziehen sich auf verschiedene Punkte:
Lees, Robert B. 1953, "The basis of glottochronology." Language 29:113-127.
Sjoberg, Andree & Sjoberg, Gideon 1956, "Problems in glottochronology." American Anthropologist 58(2):296-308.