Cover

Gab es wirklich eine Ursprache?

Über nicht belegte Fakten lässt es sich prächtig spekulieren, insbesondere solange offizielle Rahmendatierungen noch derart im Fluss sind. Doch Forschung ist Versuch und Irrtum: Man versucht einen halbwegs plausibel erscheinenden Ansatz und prüft anschließend dessen Konsequenzen. Sind jene in­tolerabel, so verwirft man den Ansatz und probiert den nächsten aus – so lange bis man eine logische Struktur gefunden hat, die einerseits nicht aneckt und andererseits nachprüfbare Fakten korrekt reproduziert. Selbst die Naturwissenschaften arbeiten nicht anders. Ein viel versprechender Ansatz wird dergestalt zur These, Hypothese, zum Modell, zur Theorie, zum Gesetz. Gefragt sind primär also Ansätze.

Gedanken an eine einheitliche Ursprache der Menschheit sind nicht neu. Nur rankten sich solche Vorstellungen historisch viel zu oft um den Begriff einer „babylonischen Sprachverwirrung“­, die eine vorher als existent postulierte Einheit der Sprache aufgehoben habe. Und jene einheitliche Sprache sei irgendwann einmal fix und fertig vom Himmel gefallen. Um diese zu ergründen, scheuten sich Herrscher nicht, Kleinkinder zu isolieren – in der Erwartung, dass diese, unbeeinflusst von außen, dann jene Ursprache zu sprechen begönnen.

So wie sich die Sintflut-Sagen in aller Welt über Hunderte von Generationen hinweg mit ziemlicher Sicherheit als ferne Überlieferungen des dramatisch raschen Anstiegs des Meeresspiegels um die 120 Meter am Ende der letzten Eiszeit in das Gedächtnis der Menschheit eingefroren haben, als alle Küstenlinien wie auch zahlreiche Inlandbecken überflutet wurden, so könnte die Metapher einer „babylonischen Sprachverwirrung“­ auf ein weit älteres Gedenken an Naturkatastrophen hindeuten.

Primär am Pranger stünde die Klimakatastrophe vor 140.000 Jahren, als die Riss-Eiszeit an ihrem Ende das gesamte tropische Afrika mit einer extremen Dürre überzogen hatte. Details wären noch zu klären. Jedenfalls soll dieses Armageddon die Mannigfaltigkeit der mitochondralen Gen-Variabilität des Homō sapiēns – damals noch auf Afrika beschränkt – derart einschneidend reduziert haben, dass unsere Rasse seither auf einen Stammbaum von lediglich noch 600 überlebenden Linien insgesamt zurückgreifen kann. Die genetische Datierung ist allerdings recht ungenau.

Der Ausbruch von Supervulkanen, wie zuletzt dem Toba auf Sumatra vor 75.000 Jahren, der den Übergang vom Homō sapiēns zum Homō sapiēns sapiēns terminiert, dürfte mit den Schrecken ihrer „atomaren“ Folge-Winter diese Langzeit-Erinnerungen immer erneut aufgefrischt haben.

Von der einst breiten Fächerung verwandter Sprachen mit all ihren Übergangsformen waren demnach nur einige wenige, isolierte Sprach­inseln übrig geblieben: die Basis für unsere heutigen Sprachgruppen im Groben! Ihre Übergangsformen ineinander waren radikal zugrunde gegangen. Niemand mehr konnte sich, wie zuvor noch mit seinen Nachbarn, mit anderen Menschen verständigen – so der Umherirrende überhaupt noch auf Überlebende stieß.

Nahrung findet der Gedanke an eine Ursprache auch immer wieder, wenn sich aus zwei als voneinander unabhängig erachteten Sprachen gleiche Strukturen oder gar eine (kleine) Anzahl ähnlich klingender Einzelvokabeln entwickelt haben. Beispiel „duō“: lateinisch „2“, chinesisch „viele“.

Trotzdem hat das Kunstwort „Krad“ (= Kraftrad) absolut nichts mit dem „Grat“ eines Gipfelberges oder mit dem lateinischen Stamm „grad-“­ für „schreiten“ zu tun; erst recht ist es nicht etwa als lautliche Verkürzung für „Kraut“ zu (miss-)deuten! Andererseits sind so manche Doppelbegriffe aus dem Teekessel-Spiel der Kinder (Wasser-Hahn Gockel-Hahn) durch­aus gleichen Ursprungs; die Technik entlehnt ja des Öfteren Begriffe mit neuem Inhalt fantasievoll aus umgangssprachlichen Altbegriffen.

Der Vorstellungskraft sind also kaum Grenzen gesetzt. Was bei solchen Einzelbeispielen jedoch fehlt, das ist der Nachweis einer zwingenden Gesetzmäßigkeit. Um von einer solchen sprechen zu dürfen, muss man – wo keine schriftlichen Entwicklungszeugnisse vorliegen – sehr viele unterschiedliche Beispiele aufzeigen, um mit ihnen einen systematischen Sprach­­wandel zu belegen. So jedenfalls handeln die Sprachforscher, wenn ihnen die „missing links“ zwischen zwei Sprachen fehlen.

Erbitterte Fehden werden ausgetragen, wenn konkurrierende Schulen unterschiedliche Thesen favorisieren. Zu beachten ist dabei, dass „Ähnlichkeiten“ grundsätzlich auf zwei Ebenen zu suchen sind, die zwar nichts miteinander zu tun haben, gleichwohl aber beide erfüllt sein müssen:

  1. lautliche Kompatibilität (Phonologie),

  2. inhaltliche Kompatibilität (Semantik).

Insbesondere bei Punkt 2 sind alle Optionen offen. Eifersüchtige Streitereien führten vielfach zu recht engen Auslegungen. Wäre der Wasserhahn nicht in geschichtlich nachvollziehbarer Zeit als Aufsatz auf einem Rohr ent­standen, wobei einem Klempner der bildliche Vergleich mit einem Gockel auf der Stange ins Auge gestochen haben mag – als vorgeschichtliche Erfindung hätte es kein heutiger Etymologe gewagt, einen identischen Ursprung für beide „Hahn“-Begriffe auch nur in Erwägung zu ziehen!

So gilt bei den Sprachforschern häufig als Notnagel eine nichtssagende Klassifizierung als „lautnachahmend“, wenn ihnen die Klärung der weiteren Herkunft nicht gelingen will. Kann aber ein anlautendes kn- bei bestem Willen nicht als „lautnachahmend“ verkauft werden („Knolle“!), dann wird halt eine neue Klasse „verdickte Gegenstände“ erfunden. Oder man stellt das Wort als „einzelsprachlich“ in die Ecke. Lustig, wie da hochwissenschaftlich mit blühender Fantasie „von hinten durch die Brust ins Auge“ geschossen wird.

Auffallend viele Wörter des germanischen Sprachbereiches können nicht über dessen Grenzen hinweg verfolgt werden. Schaut man aber ins Chinesische – siehe da – verblüffenderweise tauchen viele dieser Wörter dort wieder auf, zum großen Teil sogar mit einer ganz ähnlichen Bedeutung – und dies bei einer – je nach Gen-Datierung – seit 50 bis 100.000 Jahren auseinander gedrifteten Entwick­lungsgeschichte und (heute) total anderer Grammatik!

Geradezu amüsant mutet es an, indogermanische Wörter mit chinesischen Augen zu betrachten. Hat man erst einmal die Regeln der Lautver­schiebungen durchschaut, dann kann man sich den Jux leisten, sich ein deutsches oder lateinisches oder indisches Wort vorzuknöpfen und die Lautgesetze draufzusetzen – erst die der betrachteten Sprache rückwärts über das Indogermanische bis hin zur „Ursprache“ und von dort her wieder vorwärts bis hin zum Han-Chinesischen.

Ein anschließender Blick in ein chinesisches Wörterbuch wird die so erschaffene Konstruktion in erstaunlich vielen Fällen bestätigen: Stimmt; das Wort existiert dort tatsächlich, in der Form, mit dem (näherungsweisen) Sinngehalt (… während die Gegenprobe per Zufallsauswahl nur in den seltensten Fällen auf Einzeltreffer stößt)!

Verblüffend – aber es funktioniert. Kommen Sie mit auf die Reise!

 

Vorgeschichtliches

Meine Leitüberzeugung war, dass Sprache eben nicht vom Himmel gefallen sein konnte, sondern nur am Ende eines langen, sehr langen biologischen Entwicklungsprozesses zu suchen sei und dass sich wesentliche Einzelschritte dieser Entwicklung auch in irgendeiner erkennbaren Weise in der menschlichen Stammesgeschichte nieder­geschlagen haben müsse. Doch wie könnte dies abgelaufen sein? Probieren wir also einen Ansatz.

 

Spurensicherung

Gehen wir davon aus, dass Pan, der Schimpanse, als unser nächster noch lebender tierischer Verwandter in den Jahrmillionen nach der Abspaltung unseres Ahnenstammes Homō von dem seinen sprachlich auf jener originären Entwicklungsstufe in etwa stehen geblieben ist, dann liegt die Vermutung nahe, dass die relevanten Pithezäen, die nicht-äffischen Vorfahren des Homō, zu jenem Zeitpunkt wohl eine gleiche oder ähnliche Artikulationsweise wie jene heute gepflegt haben könnten.

Ausgehend von einer Art wohligen „Brummens“ – oder sollten wir besser sagen: „Schnurrens“? – käme als Grundlaut so etwas wie „ng“ infrage, ein Halbvokal, für den es in europäischen Schriften keinen Einzelbuchstaben gibt. Emotional mag bei diesem Deutungsversuch die durative Zufriedenheit mit einem erreichten Zustand dahinterstecken, den die äußeren Umstände vorübergehend „bewirkt“ haben:

 

 

Die Aufkündigung dieses Zustandes – wodurch auch immer – wird mit einem ärgerlichen Übergang dieses geschlossenen, sonoren Halbvokals zu einem offenen Vokal beantwortet, der in etwa wie das dumpfe „e“ im Chinesischen oder wie im französischen Artikel „le“ klingt. Lautschriftlich wird dafür gern die Form eines kopfstehenden kleinen „e“ aus dem Al­phabet der aserischen Sprache Azerbaijans übernommen:

 

 

Bewirkt diese Störung eine gewisse Ängstlichkeit, so tendiert dieser dumpfe Laut mehr in Richtung zu einem dynamisch gepressten, abwehrenden, offenen „i“ hin (wie in deutsch „bitte“) im Sinne von „Weg da, weg, weg!“, der bei wiedergewonnener Selbstsicherheit in ein freches, kurzes, offenes „e“ (wie deutsch „ä“) übergeht. Staunen wandelt ihn mehr zu einem offenen „o“ (deutsch „hoffen“), Neugier oder ein Gefühl von Überlegenheit grob in Richtung auf ein offenes „a“ hin.

Damit aber wäre das Repertoir schon erschöpft. Echte Konsonanten und geschlossene Vokale sind nicht dabei. Soweit der Schnappschuss einer zurück projizierten Ist-Aufnahme gegenwärtigen Schimpansenlebens. Jetzt zu den Thesen einer denkbaren Weiterentwicklung, die zu nachprüfbaren Resultaten gelangt. Hier setzt die Spezialentwicklung über die Pithezäen in Richtung zur Gattung Homō ein.

Der Übergang von unseren letzten gemeinsamen Vorfahren zum Austrālopithecus vor ca. 7 Millionen Jahren bedeutete eine Kette von Mutationen im Zusammenhang mit der Anpassung seines Lebens im engen Geäst hoher Bäume an ein solches in einer sich öffnenden Savanne. Die geringere Körpergröße gestattete es Ihnen, in feinere Verästelungen hochzuklettern als die allgegenwärtigen schwereren Raubtiere. Und die Savanne war weitläufiger, der Blick reichte ferner, die Gruppe fächerte stärker auseinander. Somit bedurfte die Kooperation der Individuen einer Gruppe beim gemeinsamen Einsammeln von Obst, Gemüse und Aas, oder gar bei gemeinsamer Jagd, einer Erweiterung ihrer bisherigen Kommunikationsmittel.

Gleiches gilt für die Gefahrenabwehr dieser schwächlichen Individuen, deren Körperkräfte der eines Löwen weit unterlegen waren und den sie nicht riskieren durften, mit lautem Geschrei beim Jagen auf sich aufmerksam zu machen – was übrigens auch die Beute verschreckt hätte. Darwin muss ihnen nōlēns volēns eine ausgefeiltere Gestik verpasst haben – etwa derart, wie wir sie noch heute bei den Völkern des Orients so bewundern.

Auch einige wenige, typische Warnsignale akustischer Natur, die sofort wirkten und nicht erst, wenn man zufällig einmal in die passende Richtung blickte, mussten vorhanden gewesen sein, wenn im hohen Gras Gefahren lauerten. Aber, mit dem Jagd- und Sammelerfolg zurück im sicheren Geäst, dürfte die Gruppe umso lautstärker triumphiert und gefeiert haben. Ähnlich wie bei unseren heutigen Schimpansen – oder auch in gewissen menschlichen Familien südlicher Gefilde – wird ein mit wilder Gestik und Mimik verknüpftes Geschnatter und Gekreische resultiert haben.

Dif­ferenzierter als beim Schimpansen wird diese Gestik aber über das rein Emo­tionale hinaus dennoch bereits erste, primitive Elemente einer Taub­stummen­spra­che als informationstragenden Bestandteil mit zum Inhalt gehabt haben. Zu einer Art Taubstummensprache in heutigem Sinne standen ihr zu dem Zeitpunkt allerdings noch die zugehörigen zerebralen Verknüpfungen aus.

Diese neue, hereinmutierte Fähigkeit – statt nur wild herumfuchtelnd den Macho bzw. die zeternde Maid zu spielen, auch schon einfachste konkrete Informationen bewusst weiterreichen zu können – musste mit entsprechenden Gehirnstrukturierungen Hand in Hand gegangen sein.

Als Folge dieser neuen, äußerst nützlichen Gehirnfähigkeit wird Darwin als Weiterentwicklung des vokalen Gekreisches und Geschnatters unserer weitläufigen Vorfahren auch die Umsetzung dieser neuen Gehirnfunktionen in lautlich differenziertere Äußerungen über den Rachen- und Mundraum gefördert haben, so dass Aus­trālopithecus in irgendeiner seiner Zwischenentwicklungsstufen auch vage die ersten Konsonanten zu artikulieren und im Laufe der Jahrmillionen allmählich wohl voneinander zu unterscheiden gelernt haben wird.

Zu ermitteln, in welcher Erscheinungsform er dies technisch bewerkstelligt haben könnte, wäre eine Fragestellung an die „experimentelle Archäologie“. Denn für ein Sprechen im heutigen Sinne lag sein Kehlkopf noch zu hoch. Die Vermutung liegt nahe, dass als Variante jenes „ng“ zur konsonantischen Seite hin durch leichtes Anheben des Zungenrückens erst einmal die Skala sonorer Halbvokale zum Zuge kam, allen voran der drohende Fauchlaut („Laryngal“) „ch“ (wie in deutsch „Bach“); ich will ihn lautschriftlich mit unter dem gehauchten „h“ subsummieren.

Seine phonetische Weiterentwicklung zu einem „r“ dürfte dagegen noch ein weiter Weg gewesen sein. Semantisch benachbart jedoch ist sein Bedeutungswandel vom Fauchlaut „h“ hin zum wesentlich späteren, stabileren, liquiden Sonorlaut „r“:

 

 

 

Man beachte den Wandel vom zwischenzeitlich „durativen“ Aspekt „drohen“ und „vergegenwärtigen“ wieder zurück zum „vollendeten“ Aspekt eines „erreicht Habens“ bei „Gegenstand, Ding, etwas“!

Während bei der Spätform des „r“ noch deutlich erkennbar das „Erreichte“ aus dem „ng = Wirkung erreicht haben“ im Vordergrund steht, wandert der Ton bei konkurrierenden, anderen Ausnuancierungen mehr in Richtung einer Trennung des durativen Aspektes („bewirken, erreichen“) vom vollendeten Aspekt („(bewirkt, erreicht) haben“) hin:

 

 

So ergeben sich, neben dem „r“ von oben, je nach Zungenstellung, die restlichen Sonorkonsonanten:

 

 

Semantisch steckt folgender Bedeutungswandel dahinter:

 

 

Bei den Sioux-Indianern Nordamerikas unterscheiden wir drei Dialekte: „Lakota“, „Dakota“ und „Nakota“. Der systematische Wechsel in den drei Anlauten überall in deren Vokabular bestätigte mir auf einer Reise dorthin meine Ansätze von oben im Nachhinein, die diese d/n/l in Relation zueinander setzen.

Zusammen mit der biologisch über Jahrmillionen hinweg erreichten Fähigkeit, die oberen drei dieser stimmhaften Sonorlaute auch in der Aussprache sauber voneinander zu trennen, war der Grundstein dafür gelegt, jenen durativen Stand primitivster Sprachentwicklung irgendwann nicht nur mimisch oder per Gestik sondern auch akustisch abzuschließen.

Dieser vollendete Aspekt ergab sich per Einführung – damals vermutlich noch stimmloser – Verschlusslaute p,t,k. Ob diese im ersten Anlauf behaucht („p,t,k“) oder unbehaucht (chinesisch: „b,d,g“) waren lässt sich zurzeit schwerlich rekonstruieren. In den Khoe-San-Sprachen des südlichen Afrika entwickelten sie sich zu deren „Klicklauten“, indem die Sprecher sie nicht durch Ausstoßen sondern durch Einsaugen von Luft formulierten.

Es ist anzunehmen, dass diese drei Varianten, genauso wie die durativen Sonorlaute selber, vom Sinn her erst einmal nicht unterschieden wurden sondern lediglich als Kennung für den Abschluss einer durativen Wirkung benutzt wurden. Ihre semantische Auffächerung entwickelte sich dann erst viel später, schlichtweg aufgrund ihrer puren Existenz:

 

 

Die Herausarbeitung eines eigenen Sinnes für jeden dieser Verschlusslaute unabhängig von den jeweils anderen dürfte geraume Zeit auf sich haben warten lassen. Es gehörte zu den mit Abstand schwierigsten Aufgaben in der Vorbereitung zu dieser Abhandlung hier, an die ungefähre Urbedeutung dieser Einzelkonsonanten heranzukommen. Doch letztendlich wurden auch diese langwieringen Bemühungen von Erfolg gekrönt.

Rein aussprachetechnisch konnte das m nur durch ein p oder b abgeschlossen werden, das n durch ein t oder d, und das ng durch ein k oder g. Erst dann, als – im Rahmen einer abermals viel späteren Entwicklungsphase – auch andersartige Kombinationen all dieser Konsonanten miteinander opportun erschienen, nachdem sich obige Bedeutungsvarianten gefestigt und verbreitet hatten, dürfte die Stunde des „l“ als nahe Variante des „n“ geschlagen haben.

Für das „l“ lag zwar ebenfalls eine Verbindung zum t/d nahe, doch p/b und k/g lagen – nur wenig schwerer aussprechbar – auch im Rahmen des Möglichen. So darf man das spätere „l“ vielleicht als eine universeller anwendbare Nebenform eines ursprünglicheren „n“ interpretieren. Für das wesentlich ältere „r“ dürfte Ähnliches in Bezug ng > hng > ṛng gelten.

Nehmen wir diese Ergebnisse als Hinweis darauf, dass eine Sinngebung ursprünglich erst einmal um die nur drei Konsonantfragmente ṛmp, ṛnt, ṛngk herum gestrickt worden war. Einzelkonsonanten entstanden dann nachträglich erneut durch Reduplikation plus Herauskürzen des einen oder anderen Bestandteiles, verbunden mit dem Einschieben flüchtiger Vokale ohne Bedeutung, allein zwecks einfacherer Aussprache: Erste, primitive Ur-Silben entstanden. Beispiel:

 

 

Vom Urmenschen zum Homō ērēctus

Über das noch sehr rudimentäre „Sprach“-Vermögen (inklusive Gestik) in einer „Sprache erster Ordnung“ mit lediglich einer Handvoll Grund­konsonanten, die Aus­trālopithecus allenfalls vielfach repetiert (pəpə­pə ...), jedoch noch nicht variiert (pəgə­pətə ...) haben wird, konnte sich nun Jahrmillionen lang Darwins Auslese­prinzip austoben, so dass unsere Zeitgenossen zum Homō rōbustus diese Klaviatur endlich mit Bravour beherrschten und diese an den nun neu ins Bild tretenden Homō habilis, einen frühen Homō ērēctus, nebst seinen parallelen urmenschlichen Entwicklungslinien, weiterreichen konnten.

Andererseits war mit solch einem Gestotter auf der Basis von anfangs nur drei unkombinierbaren „Konsonanten“ (ṛmp, ṛnt, ṛngk) und noch ohne echte, verbinden­de Vokale natürlich kein Staat zu machen. Seinerzeit in der Savanne muss die Gestik also noch das vorherrschende Kommunikations­mittel geblieben sein. Die Sprachentwicklung dürfte in jener Epoche also weniger akustisch als optisch/händisch/mimisch vorangeschritten sein. Nutznießer der entsprechenden weiteren Gehirnregionen wird aber nicht zuletzt auch deren Sprachzentrum geworden sein – erst schwach, dann im Verlauf der Jahrmillionen immer ausgeprägter.

In solch einer Horde war natürlich der körperlich Stärkste der Boss; je stärker der war, desto weiter reichten auch seine Privilegien. Das gemeinsame Sammeln und die Gefahrenabwehr in der offenen Ebene hatte eine gewisse Stufe an Koordination gezeitigt; Abhängigkeiten voneinander waren entstanden.

Mit diesen neuen Fähigkeiten erwuchs dem Stärksten, dem Clanchef, allmählich Konkurrenz in Gestalt des geistig Wendigsten, Gerissensten heran. Die Beachtung besonderer Eigenheiten und der speziellen Geschicklichkeit einzelner Gruppenmitglieder hatte sich als eminent Erfolg versprechend erwiesen. Der körperlich Stärkste im Trupp bekam Konkurrenz durch die geistig Geschicktesten.

Die fortschreitende Individualisierung wurde zur Quelle gegenseitigen Mitgefühls und somit auch von Anteilnahme bei Todesfällen. Leichen wur­den irgendwann nicht mehr den Raubtieren zum Fraß einfach liegen gelassen; Totenkulte breiteten sich aus. Und wer sollte die organisieren? Der Geschickteste natürlich, der Raffinierteste. Neben dem Clanchef der Horde profilierte sich also erst die Kräuterhexe, dann der Schamane, der nun danach trachtete, die körperlichen Vorteile seines Militärchefs geschickt für seine eigenen Interessen einzuspannen.

Immer ausgefeiltere, schwerer durchschaubare Rituale dienten nicht nur der Verschleierungstaktik bezüglich seiner eigenen, wahren Absichten „nach oben“, sondern – um sich als unentbehrlich darzustellen – auch als Public Relations „nach unten“, damit ihm „die Basis“, überzeugt von der Wichtigkeit seiner Position, im Crash-Fall mit „oben“ parteiisch, als manipulierbare „Masse“, den Rücken stärkte.

Derartige Ränkespiele könnten allmählich die nächste Stufe der akustischen Sprach­entwicklung eingeläutet haben. Jene bloße Reduplikation dürfte über kurz oder lang in die Kombination auch unterschiedlicher Konsonanten miteinander zu Silben eingemündet sein. Als logische Folge gehört hierher die schon erwähnte Entstehungsgeschichte des Konsonanten „l“ aus dem ursprünglicheren „n“ heraus.

Solch eine Kombination unterschiedlicher Konsonanten miteinander stellt aber einen gar nicht zu überschätzenden, unglaublichen, weiteren Sprung in der Entwicklungsgeschichte des Menschen dar; wurden nun doch neben Einzelbewegungen (gə oder gəgə oder gəgəgə = dehnen, l oder lə oder langes lll = tasten/tes­ten) auch kombinierte Bewegungen ausdrückbar (g = dehnen, aus­breiten + l = tasten -> gl = gleiten, oder -> gəl = gellen, schreien, oder -> ləg = legen).

Man beachte aber hier bereits die hohe Vieldeutigkeit fester Konsonantenkombinationen! Notwendigerweise bargen sie bereits den Kern einer nachfolgenden Verkomplexisierung der Sprache in sich, die gleichlautende Begriffe, soweit erforderlich, wieder sauber voneinander unterscheidbar zu machen hatte.

Nun stellen aber willentlich kombinierte Bewegungen bereits einfach­ste Arbeitsabläufe dar! Homō habilis war nach unserem gegenwärtigen Kenntnisstand der erste Menschentyp, der seine Arbeitswerkzeuge nicht nur aufsammelte sondern sich auch selber herstellen konnte. Dazu waren aber, seinen Vorfahren gegenüber, entsprechend neue geistige Gehirnfunktionen erforderlich. Homō habilis besaß die offensichtlich. Also dürfte dieser Stand einer „Sprache zweiter Ordnung“ mit ersten Konsonantenverknüpfungen auch der des Homō habilis gewesen sein.

Trotzdem war auch dieser „Sprach“-Umfang, ohne eigentliche Wörter und ohne Grammatik, dermaßen geringfügig, dass wir noch immer nicht von einer „Sprache“ im engeren Sinne reden können. Gestik und Mimik wurden damit zwar ein klein wenig zurückgedrängt, mussten jedoch noch immer vorgeherrscht haben. Weitere Mutationen wurden erforderlich.

Die Eigenherstellung von Werkzeugen verfeinerte die Militärtechnolgie; vom wohl eher noch überwiegend in der „Horde“ vegetarische Kost sammelnden Homō habilis spaltete sich der Homō ergaster ab, eine mehr Fleisch essende, also agilere, eher in Gruppen jagende statt sammelnde Frühform des oder meinetwegen auch neben dem Homō ērēctus. (Unser eigener Vorfahr wird kaum ein reinrassiger Homō sowieso gewesen sein, sondern irgendeine Mutationslinie zwischen all jenen Typen. Es ist jedoch einfacher, mit jenen vorherrschenden Fixtypen als Zeitmarken zu argumentieren.) Die energiereichere fleischliche Kost gestattete ihm, neu, Muße! Und diese Umstellung in der Ernährung ließ sein Gehirnvolumen rasant anwachsen.

Hatte Habilis erstmals den so wesentlichen Schritt zur Kombination von Konsonanten zu einer Silbe beschritten, so vollendete Ergaster das Werk in besinnlicher Muße durch die Einführung willentlich differenzierter Vokale zwischen Konsonanten seiner Wahl. Allerdings gibt es Hinweise, dass die Vokale in mehreren, trennbaren Stufen eingeführt wurden.

Lange, lange vor ihrer zweiten Stufe dürften diese Vokale, neben jenem diffusen, aserischen ə, wie wir sahen, primär Laute ähnlich den drei offenen Vokalen a, e/o, i gewesen sein. Aus dem Chinesischen kommt der Tipp, dass das geschlossene „i“ erst nachträglich, als Resultat eines Mouillierungseffektes, eingeführt worden sein könnte (dt.: „gelang-en“ <-> ch.: *glàng > *gliàng > liàng = „vor sich hin stolpern“) und dann auch Verwendung zur Dehnung des noch offenen e > ei fand, aus dem sich später lokal das geschlossene „e“ entwickelte.

Eine Sonderrolle spielt das (offene) „u“. Für eine Vielzahl heutiger Sprachen ist nachgewiesen, dass das so unscheinbar wirkende „r“ eine Tendenz besitzt, sich gern zu einem „u“ zu „vokalisieren“. Damit ergeben sich bereits erste, ganz allgemeine, optionale Lautverschiebungsregeln, die nicht nur für den indogermanischen Sprachraum charakteristisch sind, sondern genauso auch im chinesischen Bereich zum Zuge kamen:

 

 

Diese Lautverschiebungen sind aber „optional“, nicht zwangsläufig! Selbst das (Mandarin-) Chinesische kennt noch heute den Buchstaben „r“. (Aussprache ähnlich dem US-amerikanischen „r“.) Die britischerseits verbreitete Mär, „der Chinese“ könne kein „r“ aussprechen, betrifft nur den kantonesischen Dialekt (Ersatz des „r“ durch „ng“ oder „y“), wie er damals in den ehemals britischen Kolonien Hongkong und Malaya/Singapur gesprochen wurde. Für andere Dialekte gilt diese Unterstellung nicht.

Bei Beschränkung auf das Deutsche wären ein paar willkürlich herausgegriffene Beispiele zu diesem Wandel des „r“:

 

 

Bei Ausweitung aufs Lateinische finden wir allgemeiner „indogermanischerseits“ sofort etwa:

 

 

Bei Hinzunahme chinesischer Dialekte endlich ergeben sich die verblüffendsten Querbeziehungen zu indogermanischen Wortstämmen:

 

 

Diese Wandlung des „r“ über ein „w“ zu einem „u“ ist aber keineswegs nur auf den Wortanfang beschränkt, wie uns etwa das folgende Beispiel lehrt:

 

 

 

Zum intermediären „wr“ gehören auch vokalische Dehnungen wie im Lateinischen „vert-ere = wenden“, das dem deutschen „Wort“ entspricht. Im Chinesischen gehören dazu zahlreiche Stämme „wu“ (z.B. = tanzen).

Diesem sekundären Vokal „u“ lässt sich später auch eine eigenständige Sekundärbedeutung zumessen, in etwa:

 

 

Meistens fährt man jedoch mit seiner Primärbedeutung als „r“ besser. Eine andere Ablautreihe des „r“ mit lokal und/oder temporal getrennter Historie zeigt sich auch in

 

 

Hierbei vokalisiert das „r“ nicht, sondern geht in seine „laryngale“ Friktivform „ch“ (dt. Bach, ich) über, die, von anderen Populationen übernommen, dann via „k“ und „h“ schließlich ganz und gar verschwinden kann. Eine ähnliche Ablautreihe der Altsteinzeit könnte gelautet haben

 

 

Aus dem Griechischen hingegen können wir die Entstehungsgeschichte des Friktiv-Konsonanten „s“ aus den drei Verschlusslauten heraus ablesen:

 

 

Dieses sekundäre „s“ mauserte sich dann zu einem allumfassenden Versatzstück, das immer wieder allen nur denkbaren Formen vorangestellt wurde. Beispiele:

 

 

Als Eigenbedeutung lässt sich diesem „s“ so etwas wie ein Reflexivum zuordnen:

 

 

Mitunter gebührt ihm auch gar keine eigene Bedeutung mehr; dann wird es einfach nur noch aus (prä)historischen Entstehungsgründen mitgeschleppt. Zur Erinnerung: s < p,t,k < Abschluss von ng = bewirken!

Doch ich habe bereits zeitlich weit vorausgegriffen. Zurück also zu unserem Ausgangspunkt um Tabelle 01h herum.

Vokale dürften in diesem frühen Stadium eines Austrālopithecus noch nicht willentlich differenziert, sondern lediglich emotional gefärbt, ineinander übergehend, und mehr in Form von „Grunzlauten“ intoniert worden sein (Variationen des aserischen „ə“ – vom offenen i und e („Grille“) bis zum ö („völlig“), vgl. französisch/chine­sisch „le“). Vermutlich wurden sie nur zwecks einfacherer Artikulation mit den „Konsonanten“ verknüpft (sei es akustisch oder über die Gestik).

Dies schließe ich daraus, dass Vokale noch bis hin zu den heutigen indogermanischen und semitischen Sprachen häufig nur der Unterscheidung von „Aspekten“ von Wörtern dienen – deutsch: sprechen, sprach, gesprochen, Sprache, Gespräch, Spruch, Sprüche, Sprichwort – nicht aber zur Sinngebung derer engeren Wortwurzeln. Ähnliches lässt sich zur „Vokalharmonie“ der ural-altaiischen Sprachen bis hin zum Finno-Ugrischen bemerken.

Sowohl im Chinesischen als auch im Indoeuropäischen ergab jener stammesgeschichtliche aserische ə-Laut Anlass zu einer gewissen Äquivalenz des offenen o zum offenen e. Zwar hatten Vokale nur erst die recht unwesentliche Bedeutung emotionaler Aspekte und waren kaum Sinn gebend, führten jedoch durch die Flexibilität und durch die flüssigere Wortmelodie ihres Einsatzes, die das vorherige undefinierte aserische Allerwelts-„ə“ in weitem Maße abkömmlich machte, zur Mehrsilbigkeit einer „Sprache dritter Ordnung“. Diese inkorporierende Mehrsilbigkeit dürfte dem Homō habilis noch fremd gewesen sein: ein weiterer, riesiger Kultursprung in punctō Sprache!

 

Blüte und Verfall der Buchstabensprache

Per Mehrsilbigkeit hatte sich Homō ērēctus, speziell in seiner Spätform als Homō heidelbergēnsis, in die Lage versetzt, für konkret unterscheidbare Gegenstände jetzt auch sprachliche Benennungsvarianten, Nuancen, Aspekte auszuformulieren, ohne parallel die Gestik und Mimik bemühen zu müssen! (Der Kehlkopf lag inzwischen tiefer.) Die einzelnen Buchstaben eines singulären Wortes erzählten dem Gegenüber in ihrer Auswahl nun bereits eine ganze Geschichte (vgl. die beiden Beispiele auf dem Buchumschlag). Wir müssen zu diesem Zwecke heute einen ganzen Satz mit vielen Wörtern bilden!

Eine reichhaltige Werkzeugkultur entwickelte sich im gegenseitigen Ideenaustausch und in konzertierten Aktionen. Ērēctus hatte ziemlich früh gelernt, das Feuer zu beherrschen. Hatten die ersten beiden Ordnungen einer Sprache mehr der Entwicklung einer Zuordnung Laut <-> Bedeutung gedient, so dürfte Ērēctus mit der Einführung sauberer Vokale seine Zuordnungen Wort <-> Bedeutung radikal neu erfunden haben, so dass der Ursprung unseres heutigen Vokabulars im Wesentlichen wohl erst beim späten Homō ērēctus anzusiedeln ist. Diese Grenze ist also der Stand, an dem wir unsere „Ursprache“ auszurichten haben.

Doch was ist ein „Wort“? Zum Abschluss unserer „Spurensicherung“­ waren wir auf die „Ur-Silbe“ gestoßen: Dreifachkonsonant (r + durativ + voll­endet), Vokal, Dreifachkonsonant – mit der Neigung, Dreifachkonsonanten zu einfachen zu verkürzen oder sekundär ganz zu schleifen. Per Kombination solcher Ur-Silben unterscheiden wir heutzutage grob vier Sprachtypen:

 

 

Das heutige Chinesisch ist weitgehend „isolierend“, das Englische befindet sich auf dem Weg dorthin. Als „flektierend“ setzt die Sprachforschung das Indoeuropäische – international eher als „Indo­­germanisch“­ bekannt – sowie die meisten seiner Folgesprachen an. Die brauche ich nicht zu erläutern. Typisch „agglutinierend“ sind die Turksprachen der ural-altaiischen Sprachfamilie mit ihren ständig „nachkleckernden“ Partikeln in Form von Vielfachendungen. Und „inkorporierend“ arbeiten die meisten Indianersprachen Amerikas, das Grönländische und die Khoe-San-Sprachen Südafrikas; das Französische tendiert in diese Richtung: „Qu’est-ce que c‘est?“. Die Grenzen sind fließend.

Es ist zu vermuten, dass unsere „Ursprache“ auf Buchstabenebene am ehesten einer inkorporierenden Sprache nahekam. Das heißt, einzelne Wortbegriffe waren unheimlich schwer anderen Sinn gebenden Begriffen gegenüber sauber abzugrenzen, so wie wir es im Idealfall etwa bei einer isolierenden Sprache erwarten. Paradoxerweise vergleiche man dies mit dem eigentlich isolierenden Chinesisch, das in seiner Bilderschrift jedoch keine Wortgrenzen kennt: Welche Silben mögen da wohl jeweils zu einem kompletten Wort zusammengehören?!

Buchstabenauswahl und die Länge eines „Wortes“­ hängen dort also weitgehend von der einbettenden Umgebung ab. (Interessehalber blättere man etwa in einem Náhuatl-Wörterbuch [9].) Mental bedeutet das Auseinanderfieseln solcher Abhandlungen „ohne Punkt und Komma“ einen Riesenaufwand!

Nun „besaßen“ Sammler und Jäger naturgemäß nur, was sie tragen konnten. Der Eigentumsbegriff wird – für unser heutiges Empfinden – also recht dürftig ausgeprägt gewesen sein. Wie im „Wilden Westen“ dürften – wie wir es heute bezeichnen würden – Gewalt und „Diebstahl“ an der Tagesordnung gewesen sein.

Dies wird immer wieder zur Absplitterung von Teilgruppen geführt haben, die dessen überdrüssig waren. Offizielle Sanktionen mussten her. Schamanen ersannen über ihre engeren Eigeninteressen dem Clanchef gegenüber hinaus jetzt auch Riten, die das Zusammen­leben organisierten und formalisierten.

Dadurch konnten Gruppen an Größe zu­legen. Im ständigen Spannungsfeld zwischen der weltlichen, „dummen“, Polizei-/Militär­macht, die das Sagen beanspruchte, und einem geistigen Sendungsglauben der Schamanenkaste, die ihr dies – in aller Vorsicht – streitig machte, etablierte sich notgedrungen als dritte Kraft eine (theoretisch) neutrale Jurisdiktion (Versammlungskultur, Mehrheiten vs. geduldete Minderheiten).

Das Schamanentum vereinte in sich objektive Beobachtung (als Vorläufer einer späteren Technik) mit subjektiven Schlussfolgerungen; und letztere vereinten in sich rationale Erkenntnisse über eine Welt, wie sie war, mit irrationalem Wunschdenken über eine Welt, wie sie sie gern gesehen hätten.

Für die Zusammenführung jener beiden Welten ergaben sich einerseits progressive Strömungen, diejenigen Aspekte der Wunsch­welt konstruktiv in die Tat umzusetzen, die die reale Welt zuließ, und andererseits gegenläufige, destruktive Bestrebungen, alles aus der realen Welt mit Tabus und Zensur zu belegen, gar zu vernichten, das der Wunschwelt widersprach. Letzteres ist der uns heute nur allzu gegenwärtige Fundamentalismus.

Dieser methodische Zwiespalt in den prätentiösen Vereinigungsstrategien zweier inkompatibler Welten führte naturgemäß zum Schisma zwischen einer auf Neu-Gier und Rationalität bauenden Philosophie und einer irrationalen, wissensfeindlichen Theologie. Während sich die Philosophie in immer spezialisiertere Unterdisziplinen aufgliederte – dazu gehören heute auch die Naturwissenschaften – sah sich die Theologie per Konstruktion genötigt, auch das ganze Tohuwabohu an Ritualen und Hokus-Pokus nebst deren gewollt-unsinnigen, künstlich verschleiernden Sprache und, viel später, auch Grammatik mit zu übernehmen. Diese Weichenstellung dürfte bereits beim späten Homō ērēctus erfolgt sein.

Schließlich erschienen im Norden der Neandertaler im Nordwesten, sein „Vetter“, der Denisova-Mensch, im Nordosten, und unsere eigenen Vorfahren, der Homō sapiēns, im Süden der „alten“ Welt, die den Homō heidelbergēnsis/ērēctus in Eurasien bzw. in Afrika ablösten. (Die Rolle des Homō flōrēnsis, der allenfalls Ein­fluss auf die SO-asiatischen Sunda-Inseln ausgeübt haben dürfte, ist zurzeit noch zu wenig erforscht.)

Der Neandertaler genauso wie der Homō sapiēns und der Denisova-Mensch wurde an seinem jeweiligen Mutationsort in ein gewisses Sprach­niveau hineingeboren. Jede Gruppe dürfte nach denjenigen Mutationen, die sie zu dem gemacht hatten, was sie waren, ein jeweils ähnliches, aber lokal differenziertes Niveau von ihren Vorfahren übernommen haben. Demnach müssten sich – nach der Übernahme durch Sapiēns sapiēns drei separate Haupt-Sprachlinien herauskristallisiert haben:

 

  • afrikanisch (urtümlicher Sapiēns),

  • eu­ropäisch (Homō sapiēns, teils + Neandertaler), Migration auch -> S-/O-Asien,

  • ur-asiatisch (Homō sapiēns + Deni­sova) -> Rückzugsgebiete N-Asien/Amerika, Australien.

 

Zumindest unser eigener Vorfahr war nun jedoch – theoretisch wenigstens – zusätzlich in der Lage, per Wortstellung (oder sonstigen Merkmalen) Substantive von Verben unterscheiden zu lernen. Verb + Objekt, dies drückt eine Handlung aus. Damit begann unser Vorfahr allmählich, genetisch dazu befähigt, auch Handlungsabläufe grammatisch linear im Rahmen einer „Sprache vierter Ordnung“ verbal und ohne Zuhilfenahme differenzierender Gestik und Mimik zu beschreiben! Die Beschreibungsweise über eine Sprache vierter Ordnung wird jedoch einher gegangen sein mit einem gewissen Abschleifen der teils doch recht kunstvoll aus Einzelbuchstaben komponierten Wörter.

Die Einzelaussage eines Buchstabens musste unter der Last dieser stark verlängerten Konstruktionen aus nun vielen Wörtern notwendigerweise mehr und mehr beginnen, in den Hin­ter­grund zu treten. Zur Ausnuancierung dürfte Sapiēns es gewesen sein – oder allenfalls der späte Ērēctus – der p=b, t=d und k=g zuerst in Form einer eigenen Gruppe b,d,g von einer zweiten, emphatisierten Variante p,t,k zu unterscheiden gelernt haben wird, allerdings noch unsystematisch und wieder rücknehmbar, austauschbar.

Diese Ausdifferenzierung beider Garnituren hat sich in den einzelnen Sprachen allerdings keineswegs stimmig entwickelt (vgl. dt.: trinken <-> eng.: to drink). Überdies pflegen die indogermanischen Sprachen b,d,g für die stimmhafte und p,t,k für die stimmlose Variante zu benutzen, während die Chinesen es vorzogen, stattdessen b,d,g als unbehaucht von den behauch­ten p,t,k zu unterscheiden:

 

 

Dieses Kuddelmuddel in der Darstellung nervt ein wenig. Doch was hilft’s, wir müssen damit leben.

Als unmittelbare Folge dieser Doppelgarnitur von Verschlusslauten dürfte auch die schon benannte Verschleifung ihrer Uralt-Formen über psi/zeta/xi -> s als weiterer Nuancierungsbaustein eine ungeahnte Auf­­wer­­tung erfahren haben.

Impressum

Verlag: BookRix GmbH & Co. KG

Tag der Veröffentlichung: 21.09.2015
ISBN: 978-3-7396-1485-4

Alle Rechte vorbehalten

Nächste Seite
Seite 1 /