Handbuch der Vielsprachigen Wikipedia



Teil A. Allgemeines

Teil B. Sprachversionen: B 1 Indoeuropäische Sprachen B 2 Andere Sprachen

Teil C. Hilfsmittel


Dieser Teil des HVW (Titelseite) beschäftigt sich mit allgemeinen Fragen zu den Sprachversionen der Wikipedia, nicht mit einzelnen Sprachversionen als solchen.


Bemerkung 2022: Dieses sogenannte Handbuch habe ich im wesentlichen 2008 geschrieben und kurz danach noch daran weitergearbeitet. Es soll so als feststehendes Dokument bestehen bleiben. Weil das Handbuch anscheinend bei manchen Forschern und in manchen Seminaren Anklang gefunden hat, lasse ich es online. Alternativ gibt es diese Version bei L.I.S.A. In meinem Buch "Wikis und die Wikipedia verstehen" habe ich die Vielsprachigkeit auch angesprochen, aber das Thema hätte in seiner Gesamtheit den Rahmen gesprengt. Ziko (Diskussion) 14:34, 14. Jun. 2022 (CEST)

Existenzbedingungen einer Wikipedia-Sprachversion

Die Freie Enzyklopädie Wikipedia gibt es in über 250 Sprachversionen, wobei der Ausdruck „Version“ irreführen kann. Es handelt sich nicht um ein feststehendes Textkorpus, das in andere Sprachen übersetzt wurde, sondern um über 250 einzelne Wikipedias. Zwar ist das Grundkonzept stets dasselbe, in den Regeln oder Gepflogenheiten kommt es teilweise zu erheblichen Unterschieden. Unterschiedlich sind auch die Inhalte, also die Artikel zu einzelnen Themen.

Eine Sprachversion kommt dadurch zustande, dass Interessierte der Wikimedia Foundation einen Vorschlag machen. Nach einer Prüfung durch ein Komitee wird die Sprachversion zumindest grundsätzlich erlaubt (eligible). Danach muss in einer gesonderten Website, dem Incubator, bewiesen werden, dass die Interessierten tatsächlich in der Lage sind, enzyklopädische Artikel zu erstellen. Erst danach gibt es grünes Licht für die Sprachversion. Die letztendliche Entscheidung über die Einrichtung trifft der Vorstand der Wikimedia Foundation.

Die Wikipedia hat etwas von einem soziolinguistischen Experiment: Man gibt einer Sprachgemeinschaft kostenlosen Webspace und das Konzept für eine Enzyklopädie, und man sieht sich die Resultate an. Möglicherweise sagt die Stärke einer Sprachversion auch etwas über das textproduktive Potential einer Sprachgemeinschaft aus.

Sprachgemeinschaft und Wikipedia-Potential

Erste Existenzbedingung einer Sprachversion ist die Existenz einer Sprachgemeinschaft. Folgende Faktoren sind für eine Wikipedia förderlich:

  • eine große Anzahl von Sprechern
  • viele Sprecher mit hohem Bildungsstand
  • günstige wirtschaftliche Ausgangsbedingungen
  • Freizeit
  • eine zivilgesellschaftliche Kultur, die ehrenamtliche Leistungen wertschätzt
  • weitverbreiteter Zugang zum Internet, am besten per Flatrate zu Hause
  • eine enzyklopädische Tradition, das heißt Vorbilder und die Vertrautheit mit dieser Informationsweise; die betreffende Sprache wird tatsächlich bereits für Wikipedia-ähnliche Zwecke verwendet
  • Meinungs- und Redefreiheit

Die Gesamtzahl der Sprecher an sich besagt nicht viel. Von der Gesamtzahl sind zunächst diejenigen abzuziehen, die an einer Wikipedia nicht mitschreiben können:

  • Menschen, die aus verschiedenen Gründen nicht schreiben oder nicht enzyklopädisch können, wie Kinder und Analphabeten
  • Menschen mit bestimmten Krankheiten oder Behinderungen
  • Gefängnisinsassen (in den USA immerhin über ein Prozent der Bevölkerung)

Ferner bedarf es einer Vielzahl von Fertigkeiten wie ein sicherer Umgang mit der eigenen Sprache und mit Computern sowie gewisse soziale Kompetenzen. Außerdem zeigen nicht alle Menschen dieselbe Bereitschaft, unentgeltlich an einer Enzyklopädie mitzuschreiben. Darum ist die letztendliche Gruppe von Menschen, die mitschreiben könnten, ziemlich klein.

Das Wikipedia-Potential hängt von der Beschaffenheit und den Ressourcen der Sprachgemeinschaft ab. Nimmt man eine große Nationalsprache wie das Deutsche als Messlatte, dann ist das Wikipedia-Potential in folgenden Fällen eher kleiner oder größer (in Bezug auf die Sprachgemeinschaft):

  • Sprachen der Dritten Welt: Das Wikipedia-Potential ist sehr klein, da viele Menschen, die gerne mitschreiben würden, keinen Internet-Zugang und auch nicht die notwendige Freizeit haben (neben anderen Faktoren).
  • Dialekte: Beispielsweise in Deutschland werden Dialekte vor allem von weniger bildungsaffinen Menschen gesprochen. Außerdem finden es selbst die Sprecher ungewöhnlich, im Dialekt an einer Enzyklopädie zu schreiben. Das Wikipedia-Potential ist umso kleiner.
  • Plansprachen und Latein: Sprachgemeinschaften, denen man freiwillig aus sprachlichem Interesse beitritt, sind insgesamt wesentlich bildungsaffiner als ethnische Gemeinschaften. Entsprechend fällt das Wikipedia-Potential sehr groß aus. Darum sind diese Wikipedia-Sprachversionen viel weiter als man aufgrund der oftmals eher kleinen Sprachgemeinschaften vermuten würde.

Recht und Technik

Einer der Wikimedia-Server in Paris

Betreiberin aller Wikipedia-Sprachversionen ist die Wikimedia Foundation, eine gemeinnützige Stiftung mit Sitz in den USA. Sie sammelt Spenden, die für den Betrieb der Server unerlässlich sind. Dies nimmt den entstehenden Wikipedia-Gemeinschaften viel Arbeit und Sorgen ab.

Grundsätze der Wikipedia

Von einer Sprachversion wird erwartet, dass sie den Grundsätzen der (ersten, englischsprachigen) Wikipedia entspricht. Eventuelle Regelverstöße werden aber anscheinend nicht geahndet. Die wichtigsten, hier relevanten Grundsätze lauten:

  • Es geht um die Schaffung einer Enzyklopädie, um nichts anderes, also ein Sammelwerk bestimmter Inhalte in einer bestimmten Textsorte.
  • Die Inhalte der Wikipedia (Texte, Bilder usw.) müssen „frei“ sein, das heißt, unter einer „freien Lizenz“ stehen. Traditionelle Enzyklopädien hingegen beanspruchen für ihre Inhalte das Urheberrecht.
  • Das Verbot der „Theoriefindung“ (keine Originalforschung, keine eigenen Forschungsergebnisse) dürfte eigentlich bereits durch den Charakter einer Enzyklopädie gegeben sein.
  • Das gilt auch für den Grundsatz der Neutralität, doch es ist gut, ihn ausdrücklich festgeschrieben zu sehen.

Sprachliche Eingrenzung

Bei der Beantragung einer Sprachversion durch die Wikimedia Foundation ist es wichtig genau einzugrenzen, welche Sprache die neue Sprachversion bedienen soll. Gerade bei Sprachen ohne ausreichende Sprachplanung können durch die Bezeichnung oder genauere Bestimmungen manche Varietäten ein- oder ausgeschlossen werden.

Wikipedia-Gemeinschaft

Israelisches Wikimedia-Treffen, Herzliya 2006

Als Gemeinschaft oder community bezeichnen die Wikipedianer diejenigen, die an der Wikipedia beteiligt sind; man kann auch im Plural sprechen und die Gemeinschaften der einzelnen Sprachversionen bzw. Schwesterprojekte meinen.

Theoretisch könnte man den Eintritt in die Gemeinschaft mit der Registrierung bzw. der Anmeldung gleichsetzen. Damit wären unangemeldete Bearbeiter ausgeschlossen, gerechtfertigterweise, denn die weitaus meisten Unangemeldeten machen nur einige wenige Bearbeitungen. Für die Zugehörigkeit zur Gemeinschaft der Sprachversion ist eine gewisse Regelmäßigkeit der Beteiligung vonnöten, beispielsweise ein mindestens wöchentliches Nachschauen auf der eigenen Benutzerdiskussionsseite. Eine genauere Definition für einen regelmäßigen „Benutzer“ (user, angemeldeter Bearbeiter) steht noch aus. Ein Vorschlag:

  • Jemand, der innerhalb einer Woche mindestens eine Bearbeitung gemacht hat;
  • dessen erste Bearbeitung mindestens sechs Monate zurückliegt;
  • der mindestens zehn Bearbeitungen insgesamt gemacht hat (angelehnt an den „Wikipedianer“ in der Wikimedia-Statistik);
  • und der der betreffenden Sprache überhaupt mächtig ist, ersichtlich an der Bearbeitung, Informationen auf der Benutzerseite oder Diskussionsbeiträgen.

Zu reden ist ferner über die Art der Beteiligung, ob nur Bearbeitungen zählen und wenn ja welche Bearbeitungen, oder ob Aktivitäten außerhalb der Wikipedia mitgemeint sind (zum Beispiel Lobby- und Werbearbeit). Aufgaben von Wikipedianern bzw. Wikimedianern sind:

  • das eigentliche Schreiben von Artikeln,
  • das Korrekturlesen und Verbessern,
  • Formatieren und Einordnen,
  • Bebilderung, durch Suche oder eigenes Fotografieren und schließlich Einfügen in die Artikel,
  • das Schreiben oder Verbessern von Hilfe-Seiten u.ä.,
  • die Betreuung neuer Wikipedianer im Mentorenprogramm und die Beantwortung sonstiger Fragen (Support-Team),
  • das Fördern und die Durchsetzung von "Recht und Ordnung", zum Beispiel durch das Sperren von Vandalen oder mittels des Schiedsgerichtes,
  • die Öffentlichkeitsarbeit im Sinne des Bekanntmachens der Wikipedia, die Beeinflussung der öffentlichen Meinung oder wichtiger Bezugsgruppen,
  • die Anwerbung neuer Wikipedianer,
  • weitere Aktivitäten zur Verbesserung der Wikipedia oder zur Förderung des Freien Wissens.

Am anderen Ende der gedanklichen Kette steht der Austritt aus der Gemeinschaft, wie Tod, Ausschluss (Sperre nach Regelverstößen) oder die Beendigung der Beteiligung aus eigenem Entschluss bzw. wegen einer Änderung der Lebensumstände. Abgesehen von einem ständigen Kern von Bearbeitern dürfte es eine erhebliche Fluktuation in den Wikipedia-Gemeinschaften geben.

Differenzierung der Gemeinschaft

Eine genauere Untersuchung müsste sich generell um die innere Gliederung der Gemeinschaft kümmern. Es gibt eine Hierarchie nach Sonderrechten, die man durch die Anzahl der Bearbeitungen oder durch Wahlen erwirbt.

Das Engagement in einer Sprachversion kann davon abhängen, aus welchen Motiven heraus man mitmacht. Dabei sind folgende Gruppen zu unterscheiden:

  • Wikipedia-Orientierte: Wer die Enzyklopädie als Ganze voranbringen will, wer sich an der Gemeinschaftsbildung beteiligt und auch die weniger angenehmen Tätigkeiten nicht scheut, kann als Wikipedianer im eigentlichen Sinne gelten. Diese Menschen sind das Rückgrat jeder Wikipedia-Gemeinschaft.
  • Themen-Orientierte: Wer ein bestimmtes Thema, enger oder weiter gefasst, in der Wikipedia gut vertreten sehen will, dessen Engagement ist bereits etwas eingegrenzter. Beispiele sind Freunde der Klassischen Altertumskunde oder des bayerischen Brauereisystems. Der Extremfall, im Mentorenprogramm allerdings ein sehr häufiger, ist ein Wikipedianer, der nur einen einzigen, bestimmten Artikel schreiben möchte.
  • Interessen-Orientierte: Wer wegen Motiven mitmacht, die außerhalb der Wikipedia liegen und keinen engeren Bildungsauftrag haben, der betreibt beispielsweise politische Propaganda oder Werbung für ein kommerzielles Unternehmen. Verständlicherweise können hier am ehesten Interessenkonflikte auftreten, da die Wikipedia ausdrücklich keine Werbeplattform sein möchte.
  • Sozial oder sprachlich Orientierte: Manche Wikipedianer engagieren sich in einer Wikipedia-Sprachversion, weil sie bestimmten Menschen etwas Gutes tun möchten. Darum gibt es Deutsche, die an der Swahili-Wikipedia (und nicht der deutschen Sprachversion) mitschreiben, weil sie eben diese Sprachgemeinschaft fördern möchte. Andere Wikipedianer möchten beispielsweise Seh-Behinderten helfen und machen sich dafür stark, dass deren Bedürfnisse berücksichtigt werden (Stichwort „barrierefreies Surfen“). Im Vergleich zu den Interessen-Orientierten hat dieses Motiv durchaus mit der Wikipedia als solcher zu tun, sodass diese Gruppe am meisten den Wikipedia-Orientierten ähnelt.

Natürlich kann ein einzelner Wikipedianer mehrere Motive in sich vereinen. Wikipedianer, die bezahlt bearbeiten, sind danach einzuordnen, wofür sie bezahlt werden.

Im Hinblick auf Sprachversionen, und vor allem kleinere, ist außerdem das Beherrschen der jeweiligen Sprache von großer Bedeutung. Das führt zur Einteilung in Sprachangehörige einerseits und Fremde Helfer andererseits.

Sprachangehörige beherrschen die betreffende Sprache der Sprachversion so gut, dass sie Sätze mit enzyklopädischem Inhalt schreiben, also zum Kerngeschäft der Gemeinschaft beitragen können. Nach Bedarf kann zwischen Mutter-, Zweit- und Fremdsprachlern unterschieden werden.

Bei den Zweit- und Fremdsprachlern ist zu sehen, ob etwa eine bestimmte idealistische Motivlage hinzukommt, wie die Unterstützung einer schwachen Sprachversion. Das macht den Unterschied aus, ob ein in Ostafrika lebender Deutscher besonderes Engagement für die Swahili-Wikipedia zeigt (und damit eine Art Entwicklungshilfe betreibt), oder ob ein in den Niederlanden lebender Deutscher sporadisch in der niederländischen Sprachversion mitschreibt. Die Fremdsprachler sind jedoch grundsätzlich als Sprachangehörige anzusehen, auch wenn sie vielleicht mehr sprachliche Fehler hinterlassen als Mutter- und Zweitsprachler. Sie können auch an Diskussionen teilnehmen.

Die Benutzer GerardM (links) und Siebrand, WCN 2008 in Utrecht

Fremde Helfer hingegen beherrschen die betreffende Sprache nicht oder kaum. Sie tauchen entweder sporadisch auf, um vor allem zum Inhalt beizutragen: So fügen sie Weblinks oder (oft von ihnen selbst gemachte) Fotos hinzu, wofür nicht unbedingt Sprachkenntnisse nötig sind. Oder aber Fremde Helfer sind in einem bestimmten Tätigkeitsbereich aktiv, deretwegen sie in vielen Sprachversionen Spuren hinterlassen. Bekannte Fremde Helfer sind Siebrand mit seinem Siebot, der automatisch Interwiki-Links legt, und Gerard Meijssen, der sich unter anderem mit der Übersetzung von MediaWiki-Anweisungen beschäftigt.

Vergleichbarkeit von Sprachversionen

Erik Zachte auf der WCN in Utrecht, 2008

Für Vergleiche von Wikipedia-Sprachversionen wird meist Erik Zachtes elektronische Statistik herangezogen (hier jeweils mit dem Stand vom Januar 2008, wenn nicht anders angegeben); sie kann als offizielle Statistik der Wikimedia Foundation gelten.

Allerdings ist die Statistik nicht ohne Weiteres zum Vergleichen geeignet. Das liegt zum einen an der allgemeinen Schwierigkeit, aus rein informetrischen Daten Aussagen über den enzyklopädischen Wert eines Textes zu treffen. Außerdem treiben manche Wikipedianer bestimmte Daten über „ihre“ Wikipedia auf künstliche Weise nach oben, vor allem die Artikelanzahl, denn die Artikelanzahl wird meistens für das „Ranking“ zwischen den Sprachversionen benutzt.

Das künstliche Hochtreiben der Artikelanzahl wird durch die so genannten „Bots“ erleichtert. Ein Bot ist ein kleines Computerprogramm, mit dem man Bearbeitungen (edits) an einer Wikipedia automatisch vornehmen lassen kann; ein Bot hilft beispielsweise bei technischen Formatierungen oder der Korrektur von Tippfehlern. Zu den typischen Aufgaben von Bots gehört die Verlinkung der Sprachversionen untereinander, von einem Artikel zu seinem Pendant in einer Sprachversion, wie „Elephant“ in der englischsprachigen Wikipedia mit „Olifant“ in der niederländischsprachigen. Diese Links heißen „Interwikis“. Bots können aber nicht nur sekundäre Aufräumarbeiten erledigen, sondern sogar Artikel erstellen („bot-generated articles“), die schematisch anhand von Datenbank-Informationen aufgebaut sind. Derartige serielle Artikel eignen sich gut für ein Hochjagen der Artikelanzahl.

In der Statistik gibt es eine Stelle, an der man den Bot-Anteil an der Gesamtzahl der Bearbeitungen pro Wikipedia sehen kann. Bei kleinen Wikipedias ist dieser Bot-Anteil übrigens tendenziell recht hoch, oftmals mit vierzig, fünfzig oder weitaus mehr Prozent. Das kann eine Folge der Interwiki-Verlinkung sein. Generell aber fließen die Bot-Änderungen in die einzelnen Statistikteile ein und sind dann nicht von den Bearbeitungen durch menschliche Benutzer zu trennen, das ist ein allgemeines Problem der Wikimedia-Statistik (das Poplar-Bluff-Syndrom, siehe weiter unten).

Artikel

Ein Wikipedia-Artikel ist eine technische Einheit, die sich als solche durchaus gut zählen lässt. Die Artikelanzahl wird als wichtigstes oder alleiniges Rangkriterium verwendet, so listet auch die de.WP Wikipedia-Sprachversionen abgestuft nach Größenordnungen der Artikelanzahl auf.[1] Erik Zachte selbst weist bei seinen Statistik-Seiten darauf hin, dass die Anzahl nicht so bedeutend sei, denn manche Wikipedias hätten nur sehr kurze Artikel, andere Wikipedias hingegen weniger aber längere. Er spricht auch bereits das Problem der „bot generated articles“ an. Darum ordnet er in seiner Liste die Sprachversionen nach der Zahl der internen Links an,[2] was letzteres Problem aber nicht löst, da auch solche Artikel interne Links haben.

Bei den „bot generated articles“ geht es darum, dass manche Wikipedianer Bots schreiben, die automatisch Artikel nach den Informationen aus Datenbanken erstellen. Typischerweise werden dazu Artikel für Gemeinden einzelner Länder oder Landesteile erschaffen. Solche Artikel enthalten sehr schematisch Grundinformationen über die Gemeinde, meistens in einem Satz, und haben eine Infobox. Aufgrund dieser Kürze spricht man auch von „geographical stubs“, obgleich ein „geografischer Stummelartikel“ auch ein von Hand erstellter, durchaus enzyklopädischer Artikel sein kann – wenn auch nur ein recht kurzer.

Außerdem beinhaltet die Idee des Stummels, dass der Artikel ausbaufähig ist und ausgebaut wird. Dies ist für den Ersteller meist ein Vorwand, denn der Ausbau zu einem enzyklopädischen Artikel ist höchstens eine Sache der sehr fernen Zukunft. Die meisten der wenigen Wikipedianer dieser Sprachversionen dürften kaum Lust verspüren, ihre Freizeit in den Ausbau solcher Artikel zu investieren.

„Poplar Bluff“ und die Diskussion über die Volapük-Wikipedia

Eine Abart des geografischen Miniartikels ist ein wesentlich längerer und auf den ersten Blick natürlich wirkender Artikel, der allerdings ebenfalls automatisch per Bot erstellt wurde. Die abermals völlig schematischen Informationen sind in ganze Sätze verarbeitet: „[Name] ist eine Stadt in [County], [Staat]. Seit der Zählung von [Jahr] beträgt die totale Einwohnerzahl [Zahl].“ Dazu gibt es Kapitel mit geografischen oder demografischen Grunddaten. Viele solcher Artikel hat die Wikipedia auf Volapük, einer Plansprache, die weltweit von allenfalls zwei Dutzend Interessierten verstanden wird. Nach dem Artikel Poplar Bluff über eine amerikanische Kleinstadt in Missouri könnte man von Artikeln des „Poplar Bluff“-Typs sprechen.

Geografische Miniartikel und Poplar Bluffs wurden vor allem im Herbst 2007 diskutiert, und zwar auf der projektübergreifenden Wikimedia-Site „Meta-Wiki“. Jemand hatte am 21. September die Schließung der Volapük-Wikipedia gefordert, da ein Volapük-Wikipedianer in jenem Jahr hunderttausend derartige Artikel erstellt hatte. Ein weiterer Antrag, vom 25. Dezember, forderte wenigstens die Beseitigung dieser Art von Artikeln. Beide Male aber stellten sich viele Wikipedianer hinter die Volapük-Wikipedia, darunter auch der plattdeutsche Wikipedianer Slomox, der behauptete, in ihr gäbe es auch viele gute Artikel. Slomox selbst hatte in seiner plattdeutschen Wikipedia geografische Miniartikel und Poplar Bluffs massenweise erstellt.[3] Ähnliches gilt für die Diskutanten Maksim (Esperanto), Chabi (Katalanisch) und Eukesh (Nepalesisch).

Wikipedia-Gründer Jimmy Wales kommentierte am 1. Januar 2008, die vo.WP entspräche nicht dem Wikipedia-Ziel, Menschen das Wissen der Welt in ihrer eigenen Sprache zu bringen. Schließlich gäbe es niemanden, der Volapük fließend spricht. Das Artikelbauen per Bot komme auch nicht dem Ziel von Sprachfreunden entgegen, die Freude am Volapük hätten. Man könne anerkennen, dass die vo.WP nicht Lesern, sondern Schreibern diene. Ein Schließen der Sprachversion würde er nicht begrüßen, aber das Löschen aller „Bot-Artikel“. Jedenfalls solle die vo.WP nicht in der Rangliste der größten Wikipedias erscheinen.[4]

Pseudoartikel und ihre Folgen

Neben geografischen Miniartikeln und Poplar Bluffs gibt es weitere Typen von Artikeln, deren enzyklopädischer Charakter in Frage zu ziehen ist und die im folgenden Pseudoartikel genannt werden:

  • Ein-Satz-Artikel, die eher einem Wörterbuch angemessen erscheinen. Beispiel: „En Leicht iss en Funeral“, der Inhalt des Artikels Leicht in der Pennsilfaanischen Wikipedia (pdc.WP).
  • Weitere Datenbank-artige Einträge. Beispiel: „De 02363 eß de Tellefoon Vüürwaal fun Datteln, en Wëßfal,“ im Artikel 02363 in der ripuarischen Wikipedia (ksh.WP), gemeint sind die Dialekte um Köln. Andere Beispiele sind Serien von kleinen astronomischen Objekten.
  • Artikel in der falschen Sprache. Beispiel: Der Text des Artikels Varsseveld (ein Dorf in den Niederlanden) in der ripuarischen Wikipedia wurde einfach aus der niedersächsischen Wikipedia (nds-nl.WP) kopiert. Gängiger sind, in manchen Wikipedias in Sprachen der Dritten Welt, aus der englischsprachigen Wikipedia kopierte Texte. Diese Artikel wurden wahrscheinlich in der Hoffnung angelegt, jemand werde sie in die betreffende Sprache übersetzen.
Vandalismus-Beispiel in der Wikipedia

Bot-generierte serielle Artikel, ob über geografische oder andere Themen, können in der Aufbauphase einer Wikipedia durchaus sinnvoll sein und den Benutzern eintönige Arbeiten ersparen. Dies trifft vor allem für Gemeinde-Artikel für Gemeinden im betreffenden Sprachgebiet zu. Daher wäre es falsch, voreilig manipulative Absichten zu vermuten. Vor allem massenweise erstellte Artikel, die Gemeinden außerhalb des betreffenden Sprachgebietes behandeln, dürften jedoch allein einem falschen Prestigebedürfnis mancher Wikipedianer entspringen. Die Gefahr von Pseudoartikeln besteht darin, dass sie auf Außenstehende keinen guten Eindruck machen; sie können auch potentielle Autoren abschrecken. Außerdem kostet nicht nur die Erstellung, sondern vor allem auch die Nachsorge Arbeit, wie Aktualisierungen und die Beseitigung von Vandalismusschäden.

„Wirkliche“ Artikel

Artikel mit enzyklopädischem Inhalt und gewissen Mindestanforderungen werden hier „wirkliche“ Artikel genannt. Anhand der Funktion Zufälliger Artikel kann man ein Sample erstellen und den Prozentsatz „wirklicher“ Artikel pro Sprachversion errechnen. Bei einer kleinen Untersuchung durch den Verfasser, mit über fünfzig Sprachversionen, schien es im März/April 2008, dass auf diese Weise die meisten Sprachversionen mindestens zehn Prozent ihrer Artikelanzahl verlieren. Bei großen Wikipedias ist der Anteil der wirklichen Artikel eher hoch, gerade bei kleineren oftmals recht niedrig - im Fall der korsischen Wikipedia lag er gar bei nur zehn Prozent.

Anzahl der Wikipedianer

Für diejenigen Menschen, die Bearbeitungen an der Wikipedia vornehmen, gibt es eine Reihe von Begriffen: Benutzer, Mitarbeiter, Schreiber, Autor, Beiträger. Dabei ist „Benutzer“ oft dem Registrierten vorbehalten, als direkte Übersetzung des englischen user. (Für diejenigen, die die Wikipedia nur lesen, findet man die Begriffe Leser und Nutzer.) Die Wikimedia-Statistik bemüht sich auch, Angaben zur Anzahl der „Wikipedianer“ zu machen. Auch diese Zahlen können sehr irreführen.

„Wikipedianer“ ist nach der Statistik ein angemeldeter Benutzer, der insgesamt mindestens zehn Änderungen in der Sprachversion vorgenommen hat. Ferner gibt es die „aktiven“ Bearbeiter, die mindestens fünf Änderungen pro Monat vorgenommen haben, und die „sehr aktiven“ mit mindestens hundert Änderungen pro Monat. Die Statistik schweigt sich aber auch darüber aus, um was für Änderungen es sich handelt, es können rein technische sein oder gar Vandalismus, die mutwillige Verschlechterung eines Artikels.

Eine weitere Methode, um die mutmaßliche Anzahl der Mitarbeiter einer Sprachversion zu ermitteln, ist das Zählen von Benutzerseiten. Ein registrierter Benutzer kann sich eine Benutzerseite anlegen, auf der er sich und seine Interessensgebiete vorstellt. Viele Benutzerseiten haben eine „Babelliste“, mit der Angabe, welche Sprachen der Benutzer auf jeweils welchem Niveau beherrscht. Das Spektrum lautet: M „Muttersprache“, vier „muttersprachliches Niveau“, drei „sehr gut“, zwei „mittleres Niveau“, eins „Grundkenntnisse“. Dazu kommt das Niveau null, das zunächst verwundert, da man eine Sprache normalerweise nicht angibt, wenn man sie nicht beherrscht. Aber es gibt Wikipedianer, die in einer Sprachversion dennoch registriert sind und eine Benutzerseite haben, weil sie Interwikis anlegen oder andere technische, oft viele Sprachversionen übergreifende Leistungen erbringen.

Das Zählen der Babellisten kann aber ebenfalls nur einen ungefähren Eindruck vom Mitarbeiterstamm geben. Einige Menschen schreiben oft an einer Sprachversion mit, registrieren sich aber nicht oder legen keine Benutzerseite oder keine Babelliste an. Manche sind wenig vertraut mit den Textbausteinen und kennen das System des Sprachniveaus nicht, darum schreiben sie sich unabsichtlich nur Muttersprachen zu. Umgekehrt muss man bei einigen Benutzern feststellen, dass das Anlegen der Babelliste ihr einziger Beitrag zur Sprachversion war.

Die am besten kontrollierbare Methode zur Zählung von Wikipedianern ist der Blick in die „Letzten Änderungen“ und „Benutzerbeiträge“, wo man genau sehen kann, wer welche Bearbeitung gemacht hat. Hier ist allerdings ebenfalls eine Definition eines regelmäßigen Wikipedianers vonnöten.

Seitenaufrufe

Im Jahre 2008 wurden verstärkt Instrumente zum „Verkehr“ auf den Wikimedia-Seiten und sogar einzelnen Artikeln veröffentlicht. Dadurch lassen sich nicht nur Benutzer-Aktivitäten, sondern auch die Leser-Aktivitäten ansatzweise ermitteln. Die gesamte Wikipedia durchbrach im Mai 2008 erstmals die Grenze von zehn Milliarden Seitenaufrufe in jenem Monat. Im September jenes Jahres waren es 10,2 Milliarden, übrigens 399 Millionen pro Tag, 14,1 Millionen pro Stunde, 236.000 pro Minute und 3.900 pro Sekunde. Allein bei der deutschsprachigen Wikipedia gab es in jenem Monat 818 Millionen Aufrufe (an dritter Stelle nach der englischsprachigen und japanischsprachigen) und bei einer relativ kleinen wie der isländischen immerhin noch 1,8 Millionen.[5]

Übrigens sieht man in vielen Wikipedias einen erheblichen Rückgang dieser Klickraten in den Sommermonaten, vor allem im Juli, um etwa zehn Prozent, in einzelnen Sprachversionen auch zwanzig oder mehr als dreißig. Viele Leser der Wikipedia sind Schüler oder auch Berufstätige, die in den Ferien weniger Bedarf an der Online-Enzyklopädie haben.

Wie bei allen anderen Daten ist das Poplar-Bluff-Syndrom (siehe unten) zu berücksichtigen, so hatte die Volapük-Wikipedia im September 2008 2,7 Millionen Seitenaufrufe, obwohl weniger als dreißig Menschen auf der Welt Volapük beherrschen. Fast alle diese Seitenaufrufe scheinen auf neugierige Nicht-Volapükianer zurückzuführen zu sein, die sich den Wikipedia-Artikel zu ihrer Stadt auch in anderen Sprachversionen angeschaut haben. Ähnlich weist die Poplar-Bluff-beladene korsische Wikipedia verdächtig viele Aufrufe auf. Seitenaufrufe müssen also nichts mit dem Interesse von Sprechern der betreffenden Sprachversion zu tun haben.

Poplar-Bluff-Syndrom

Poplar Bluffs und ähnliche Pseudoartikel tragen zu einem Phänomen bei, das weit über die Frage der Artikelanzahl hinausgeht. Nach der massenweise Erstellung von Artikeln kommt es zu weiteren Aktivitäten, die die Statistik beeinflussen und somit schwer interpretierbar machen. Das Phänomen mit seinen Auswirkungen soll hier daher „Poplar-Bluff-Syndrom“ genannt werden, benannt nach jenem Artikel in der Volapük-Wikipedia.

Das Syndrom hat innerhalb einer Wikipedia-Sprachversion zur Folge:

  • Ein oftmals sprunghafter Anstieg der offiziellen Artikelzahlen
  • Je nach Gestaltung der Pseudoartikel auch ein Anstieg weiterer Werte in der Statistik
  • Ein Anstieg der Bearbeitungen, zunächst mit Bot-Bearbeitungen, die Interwiki-Links setzen
  • Längerfristig ein Anstieg der Bearbeitungen durch Menschen, die selbst Interwikis anlegen oder Weblinks oder ihre Fotos aus Commons einsetzen
  • Mehr registrierte Benutzer, auch wenn sie die Sprache nicht sprechen, sondern die zuvor genannten Arbeiten leisten
  • Unerwartet hohe Werte bei den Seitenaufrufen, denn Leser andersprachiger Wikipedias klicken aus Neugierde den Artikel über ihre Stadt auch in anderen Wikipedias an; auch die Such-Bots von Suchmaschinen wie Google tragen zu diesen Werten bei

Außerhalb der betreffenden Sprachversion hat das Syndrom ebenfalls Auswirkungen:

  • Bots legen in anderen Sprachversionen, die entsprechende Artikel haben, Interwiki-Links an
  • Folglich steigt auch dort die Zahl der Bearbeitungen

Allein an der Statistik lässt sich nicht ablesen, ob eine Sprachversion tatsächlich mit enzyklopädischem Inhalt wächst. Sprünge in den Werten, beispielsweise ein massenhafter Anstieg der neuen Artikel von einem Monat zum nächsten, sind meist gute Indizien, aber noch keine Beweise. Ebenso besagt ein hoher Bot-Anteil an den Bearbeitungen insgesamt an sich noch nicht allzu viel.

Das Poplar-Bluff-Syndrom ist nicht statisch, und möglicherweise nimmt es nach einiger Zeit deutlich ab. Zur Abnahme führt einerseits die Tatsache, dass ein einmal angelegter Pseudoartikel nicht ein zweites Mal angelegt werden muss. Außerdem haben die Diskussionen um die Volapük-Wikipedia das Erstellen von Poplar Bluffs und ähnlichen Pseudoartikeln entmutigt. Es lässt sich aber nicht ausschließen, dass neue Gründe auf Dauer das Syndrom aufrecht erhalten.

Vier Klassen

Eine einfache Aufteilung nach runden „wirklichen“ Artikelanzahlen (ohne Pseudoartikel) kann in vier Gruppen erfolgen. Naturgemäß sind die Unterschiede an den runden wirklichen Artikelzahlen nur grob festzumachen. Die bairische Wikipedia muss nicht unbedingt „besser“ sein als die des Scots, weil - in der Untersuchung des Verfassers vom März/April 2008 - die erstere knapp über und die letztere knapp unter der Tausender-Marke lag. Aber es lassen sich im Vergleich mit den absoluten Artikelanzahlen gut die überschätzten, Pseudoartikel-beladenen Wikipedias erkennen. Das betrifft in erster Linie die Wikipedia auf Volapük, aber auch die auf Obersorbisch und Korsisch (und sicher vieler weiterer, die hier nicht näher untersucht wurden).

Diese Aufteilung nach Artikelanzahlen sollte mit weiteren Merkmalen untermauert oder hinterfragt werden. Hier wurde danach gesehen, ob drei Astronomen mit unterschiedlichem Bekanntheitsgrad einen Artikel in der jeweiligen Sprachversion haben, und ob eine Sprachversion die Städte im eigenen Sprachraum besser abdeckt als eine anderssprachige Wikipedia.

Die vier Klassen:

  • Große Wikipedias mit über hunderttausend Artikeln sind beispielsweise die englischsprachige, die deutschsprachige, die schwedischsprachige und die japanischsprachige. Diese Gruppe umfasst Weltsprachen sowie größere europäische Sprachen; in der thematischen Breite deckt eine große Wikipedia das Wissen der Welt umfangreich ab. (Im Sample: en, de, fr, ja, it, pl, es, nl, sv, pt, ru, zh, no.)
  • Mittelgroße Wikipedias mit über zehntausend Artikeln haben unter anderem die Plansprache Esperanto, die kleine europäische Nationalsprache Dänisch, die größere asiatische Nationalsprache Vietnamesisch (eines Schwellenlandes) und das in seiner Sprachlichkeit umstrittene Luxemburgische. Das Spektrum an Sprachenarten ist also wesentlich breiter. Thematisch sind die Lücken größer als bei den großen Wikipedias, bzw. die Themen werden oberflächlicher abgehandelt. (Im Sample: ca, eo, ar, da, id, vi, nn, is, lb, la, eu.)
  • Kleine Wikipedias mit über tausend Artikeln (darunter die Wikipedias des Afrikaans, Swahili und Alemannischen) gibt es auch in kleineren Sprachen der Dritten Welt sowie Dialektgruppen. Eine kleine Wikipedia hat bereits sehr große Probleme, möglichst alle Wissensgebiete zumindest anzureißen. Oftmals ist nur ein Bruchteil der Anweisungen der MediaWiki-Software übersetzt. (Im Sample: af, bn, nds, fy, yi, sw, li, als, io, ksh, nds-nl, vls, ia, bar.)
  • Mikro-Wikipedias mit weniger als tausend Artikeln sind in der Regel kaum entwickelt und mehr oder weniger tot. (Im Sample: sco, fo, hsb, co, pdc, jbo, nov, zea, stq, ang, dsb, rm, tpi, ie, got, ak, vo.)
Groß Mittelgroß Klein Mikro-Wikipedia
Wirkliche Artikel mehr als 100.000 mehr als 10.000 mehr als 1.000 weniger als 1.000
Beispiele en, de, nl, zh ca, id, eo, lb fy, nds, yi, als sco, nov, zea, ang
Anteil wirkliche Artikel (Gruppen­durchschnitt) 82 Prozent 62 Prozent 65 Prozent 25 Prozent
Seitenaufrufe in Mio. (September 2008) 32 bis 1000

(en: 5480)

2 bis 25

(lb: 1)

0,3 bis 2

(nds-nl: 0,25)

0,02 bis 0,3

(fo: 0,43; vo: 2,7)

Übersetzung MediaWiki 90 bis 100 Prozent 60 bis 100 Prozent 2 bis 90 Prozent 2 bis 100 Prozent
Sehr aktive Benutzer pro Monat (laut Zachte-Statistik) 140 bis 1000

(en: 4000)

20 bis 90

(eo: 150)

2 bis 15

(af: 40)

0 bis 8

(vo: 16)

Gründungsjahr 2001/2002 2001–2003 2003–2006

(af: 2001; fy: 2002)

2004–2008

(co, rm, vo: 2003)

Astronomen Newton, Huygens, Ångström Isaak Newton, Huygens, sehr selten Ångström in der Hälfte Newton, selten Huygens sehr selten Newton
Städtevergleich mehr als in anderer Sprachversion manchmal mehr weniger weniger

Tabelle: Vier Klassen der Sprachversionen

Einrichtung einer Sprachversion

Aus Sicht der betroffenden Sprachgemeinschaft bringt eine eigene Wikipedia mittlerweile ein gewisses Prestige mit sich; für das Deutsche oder Französische dürfte das zu vernachlässigen sein, nicht aber für eine wirklich schwache und kleine Sprache wie Korsisch oder Saterfriesisch. Für diese Sprachen ist die Wikipedia oftmals die erste wirkliche Enzyklopädie, die nicht auf das Eigenbezogene begrenzt ist, oder zumindest eine Chance dazu.

Aus Sicht der Wikimedia Foundation stellt sich die Frage, ab wann es sinnvoll ist, eine Sprachversion der Wikipedia (bzw. eines Schwesterprojektes) einzurichten. Auf der wikiübergreifenden Site Meta-Wiki wird lebhaft über entsprechende Anträge diskutiert.[6] Die Politik der Foundation war anfangs unklar. Jimmy Wales schrieb im November 2005, man wolle die Begeisterung von Neulingen hochhalten, aber auch nicht zu viele tote Wikipedias haben. Für „real languages“ wolle er nur ein kleines Zeichen des Interesses von Muttersprachlern oder wenigstens flüssig Sprechenden sehen. Wikipedias in „constructed languages“ (Plansprachen) sowie in Dialekten, die nicht genug verschieden von den Sprachen existierender Wikipedias sind, sollten zwar nicht verboten sein, aber die Hürden müssten hoch genug liegen, um Spaßprojekte zu verhindern und politische Fallen zu umgehen.[7]

Michael Snow verwies in der Wikipedia Signpost auf die vier Wikipedias auf Bosnisch, Kroatisch, Serbisch und Serbokroatisch, bei denen die Frage nach der Einzelsprachlichkeit stark politisiert sei. Wales habe eine Einrichtung jedoch für annehmbar gehalten, wenn eine Wikipedia-Sprachversion dazu dient, eine Sprache mit wenigen Sprechern zu bewahren, wie im Falle der Wikipedia auf Kornisch.[8]

Regeln

Nach den Regeln, die schließlich Ende 2006 erstellt wurden, muss eine für eine Sprachversion vorgeschlagene Sprache

  • einen ISO-Code (der Internationalen Standardisierungsorganisation) haben;
  • so eigenständig sein, dass sie nicht in einer allgemeineren Sprachform existieren kann (lies: Abstand hat);
  • über ausreichend Muttersprachler verfügen, damit eine Gemeinschaft von Wikipedianern und Lesern entstehen kann; für „artificial languages as Esperanto“ wird ein „reasonable degree of recognition“ verlangt, worüber zu diskutieren sein werde;

schließlich muss eine neue Sprachversion sich in einer Testphase bewähren (im „Incubator“) und müssen die Software-Anweisungen übersetzt werden.[9]

Über die Einrichtung einer neuen Wikipedia entscheidet de facto das Sprachenkomitee, das dem Vorstand der Wikimedia Foundation Empfehlungen vorlegt. Dabei berücksichtigt das Komitee nicht nur die Leistungen der Kandidaten im Incubator, sondern auch die Meinung von Sprachwissenschaftlern und anderen Experten.

Die Regeln sollen vor allem praktikabel sein und offensichtlich unseriöse Vorschläge abwehren. Eine Erleichterung für die Foundation ist es, Entscheidungen teilweise an den Kriterien anderer Institutionen – der ISO – festzumachen. Die Regeln von 2006 wirken allerdings auch, dass einige gut funktionierende Wikipedia-Sprachversionen heutzutage nicht mehr eingerichtet werden würden, wie die auf Esperanto („künstliche Sprache“), Latein („alte Sprache“) und Luxemburgisch („Dialekt“).

Praxis und Diskussion

Strittig sind vor allem diejenigen Fälle, in denen eine Sprache mehrere Varietäten hat und sich die Frage stellt, ob eine oder mehrere Wikipedias eingerichtet werden sollen. Ein bekannteres Beispiel des Jahres 2008 ist die Wikipedia auf Ägyptisch, deren Befürworter der Meinung sind, es sei verschieden genug vom Standardarabischen.

Zwei unterschiedliche Grundauffassungen haben sich in den Diskussionen gezeigt. Eine restriktive Politik möchte die Hürden hochlegen und streng prüfen, ob eine Sprachversion eingerichtet werden soll. Eine permissive Politik sieht weniger Probleme darin, wenn relativ viele Sprachversionen neu entstehen.

In bestimmten Fragen wird meist wie folgt argumentiert:

  • Eine oder mehrere Wikipedias
    • Restriktiv: Eine kleine Sprachgemeinschaft hat bereits wenige potentielle Mitmacher. Wenn es mehrere statt einer gemeinsamen Sprachversion gibt, dann verteilen die wenige Wikipedianer sich auf jeweils kleinere Sprachversionen.
    • Permissiv: Die Wikipedianer sollen selbst entscheiden können, in welcher Sprachversion sie aktiv sein wollen. Man werde dann sehen, ob zum Beispiel die ägyptische Wikipedia sich entwickelt oder nicht.
  • Instrument der Sprachplanung
    • Restriktiv: Es ist nicht Aufgabe der Wikipedia, Sprachplanung zu leisten. Erstens besagt das der Grundsatz no original research, zweitens wäre das kaum sinnvoll möglich. Erst muss die Sprache außerhalb der Wikipedia entwickelt werden.
    • Permissiv: Gerade die Wikipedia hat die moralische Pflicht, diesen benachteiligten Sprachen zu helfen.
  • Nutzung des Speicherplatzes
    • Restriktiv: Winzige, kaum funktionierende Wikipedias kosten Speicherplatz ohne jemandem zu dienen, vor allem, wenn massenweise Pseudoartikel erstellt werden.
    • Permissiv: Gerade winzige Wikipedias kosten kaum Speicherplatz, und selbst die aufgeblähte Volapük-Wikipedia macht nur etwa 115 Megabyte aus.
  • Eindruck auf die Außenwelt
    • Restriktiv: Wikipedias in Dialekten oder anderen kaum entwickelten Sprachen machen an sich einen schlechten Eindruck auf potentielle Autoren.
    • Permissiv: Die Auffassungen über bestimmte Sprachen oder Sprachformen muss die Wikimedia-Sprachenpolitik nicht beeinflussen, die Reputation erwächst sowieso aus der englischsprachigen Wikipedia (und anderen großen).

Die Siggener Empfehlungen vom Oktober 2008 stehen der restriktiven Haltung nahe, wenn sie Sprachversionen für nichtstandardisierte Sprachen, Dialektbündel und ausgestorbene Sprachen ablehnen. Argumentiert wurde mit dem künstlichen Kulturdialekt (siehe unten) und dem Fehlen einer Sprachgemeinschaft. Besser sei es, so der Siggener Kreis, zu dokumentierende Texte in das Wikimedia-Wiki Wikisource aufzunehmen.

Arten von Sprachen und das Varietätenproblem

Die Sprachen, die eine Wikipedia-Sprachversion haben, können auf unterschiedliche Weise eingeteilt werden. Am naheliegendsten ist die Berücksichtigung der Sprachfamilie, wie es auch eine Seite auf der Meta-Wiki macht. Für Wikipedistik-Zwecke und die Diskussion über die Einrichtung neuer Sprachversionen werden folgende Gruppen berücksichtigt:

  • Ethnische Sprachen, unter Einschluss von Kreolsprachen: Für viele Wikipedianer, nicht nur aus der anglophonen Welt, handelt es sich dabei um den "Normalfall" einer Sprache. Dass eine ethnische Sprache eine Wikipedia „verdient“, ist meist unumstritten. Ein Streitfall ergibt sich am ehesten bezüglich Sprachen der Dritten Welt, da deren Sprachgemeinschaften kaum dazu in der Lage sind, eine Wikipedia groß zu machen.
  • Dialekte: Seit der Einführung der Regeln von 2006 ist es sehr schwer geworden, eine neue Dialekt-Wikipedia einzurichten. Allerdings gibt es Grenzfälle, in denen strittig ist, was eine Varietät einer Sprache oder eine andere Sprache ist.
  • Plansprachen: Ähnlich wie bei den Dialekten wird bei einer zu permissiven Politik gegenüber Plansprachen befürchtet, eine Flut an Wikipedias einrichten zu müssen. Eine Plansprache kann das Ergebnis eines langweiligen Sonntagnachmittags eines Pubertierenden sein. In der Praxis jedoch haben nur sehr wenige Plansprachenprojekte das Stadium einer Sprache mit Sprachgemeinschaft erreicht.
  • Alte Sprachen: Ausgestorbene Sprachen sollen nach herrschender Meinung keine Wikipedia haben, da keine Sprachgemeinschaft sie schreiben könnte. Darum werden seit Einführung der Regeln von 2006 keine Vorschläge zu einer derartigen Wikipedia mehr angenommen. Deren Befürworter verweisen auf die erfolgreiche Wikipedia auf Latein; diese ist jedoch eine Ausnahme, da es tatsächlich eine neolatinistische Bewegung gibt, die Latein als moderne Fremdsprache fördert.

Neben diesen mehr prinzipiellen Fragen entzünden sich beim Sprachkomitee die längste Debatten um Einzelfälle, in denen es darum geht, ob zwei Sprachformen innerhalb einer gemeinsamen Wikipedia existieren können, oder ob eine neue Wikipedia eingerichtet werden soll.

Verständlichkeit

In Sprachdiskussionen erscheint häufig ein Argument, das auf dem Gedanken der (gegenseitigen) Verständlichkeit beruht. Grundsätzlich ist es immer eine Vereinfachung zu sagen, dass die Sprecher zweier Sprachen - zum Beispiel Niederländisch und Afrikaans - einander verstehen könnten. Dies hängt bereits von der konkreten Person ab, so ist es für einen sprachbegabten und sprachgebildeten Niederländer viel einfacher Afrikaans zu lesen als für einen bildungsfernen. Außerdem kann er Afrikaans zwar verstehen, allerdings nur mit einer gewissen Mühe und dem Risiko, manche Ausdrücke eben doch nicht oder nicht richtig zu verstehen. Dies können gerade solche Ausdrücke sein, die für die Aussage eines Textes entscheidend sind.

Oftmals ist die Verständlichkeit nicht symmetrisch, also nicht völlig gegenseitig. Die Sprecher der „kleineren“ oder ausstrahlungsschwächeren Sprache beherrschen notgedrungen die jeweils “größere” Sprache besser, als dies umgekehrt der Fall ist. Und rein sprachlich haben diejenigen einen Vorteil, aus deren Sicht die jeweils andere Sprache einfacher, zum Beispiel flektionenärmer ist. Ein Niederländer, der Afrikaans liest, muss sich nur an das „Fehlen“ von Formen gewöhnen, ein Afrikaner, der Niederländisch liest, trifft auf die niederländische Formenvielfalt.

Bereits für den (bloßen) Leser der Wikipedia ist es problematisch, mit Texten in einer ungewohnten Variante umzugehen. Ein färöischer Schüler, der an die Grenzen der Wikipedia in seiner eigenen Sprache stößt, kann auf die dänischsprachige oder englischsprachige Wikipedia ausweichen. Dort lernt er aber nicht die typisch färöischen Ausdrucksweisen oder Schreibweisen, was sich in Prüfungssituationen rächen kann. Umso größer sind die Schwierigkeiten für Autoren. Selbst wenn sie die andere Sprache oder Variante gut verstehen, beherrschen sie sie meist nicht aktiv. Das schließt sie vom Schreiben an dieser Sprachversion großteils aus.

Plurizentrische Sprachen

Datei:Sprachvarietäten Deutsch.png
Standardvarietäten des Deutschen

Manche Sprachen haben eine und nur eine Standardvarietät, die von den meisten Sprachangehörigen akzeptiert wird. Ein Beispiel ist Isländisch. Eine plurizentrische Sprache jedoch hat mehr als eine Standardvarietät. Die meisten Sprachen mit vielen Sprechern sind plurizentrisch, wie Englisch, Spanisch und Französisch, aber auch erstaunlich viele kleine. Eine Mehrzahl von Standardvarietäten kommt normalerweise durch politische oder kulturelle Grenzen innerhalb der Sprachgemeinschaft oder durch geografische Distanz zustande.

Deutsch wird zunehmend als plurizentrische Sprache angesehen, obwohl in der Praxis viele Bundesdeutsche einer monozentrischen Sicht anhängen. Demzufolge verzeichnet der Duden typisch österreichische oder schweizerische Ausdrücke als österr. oder schweiz., während typisch bundesdeutsche Ausdrücke ohne Auszeichnung verbleiben. Diese monozentrische Sicht wird durch die überragende Stärke Deutschlands gestützt: Die meisten Österreicher und Schweizer können viele bundesdeutsche Ausdrücke verstehen, allein schon durch das Fernsehen. Umgekehrt kennen die meisten Deutschen kaum Ausdrücke aus Österreich und der Schweiz. Ebenso wird im nichtdeutschsprachigen Ausland, etwa bei Sprachlehrern, das Deutsch der Bundesrepublik bevorzugt. Verständlicherweise hat die monozentrische Sicht weniger Freunde bei den Österreichern und Schweizern, die ihre Standardvarietäten als Dialekte belächelt sehen (und entsprechend korrigiert werden).

Parkverbot in Basel

Nach der plurizentrischen Sicht gibt es (mindestens) drei deutsche Standardvarietäten, Bundesdeutsch, Österreichisches Deutsch und Schweizer Hochdeutsch. Demzufolge heißt der erste Monatsname in der Bundesrepublik Januar, in Österreich Jänner. Beide Ausdrücke sind in ihrem jeweiligen Geltungsbereich hochsprachlich und korrekt, keiner ist an sich „Dialekt“ oder „falsch“. Abgesehen von den Standardvarietäten gibt es in den drei Ländern durchaus auch Dialekte.

Beim Englischen werden in andersprachigen Lehrbüchern vor allem das Amerikanische und das Britische Englisch berücksichtigt. Ferner gibt es eine Vielzahl weiterer Standardvarietäten, wie das Australische oder Neuseeländische Englisch. Amerikanisch hat die kulturelle und wirtschaftliche Ausstrahlung der USA hinter sich, aber aus historischen Gründen behält das Britische Englische – wegen des Empires – noch viel Prestige. Daher ist das Englische eine weniger asymmetrische plurizentrische Sprache als das Deutsche.

In einer Enzyklopädie wie der Wikipedia wird generell nach einem einheitlichen Stil gesucht. Das fördert tendenziell die monozentrische Sicht, doch wenn die Mehrheit der betreffenden Wikipedianer allein die sprecherstärkste Varietät akzeptierte, würde dies zu einer dauerhaften Unzufriedenheit der übrigen Sprecher führen. Der Verlust der Minderheit oder eine Abspaltung wären eine realistische Gefahr.

Arten von Unterschieden

Varietäten einer Sprache können sich auf den folgenden Gebieten bemerkbar machen:

  • Grammatisch: Derartige Unterschiede werden am ehesten als sprachwissenschaftlich relevant gewertet und spielen eine große Rolle in der Frage Sprache oder Dialekt.
  • Syntaktisch: Dies wird als weniger schwerwiegend angesehen als ein grammatischer Unterschied.
  • Ortographisch, bezogen auf einzelne Wörter oder systematische Unterschiede: Erfahrungsgemäß liefern diese Fälle am wenigsten Probleme für das Verständnis oder können gar mit automatischer Konversion behandelt werden. Die de.WP gibt den Schweizern die Möglichkeit, das ß stets als ss anzuzeigen; im Quelltext allerdings bleibt es ß.
  • Lexikalisch, bezogen auf einzelne Wörter, Fachwortschätze oder die Wortbildung: Es haben sich Strategien für den Umgang damit herausgebildet, doch wenn viele Wörter der jeweils anderen Varietät überhaupt nicht verstanden werden, ist eine Spaltung der Sprachversion wahrscheinlich.

Außerdem leben die Sprecher in unterschiedlichen Sprachgemeinschaften. Was in der Schweiz als bekannt vorausgesetzt werden kann, oder was für Schweizer relevant ist, ist es für Bundesdeutsche oder Österreicher nicht unbedingt. Die historischen Entwicklungen und Gesetzgebungen sind verschieden, was in Artikeln inhaltlich berücksichtigt werden muss.

Umgang mit Varietäten

Damit die Wikipedianer einer plurizentrischen Sprache einvernehmlich zusammenarbeiten können, wurden Regeln dafür entwickelt, welche Varietät wann zum Zuge kommt. Die entsprechende Richtlinie in der englischsprachigen Wikipedia empfiehlt, sich an vier Prinzipien zu orientieren:

1. Behalten der vorhandenen Varietät: Ein Artikel wird weitergeschrieben in der Varietät, in der er begonnen wurde, es sei denn, man schreibt den Artikel komplett um.
2. Einheitlichkeit innerhalb eines Artikels.
3. nationaler Bezug eines Themas: Der Artikel über die Queen wird in Britischem Englisch geschrieben, der über den US-Präsidenten in Amerikanischem.
4. Suche nach gemeinsamen (also neutralen) Formen: Beim Artikel "Fixed-wing aircraft" (wörtlich: Luftgefährt mit feststehenden Flügeln) wird einleitend erwähnt, dass man in Nordamerika airplane sagt, sonst aber aeroplane. Mit dem gewundenen Artikelnamen hat man die Kluft zwischen Amerikanischem und Britischen Englisch pragmatisch überbrückt. Die neutrale Bezeichnung wird konsequent im gesamten Artikel verwendet.[10]

Nicht erwähnt wird ein fünftes Prinzip:

5. Das Anbieten mehrerer Formen. In der englischsprachigen Wikipedia ist es üblich, Maßangaben sowohl mit dem metrischen als auch dem „imperialen“ System zu machen. Im Artikel „Elephant“ heißt es zum Beispiel: At birth it is common for an elephant calf to weigh 120 kilograms (260 lb). Es erinnert an eine Strategie im Frühneuhochdeutschen, als man dick ende oft schrieb, in der Hoffnung, dass der Leser zumindest eines der beiden Wörter kennt, dick oder oft (gemeint ist die Bedeutung des modernen oft).

Die ersten beiden Prinzipien kommen der Mehrheit entgegen: In deren Varietät werden wahrscheinlich die meisten Artikel angelegt (1.), und in dieser Varietät muss der Artikel weitergeschrieben werden (2.). Der nationale Bezug hingegen gibt der Minderheit einen sicheren Rückzugsraum (3.), und die Suche nach Gemeinsamkeiten (4.) und das Anbieten mehrerer Formen (5.) führen zu echten Kompromissen, die beiden Seiten Mühe abverlangen.

In der deutschsprachigen Wikipedia sorgt man sich eher um die Unterschiede zwischen alter und neuer Rechtschreibung und weist in diesem Zusammenhang darauf hin, man solle in gut geschriebenen Passagen keine zulässige Schreibweise durch eine andere zulässige Schreibweise ersetzen. Innerhalb eines Artikels folge man den Vorlieben desjenigen Autors, der am Meisten beigetragen hat, und bemühe sich um eine einheitliche Schreibweise. In Artikeln mit Bezug zur Schweiz oder zu Liechtenstein solle kein ß verwendet werden.[11]

Die niederländischsprachige Wikipedia verweist auf die niederländisch-belgische Taalunie als oberste Autorität[12] und empfiehlt, typisch nordniederländische oder belgische Formen in Algemeen Nederlands zu verändern.[13]

Der Schweizer Bundesrat Anfang 2009

Die vier bzw. fünf Prinzipien sind so oder so ähnlich oft in Wikipedia-Sprachversionen wiederzufinden, lösen aber nicht alle Probleme. Das Nebeneinander von Standardvarietäten macht eine empfindliche Einschränkung des Wiki-Prinzips aus, demzufolge theoretisch jeder Leser jeden Artikel verbessern kann. Angenommen, ein bundesdeutscher Wikipedianer liest den Artikel Bundesrat (Schweiz) und findet das Wort Session. Im Sinne der Vermeidung von Fremdwörtern ersetzt er es durch das in Deutschland geläufige Sitzung. Die Ersetzung würde umgehend rückgängig gemacht werden, von Schweizern, die entweder geduldig den Schweizer Sprachgebrauch erläutern oder wutentbrannt die „Arroganz der Deutschen“ anprangern. In Zukunft wird der bundesdeutsche Wikipedianer es sich überlegen, ob er an einen Artikel mit Schweizbezug Hand anlegen will.

Allgemein jedoch begünstigt die Praxis den Bundesdeutschen, denn das Bundesdeutsche gilt unausgesprochen als Standard für Artikel ohne besonderen Bezug zu den Alpenländern. Bei Schweizern und Österreichern geht man davon aus, dass sie das Bundesdeutsche zumindest passiv beherrschen. Zusammen mit den oben genannten fünf Prinzipien folgt daraus, dass in der de.WP ein (modifizierter und moderater) de-facto-Monozentrismus herrscht.

Jene Einschränkung des Wiki-Prinzips verschlimmert sich mit Grad und Art der Unterschiede. In der kurdischen Wikipedia schreiben sowohl die nördlicheren Lateinschriftler als auch die südlicheren Arabischschriftler mit. Zwar gibt es eine automatische Konversion zwischen den Schriftzeichen, diese betrifft aber nur die sichtbare Oberfläche eines Artikels. Beim Schreiben selbst, also der Bearbeitung des Quelltexts, tippt man entweder lateinische oder arabische Zeichen. Das ist schlecht für die Arabisch Schreibenden, die vor allem auf Artikel mit Lateinbuchstaben treffen. Darum hat manches Lemma in der ku.WP zwei Artikel, der zweite wurde meist von den Arabischschreibenden erstellt. Eine solche Doppeltheit von Wikipedia-Artikeln enspricht nicht dem Wikipedia-Konzept und macht eine künftige Spaltung wahrscheinlich.

Dialekte

Dialekte haben zunächst einmal dasselbe Problem wie plurizentrische Sprachen: Es gibt meist keine einheitliche Standardvarietät, die von allen Sprechern anerkannt wird (eine Ausnahme ist etwa das Luxemburgische). Eventuell gibt es sogar gar keine Standardvarietät.

Das Niedersächsische, wie es im Osten der Niederlande gesprochen wird, hat kein einheitliches Wörterbuch. Nur für einzelne Regionen wie die Achterhoek, Twente oder für das Gronings sind Wörterbücher erstellt worden, die aber immer noch vielfältige Unterschiede berücksichtigen müssen. Das Wort „Provinz“, niederländisch provincie, wird in den niedersächsischen Dialekten unterschiedlich ausgesprochen bzw. geschrieben: In den Artikeltexten der nds-nl.WP finden sich provinsie, provinzie, pervinsie, previnsie, previncie, perveensie, der entsprechende Artikel selbst heißt pervincie. Wer einen neuen Artikel anlegen will, muss aufpassen, dass es diesen nicht bereits in einer ähnlichen Schreibweise gibt.

Dialekt-Wikipedias verwenden ähnliche Regeln wie die vier Prinzipien der en.WP. Darüber hinaus sieht man häufig einen Hinweis oberhalb eines Artikels, in welcher Varietät ein Artikel geschrieben ist. Da in den Dialekt-Wikipedias nur jeweils wenige Wikipedianer aktiv sind, kommt es kaum zu Zusammenstößen.

Nah verwandte Sprachen

Ein Plakat aus dem 19. Jahrhundert zum Skandinavismus, dem Zusammengehörigkeitsgefühl der Nordgermanen

Einige Sprachen sind so nah miteinander verwandt, dass sie mehr oder weniger problemlos für den jeweils anderen Sprecher verständlich sind. Es stellt sich dann eventuell die Frage, ob man eine oder mehrere Sprachversionen einrichten soll. Eine bekannte Gruppe nah verwandter Sprachen sind die skandinavischen Sprachen, vor allem das Dänische, Schwedische und das Norwegische (Bokmål), ähnliches gilt für das Serbische und das Kroatische.

Im letzteren Falle gibt es die eine Richtung, die behauptet, Serbisch und Kroatisch seien zwei unterschiedliche Sprachen, die andere findet, es handele sich um zwei Standardvarietäten einer Sprache. Folglich wurde auch eine serbokroatische Wikipedia eingerichtet, und ebenso eine bosnische für die komplizierte Situation in Bosnien.

Mehrmals ist es vorgekommen, dass die Varietäten innerhalb einer Sprachversion sich nicht miteinander vertragen haben, mit der Folge, dass eine neue Sprachversion eingerichtet wurde. Ursprünglich gab es eine einzige norwegische Wikipedia, von der sich schließlich die Nynorsk-Sprecher abgespalten haben. Ebenso gab es eine einzige „niedersächsische“ Wikipedia, aber die Niederländer und Deutschen darin mussten feststellen, dass sie einander nicht gut verstehen konnten. Seit 2006 schreiben die niederländischen Niedersachsen an einer eigenen Sprachversion. Die vielleicht nicht von allen „Niedersachsen“ akzeptierte Interpretation dieser Trennung lautet, dass es sich um die Dialekte zweier unterschiedlicher Dachsprachen handelt.

Sprachliche Unterschiede zwischen Varietäten oder ungenormten Dialekten an sich sind bereits für das Schreiben eine Behinderung: Ein Salzburger hat Schwierigkeiten, einen auf Oberbayerisch begonnenen Artikel weiterzuschreiben. Der entscheidende Trennungsgrund scheint dann vorzuliegen, wenn die Wikipedianer einander auch nicht verstehen können. Allerdings ist nicht eindeutig auszumachen, wann eine gemeinsame Sprachversion möglich ist oder nicht – auch Standardvarietäten von plurizentrischen Sprachen wie Englisch weisen teilweise recht große Unterschiede auf.

Wegen der Existenz zweier oder mehrerer Sprachversionen haben einige Wikipedianer sich besondere Formen der Zusammenarbeit ausgedacht. Bei der Liste der Interwikis, also der Verweise auf den Artikel in anderen Sprachen, kann die verwandte Sprache oben stehen und nicht in der alfabetischen Reihenfolge. Einige skandinavische Wikipedias verweisen auf Lesenswerte Artikel in anderen skandinavischen Sprachversionen. Die Suche in den beiden niedersächsischen Wikipedias liefert auch Resultate in der jeweils anderen Wikipedia.

Sprachplanung durch die Wikipedia?

In diesem Handbuch sind bereits viele Themen angesprochen worden, die die Soziolinguistik nicht zuletzt unter dem Begriff Sprachplanung behandelt. Es gibt mehrere Modelle oder Beschreibungen für den sehr komplexen Prozess einer konkreten Sprachplanung, aber im wesentlichen geht es um die folgenden Schritte:

  • Selektion: Die Gesellschaft (bzw. die Politik) stellt ein Problem fest, wie das Fehlen einer Nationalsprache in einer soeben unabhängig gewordenen Kolonie. Es wird weiter festgestellt, welche Anforderungen die Gesellschaft an die Lösung des Problems hat.
  • Kodifikation (Standardisierung): Eine gewählte Sprachform braucht eine einheitliche Orthographie und Grammatik sowie einen Wortschatz.
  • Einführung (Implementation): Die Sprachform muss den gewünschten Sprechern nahe gebracht werden, vor allem durch das Schulsystem. Langfristig sind die Erfolge und Folgen dieser Maßnahmen für die Gesellschaft zu beobachten.
  • Ausarbeitung: Wichtig sind ferner die Erschaffung einer modernen Terminologie zum Beispiel für technische Bereiche, sowie die Entwicklung der Sprachkultur.

Dieses einfache Modell nach Haugen kann noch beispielsweise bezüglich der Handelnden konkretisiert und erweitert werden.[14] Von Bedeutung ist nicht zuletzt, dass diejenigen, die man zum Erlernen einer neuen Sprachform angehalten hat, in dieser Sprachform auch etwas zu lesen finden.

Das Erschaffen einer neuen Sprachform, einer Standardvarietät stellt Sprachwissenschaftler und Politiker vor ein Grunddilemma:

  • Einerseits zeigt die Erfahrung, dass ein schriftliches Kulturleben unbedingt einer Standardvarietät bedarf. Ohne diese ist das Lesen- und Schreibenlernen schwierig.
  • Andererseits ist es ein gehöriger Eingriff von außen, Menschen, die bislang Dialekte gesprochen haben, eine neue Standardvarietät anzubieten. Kritiker befürchten, dass eine künstliche Hochsprache entsteht, die für die Sprecher eine Fremdsprache darstellt. Dabei besteht das Ziel der Sprachplanung gerade darin, den Menschen zu ermöglichen, "ihre Sprache" zu behalten. Man rechtfertigt etwa die Schaffung einer korsischen Hochsprache damit, dass diese den Sprechern der korsischen Dialekte zumindest näher steht als Französisch.

Über die Haltung zur Sprachplanung gehen in der Sprachwissenschaft und den Sprachgemeinschaften die Auffassungen weit auseinander. Auch innerhalb von Dialekt-Wikipedias wünschen sich einige Wikipedianer die Schaffung einer Hochsprache, teilweise betreiben sie Schritte in diese Richtung. So hat die plattdeutsche Wikipedia (nds.WP) einen Schriftstandard angenommen, der vor allem den Norden des Sprachgebietes abdeckt und nicht allgemein akzeptiert wird.

Wie bereits oben angesprochen, ist es umstritten, ob die Wikipedia ein Instrument zur Sprachplanung sein kann oder auch sein soll. Der Grundsatz Keine Theoriefindung verbietet eigene Forschung. Die eigentliche Sprachplanung müsste also außerhalb der Sprachversion stattfinden, in der Sprachversion dürfen (und sollen) ihre Früchte jedoch angewandt werden. Überhaupt lässt es sich gerade bei kleinen Sprachgemeinschaften kaum vermeiden, dass die Wikipedia Strahlkraft hat, dass Entscheidungen von Wikipedianern für oder gegen ein Lexem oder eine Norm auch außerhalb der Wikipedia Auswirkungen haben. Schließlich ist sie für kleine Sprachen oftmals die einzige Enzyklopädie und das größte Textcorpus im Internet.

Automatische Umwandlung

In einigen Fällen versucht man, Variantenprobleme auf technische Weise zu lösen. Spezialprogramme "konvertieren" dabei von einer Variante zur anderen, so dass der Leser einer Wikipedia-Sprachversion angeben kann, welche Variante er lesen will. In der kurdischsprachigen Wikipedia beispielsweise gibt es oben am Seitenrand zwei Reiter, mit denen man zwischen lateinischen und arabischen Buchstaben wählt; meistens aber dürften es die "Einstellungen" sein, über die man seine Präferenz deutlich machen kann.

Grundproblem

Das Eszett, von niederländischen Deutschlehrern übrigens ringel-s genannt.

Aber solche Automatiken funktionieren nur teilweise, wie man sich leicht am Beispiel des ß verdeutlichen kann. Angemeldete Benutzer können in der deutschsprachigen Wikipedia in ihren Einstellungen angeben, dass ihnen das ß aus dem Quelltext immer als ss angezeigt wird, so wie die Schweizer es wünschen.

Umgekehrt würde eine solche Einstellung natürlich nicht funktionieren: Wenn ein Schweizer in den Quelltext ss schreibt, dann könnte ein Programm nicht unbedingt wissen, ob es die Textstelle den Nichtschweizern als ß oder ss anzeigen soll. Dazu müsste ein Programm nicht nur die deutsche Rechtschreibung beherrschen, sondern auch den Sinn bzw. Weltbezug kennen, also, ob etwa "Masse" (eine große Menge) oder "Maße" (Mehrzahl von Maß) gemeint ist. Daher sollte man auch bei Textverarbeitungsprogrammen die Vorschläge der automatischen Rechtschreibprüfung immer persönlich überprüfen.

Man könnte den Benutzern vorschreiben, dass sie im Quelltext immer so schreiben müssen, dass die Konversion funktioniert. So dürfte dann ein Schweizer ss in "Massnahme" schreiben, er müsste aber durch einen Zusatzcode kenntlich machen, dass es für Nichtschweizer ein ß ist. Dieser Code würde dann etwa so aussehen: Ma{Allgemein: ß/ Schweiz und Liechtenstein: ss}nahme.[15] Das Grundproblem wäre aber nicht gelöst, nämlich dass der Schweizer wissen muss, wann ein ss ein ß ist. Außerdem würde auf diese Weise das Wikipedia-Schreiben für alle Autoren wieder ein Stück komplizierter werden und Neulinge abschrecken.

Verschiedene Alfabete

Das ß-Problem ist eine Lappalie im Vergleich zu den vielfältigen Schwierigkeiten, die man bei der automatischen Transkription zwischen Lateinschrift und arabischen Buchstaben hat. Vor allem die Konversion vom arabisch geschriebenen zum lateinisch geschriebenen Kurdischen sei „not trivial“, sagt der Gründer der kurdischsprachigen Wikipedia. So kennt die arabische Schrift keinen Unterschied von Groß- und Kleinbuchstaben, der Konverter müsste also Eigennamen erkennen, die im Lateinisch-Kurdischen groß geschrieben werden.

Das Arabische selbst kennt normalerweise keine Vokalzeichen; zwar verwendet die arabische Schreibweise des Kurdischen Buchstaben für Vokale, aber nicht für das i. Der Konverter liest also kurdstan und muss wissen, dass die Konsonantenverbindung ds unmöglich ist, das Wort also in der Lateinschrift korrekt kurdistan lautet.

Der gern anonym bleibende Gründer erklärt weiter, dass die Alfabetfrage stark politisiert ist: Die Araber würden den Kurden im Irak die Einführung des Lateinalfabets nie verzeihen, die Kurden in der Türkei würden niemals die arabische Schrift übernehmen. Hinzu kommen noch weitere Aufgliederungen der kurdischen Gesamtsprachgemeinschaft, schließlich sind Kurmandschi mit dem Lateinalfabet und Sorani mit dem arabischen nur die beiden Hauptvarianten. Vielleicht könne die automatische Transkription Probleme mindern, aber die Gefahr einer Spaltung bleibe.

Der Ausdruck "chinesische Schriftzeichen", links traditionell, rechts vereinfacht

Ähnliches berichtet Ting Chen über die chinesischsprachige Wikipedia, die sowohl die traditionelle als auch die vereinfachte Schrift erlaubt. Taiwan, Hongkong und Macao verwenden die traditionelle, die Volksrepublik China und auch Singapur die in den 1960er Jahren entwickelte vereinfachte. Bis 2004 gab es der Spannungen wegen noch Diskussionen über eine Spaltung, bis die automatische Umwandlung kam. Diese Umwandlung wurde immer weiter verfeinert, konnte aber dennoch nicht alle Probleme lösen.

Oftmals wurden mehrere traditionelle Schriftzeichen zu einem einzigen vereinfacht, und es gibt mindestens einen umgekehrten Fall, so Ting Chen. Hinzu kommen unterschiedliche Schreibweisen für Ortsnamen, Personennamen und auch viele Begriffe aus dem Alltag, wie Fahrrad und Computer. Die Unterschiede hingen nicht allein von der Vereinfachung ab, auch zwischen Taiwan und Hongkong mit traditioneller Schrift kommen sie vor. Der amerikanische Ex-Präsident Bush werde in Taiwan 布希 geschrieben, in Hongkong 布须 und in der Volksrepublik 布什.[16]

Begrenzte Möglichkeiten

Computerfachleute unter den Wikimedianern sind oftmals sehr optimistisch, was die Möglichkeiten der Konversion betrifft. Sprachwissenschaftlich Orientierte sowie Praktiker hingegen sind mit den vielfältigen Schwierigkeiten vertraut. Sie bemühen sich dennoch darum, Schritt für Schritt die Automatiken zu verbessern, was einen erheblichen Arbeitsaufwand ausmachen kann.

Letztlich entscheidend dürfte sein, wie die Sprachgemeinschaften bereits mit diesen Problemen umgehen, ob beispielsweise eine dominante Variante von den Minderheiten akzeptiert wird. Die Konversion kommt dann den Minderheiten wenigstens entgegen. Um es mit Debora Wulff-Weber auszudrücken: „Man kann meiner Meinung nach mit Software keine sozialen Probleme lösen!“[17]

Exkurs zum Sprachenmarkt

Die meisten Menschen erlernen eine Sprache, wenn es ihnen wirtschaftlich oder sozial nutzt. Aus diesem Grund ist das Englische die erfolgreichste Fremdsprache, da hinter ihm unter anderem der nordamerikanische Wirtschaftsraum steht. Gelernt werden auch Sprachen, deren Länder man auswandern will, oder die im System der Berechtigungsbildung eine Rolle spielen, wie Latein oder in der DDR Russisch.

Daneben gibt es einen Markt für Sprachen, die aus anderen Interessen heraus gelernt werden. Beispiele:

  • Sprachen von Urlaubsländern
  • Sprachen mit einer als alternativ oder attraktiv empfundenen Kultur: Italienisch als Ausdruck eines (vermeintlichen) Lebensstils des dolce far niente; keltische Sprachen als Zugang zu einer untergegangenen, geheimnisvollen Welt
  • Sprachen, die dem Lerner eine große geistige Leistung abverlangen, wie Japanisch und Chinesisch für Europäer
  • Sprachen, die mit Begriffen wie Internationalität oder Rationalität assoziiert werden, wie Esperanto und andere Plansprachen
  • Sprachen mit Bezug zu der Region, in der man wohnt oder aus der die eigenen Vorfahren stammen, wie Plattdeutsch in Norddeutschland

Auch vermeintlich ethnische Sprachen verdanken ihren Anteil am Sprachenmarkt oftmals solchen Interessen. Der japanische Germanist Goro Christoph Kimura hat das Esperanto dem Kornischen gegenübergestellt. Kornisch, eine "„wiederbelebte“" keltische Sprache im Südwesten Großbritanniens, wird als ethnische Sprache wahrgenommen. Esperanto hingegen bezeichnet man als selbstgewählte Sprache von Freiwilligen, nicht-ethnisch und nicht-territorial.

Tatsächlich aber trifft die letztere Beschreibung auch auf das Kornische zu, schreibt Kimura. Kaum jemand hat Kornisch als Muttersprache gelernt, man erlernt es vielmehr freiwillig als Schüler oder Erwachsener in Kursen. Es ist nicht die Sprache von Cornwall, denn nur 0,1 Prozent der Einwohner sprechen es. Die Hälfte der Teilnehmer von Kornisch-Kursen stammt nicht aus Cornwall, sondern sind aus anderen Regionen Großbritanniens zugezogen. Ferner wird Kornisch auch außerhalb Cornwalls gesprochen und unterichtet. Kimura: „Der erste Sprecher des Kornischen, den ich getroffen habe, war ein US-Amerikaner. Und später hatte ich die Gelegenheit, zwei Tschechen zu gratulieren, die den höchsten Grad eines Kornisch-Examens geschafft haben. Jetzt kann ich einen Kornisch-Sprecher in Japan treffen, der dort arbeitet.“[18]

Bei der Diskussion über neue Wikipedia-Sprachversionen müsst also das ethnische Argument - es werde die Sprache eines Volkes bewahrt - kritisch hinterfragt werden. Im Vordergrund sollte stehen, um welche aktuelle Sprachgemeinschaft es geht, die hinter der Sprachversion stehen soll.

Inhalte

Textspenden

Einige Sprachversionen haben Texte aus gemeinfreien, daher meist bereits älteren Enzyklopädien übernommen. Nicht alle Wikipedianer sehen das gerne, da die Texte dem heutigen Stand des Wissens nicht entsprechen und viel Überarbeitung benötigen.

Übersetzungen

Ebenfalls nicht unumstritten sind Übersetzungen von einer Sprachversion in die andere. In vielen Fällen werden die Lizenzbestimmungen nicht korrekt befolgt, die allerdings in der Form der GFDL mehr als problematisch sind. Wenigstens geben die Übersetzer in der Zusammenfassungszeile oder auf der Diskussionsseite an, dass sie sich am Artikel in einer anderen Sprachversion orientiert haben, damit sie sich nicht mit fremden Federn schmücken.

Ohne Übersetzungen wäre es gerade für kleine Sprachversionen schwierig bis unmöglich, viel und hochwertigen Inhalt zu produzieren. Meist handelt es sich aber nicht um direkte Übersetzungen, sondern um Übertragungen mit − erwünschter −- Anpassung an die Sprachgemeinschaft.

Im Jahre 2010 versuchte Google Inc., in ausgewählten Sprachversionen der Dritten Welt wie Swahili und Bengali Übersetzungen zu unterstützen. Das Eigeninteresse des Unternehmens: In einem bestimmten Software-Tool sollten die Übersetzer Wikipedia-Artikel eins zu eins übersetzen, damit Google Inc. seine entsprechende Datenbank auffüllen konnte. Außerdem lobte man Preise für fleißige Artikelersteller aus.

Die Folge war eine Flut an schlampig übersetzten Artikeln in den Sprachversionen, die für die dortigen Wikipedianer enorme Probleme bereiteten. Teilweise wurden bereits akzeptable, kurze Artikel durch lange, schlechte Versionen ersetzt. Es werde viel Arbeit kosten, klagte Muddyb von der Wikipedia auf Swahili, den Schaden wieder zu beseitigen. Die Übersetzer reagierten auch nicht auf Kontaktversuche.[19]

Computerwissenschaftler Hasan Belayet von der Wikipedia auf Bengali klagte dem Telegraph India über Google Inc.: „Sie haben ein Experiment in der Wikipedia gemacht, und das ist eben kein Platz zum Experimentieren.“ Mit dem Google Translator Toolkit hätten die Übersetzer hunderte von Ortographie-Fehlern in ihren Beiträgen hinterlassen. Er berichtet ähnliches wie Muddyb: „Wir haben sie gebeten, diese Fehler zu beheben, aber unsere Bitten wurden nicht beherzigt. Folglich mussten wir nach einiger Zeit die Artikel beseitigen. Wir haben eine sehr kleine Anzahl von Freiwillligen und wir achten sehr darauf, keine Fehler hineinzulassen.“[20]

Das Eigenbezogene nach Kloss

Kloss hat für die Entwicklung neuer Schriftsprachen wie Friesisch oder Irisch eine „ganz bestimmte Scheidelinie“ ausgemacht, die von diesen meist nicht überschritten werde. Dazu teilt er die möglichen „Entfaltungsmöglichkeiten“ auf in ein Volksschulniveau, ein gehobenes Bildungsniveau und ein Hochschul- und Forscherniveau. Dazu kommen drei „Anwendungsbereiche“: die „eigenbezogenen“ Themen wie Sprache und Lebensraum (Heimatkunde, typische Gewerbe usw.) der betroffenen Sprachgemeinschaft selbst, übrige „kulturkundliche“ Fächer (Geisteswissenschaften einschließlich Recht, Philosophie und Theologie) und drittens Naturwissenschaften und Technik. So erhält er ein Schema mit neun Feldern:

Wissenschaftliches Niveau abgedeckt nicht abgedeckt nicht abgedeckt
Gehobenes Niveau abgedeckt abgedeckt nicht abgedeckt
Volksschulniveau abgedeckt abgedeckt abgedeckt
Eigenbezogenes Kulturkundliches Naturwissenschaften und Technik

Tabelle: Welche Wissensgebiete eine kleine Sprache typischerweise abdeckt

Auf dem niedrigsten Bildungsniveau (Volksschule) werden alle drei Anwendungsbereiche abgehandelt. Bereits auf der gehobenen Ebene ist mit einer nennenswerten Beschäftigung mit naturwissenschaftlichen Themen nicht mehr zu rechnen, und auf der höchsten, wissenschaftlichen Ebene hat nur die Forschung zum Eigenbezogenen ihren Platz.[21] Tatsächlich beschränkt die Universität der Färöer-Inseln sich auf eigenbezogene Themen wie Sprache und Literatur des Färöischen sowie die Lehrerausbildung, ferner gibt es Hochschulen für Fischerei und Seefahrt, also für die Inselbevölkerung wichtige Gewerbe. (Es sei hinzugefügt, dass die obere rechte Ecke – die wissenschaftliche Forschung in Naturwissenschaften und Technik – heutzutage oft nur noch vom Englischen ausgefüllt wird, so wäre es kaum möglich, modernen Flugzeugbau allein auf Deutsch oder Französisch zu studieren.)

Für die Wikipedia bedeutet das, dass von den schwachen oder kleinen Sprachversionen kaum nennenswerte Aktivität in den nicht abgedeckten Feldern zu erwarten ist; die Artikel zu den Naturwissenschaften sind wahrscheinlich relativ kurz und auf einem eher basalen Niveau. Ihren Mehrwert kann eine kleine Wikipedia allenfalls auf dem Gebiet der eigenbezogenen Themen erlangen. Die Sprachversion widerspiegelt in etwa das Angebot der jeweiligen öffentlichen und Fachbibliotheken eines Landes.

Wikipedianer zum Eigenbezogenen

Auf die Frage, ob sie sich auf Themen der eigene Region und Kultur konzentrieren, also auf das Eigenbezogene nach Kloss, lauteten die Antworten der meisten Befragten, dass es eine solche Tendenz durchaus gebe. Die Menschen seien vor allem durch den Stolz auf den eigenen Dialekt motiviert und wollten etwas über und in ihrem Dialekt schreiben, so Servien von der Wikipedia auf Niedersächsisch.[22] In anderen Wikipedia-Sprachversionen oder allgemein finde man ja auch wenig zu luxemburgischen Themen, meinte Benutzer Tom von der lb.WP. Aber auch andere Themen wie die Alpen oder Isaak Newton würden behandelt werden, fast immer in Form einer Übersetzung, am ehesten aus dem Deutschen, aber auch aus dem Englischen, Französischen oder Niederländischen. Tom selbst übersetze manchmal aus der nl.WP, da die Artikel dort weniger ausschweifend seien als die in der de.WP.[23]

Die Wikipedianer der Dialekt-Wikipedias (und anderer kleiner Wikipedias) haben persönlich manchmal andere Interessen als das Eigenbezogene. Wenn jemand sich für die Geschichte der Astronomie interessiert und viele Artikel über bedeutende Astronomen aus dem Deutschen ins Luxemburgische übersetzt, ist die Bereicherung durch hochwertige Artikel durchaus zu begrüßen. Auf diese Weise lässt sich aber kein Mehrwert der lb.WP gegenüber der de.WP begründen. Die sechs Felder bei Kloss, die von einer kleinen Kultursprache belegt werden, schließen auch naturwissenschaftliche Themen auf Volksschul-Niveau mit ein. Dementsprechend wäre in der lb.WP ein ausführlicher und gut geschriebener Artikel „Astronomie“ sinnvoll, dazu einige Dutzend Artikel zu Unterthemen wie Planeten. Eine Serie über 162 Astronomen wie Carl Gustav Witt, James Bradley und Cornelis Johannes van Houten erscheint jedoch, so betrachtet, übertrieben. Gerade der autochthone Luxemburger kann sich über diese Forscher leicht mithilfe der de.WP informieren; für die lb.WP würden sich vor allem luxemburgische Persönlichkeiten lohnen, die in der de.WP eventuell nicht die Relevanzkriterien erfüllen.

Viele Dialekt-Wikipedianer betonen, dass sie bewusst den Rahmen des Eigenbezogenen überschreiten wollen. „Die Mitarbeit aller mir bekannten Mitarbeiter nährt sich vor allem aus Identifizierung mit der Sprache, nicht aus Identifizierung mit der eigenen Region“,[24] erklärt Slomox von der nds.WP. Sicher schreiben die Autoren als Erstes über Orte der eigenen Region, wenn sie über Orte schreiben, heißt es bei Mucalexx. Doch die bairische Wikipedia habe sich das Ziel gegeben, eben nicht regionallastig zu sein.[25] Wer wie Slomox in der eigenen Dialektgruppe bereits eine Standardsprache sieht oder wie Mucalexx eine Entwicklung zu einer Standardsprache begrüßen würde, der möchte auch beweisen, dass sich alles in dieser Sprache beschreiben lässt.

Neben persönlichen Themeninteressen und Vollständigkeitsanspruch gibt es ein drittes Motiv, die Kräfte der kleinen Wikipedia-Gemeinschaft nicht auf das Eigenbezogene zu beschränken. Mit automatisch erstellten Pseudoartikeln lässt sich die offizielle Artikelanzahl leicht in die Höhe treiben. Da spätestens seit dem Fall Volapük ein Problembewusstsein für diese Vorgehensweise entstanden ist, dürfte der so erzielte Prestigegewinn in der internationalen Wikipedia-Gemeinschaft mittlerweile fraglich sein. Auch auf die einheimischen Leser macht es keinen guten Eindruck, wenn sie in „ihrer“ Wikipedia fast nur uninteressante Pseudoartikel finden.

Außerhalb der Wikipedia

Vereinsbildung

Veranstaltung der niederländischen Wikimedia-Organisation

In einer Reihe von Ländern haben sich seit 2004 nationale Wikimedia-Organisationen gegründet, die so genannten chapters. Anscheinend hat die Gründung einer WM-Organisation keinen spürbaren Einfluss auf die Wikimedia-Statistik, wirbt an sich noch keine neuen Wikipedianer. Die meisten Organisationen sind relativ klein, selbst die größte, die deutsche, hat weniger als fünfhundert Mitglieder (2008).

Da die Organisationen klein sind, fehlt bislang meist eine innere Differenzierung nach Sprachversionen. Normalerweise steht für eine Organisation eine Sprachversion zentral. Beispielsweise in der Vereniging Wikimedia Nederland spricht man vor allem über die niederländischsprachige Wikipedia, obwohl auch der eine oder andere Friese Mitglied ist. Soweit bekannt gibt es auch keine offiziellen Beauftragten für die Sprachversionen von Minderheiten oder von Dialektgruppen. Allenfalls die Schweizer Organisation listet auf ihrer Web Site ausdrücklich Ansprechpartner mit den drei großen Landessprachen auf, so wie dies bei schweizerischen Vereinen üblich ist.

Die Wikimedia Foundation schließt Verträge zur Zusammenarbeit mit Organisationen in staatlichen Grenzen ab. Eventuell beschäftigen sich mehrere nationale Vereine mit einer Sprachversion, so sind die Mitglieder der britischen und der australischen Organisation hauptsächlich Autoren der englischsprachigen Wikipedia. Für Sprachen mit einer weit verstreut lebenden Sprachgemeinschaft ist dies jedoch keine Lösung, wie zum Beispiel für das Esperanto, das Latein und das Jiddische. Das gilt auch für Sprachversionen, die hauptsächlich von Exilanten oder Entwicklungshelfern getragen werden wie Kurdisch und Swahili.

Kontakte zu anderen Institutionen

Nicht nur Wikipedianer beschäftigen sich mit Sprachen, sondern auch zahlreiche Institute, Sprachakademien und Vereine. Für eine starke Sprache wie das Deutsche sind solche Kontakte nützlich, aber nicht unbedingt notwendig: Deutsche haben ihre Standardsprache bereits in der Schule gelernt, viele darüber hinaus eine tertiäre Ausbildung genossen. Es gibt relativ viele Deutsche, die die sprachlichen, technischen und sozialen Voraussetzungen mitbringen, um an der Wikipedia mitzuarbeiten. Gerade schwache Sprachversionen sollten jedoch nach Unterstützung suchen.

Viele vom Verfasser befragten Aktivisten antworteten, dass sie Kontakt mit Institutionen knüpfen wollten, dies aber nicht in einer Zusammenarbeit mündete. Genauer bestand die Reaktion der Institutionen aus Desinteresse oder aber einem Unvermögen, zur Wikipedia beizutragen. Hintergrund dürfte teilweise die Generationenfrage sein: Viele Mitarbeiter der Institutionen sind eher älter und nicht internetaffin. Andererseits haben die Wikipedianer möglicherweise noch nicht deutlich genug herausgearbeitet, wie eine sinnvolle Zusammenarbeit aussehen könnte.

Große Fortschritte haben auf diesem Terrain die Esperanto- und die Latein-Wikipedianer gemacht, die nicht nur mit den jeweiligen Sprachbewegungen Kontakte haben, sondern persönlich ihnen meist angehören.

Von den befragten Dialekt-Wikipedianern hat nur ein einziger geantwortet, er sei Mitglied in einem Verein mit Bezug zum Dialekt: Lou Gruber ist Mitglied des Bayerischen Landesvereins für Heimatpflege, wo der Kontakt „freundlich und unaufgeregt“ sei, auch vom Verband Österreichische DialektautorInnen (ÖDA) käme keine unsachliche Kritik. Der Förderverein Bairische Sprache und Dialekte hingegen mache sich über die Versuche der Wikipedia, Bairisch zu verschriftlichen, lustig, obwohl der sich selbst schwer mit schriftlichem Bairisch tue, wie man an der Homepage sehen könne.[26] Der Förderverein erwähnt die Wikipedia zwar unter seinen Links auf der Web Site,[27] doch der Vorsitzende in Österreich meinte, er sähe in der bar.WP eher einen „folkloristischen bzw. humoristischen Beitrag“, mit Unterhaltungs-, nicht Informationswert.[28]

Institut für Niederdeutsche Sprache im Schnoor (Bremen)

Manchmal suchen einige niedersächsische Wikipedianer Rat bei der Stiftung Streektaal-Organisatie in het Nedersaksisch Taalgebied oder der IJsselacademie;[29] manchmal fragen einzelne Wikipedianer, ob sie einen Text übernehmen dürfen, und im März 2008 wurde ein Pressebericht über zwei Jahre nds-nl.WP an die Medien und niedersächsische Organisationen verschickt;[30] manchmal erscheint etwas über die Wikipedia im Internet-Magazin An de Liende.[31] Dies sieht im Vergleich zu anderen Dialekt-Wikipedias bereits nach viel aus. Der Baier Manuel E. möchte gar keine Kontakte mit den Mundartvereinen, die seiner Meinung nach wenig innovativ-fortschrittlich seien;[32] Libellulia wendet sich gegen „Bayerntümelei“.[33]

Ähnlich wie die bairischen Dialekt-Wikipedianer haben auch die plattdeutschen kaum Kontakte zu Sprachinstitutionen, obwohl es Versuche in der Richtung gegeben hat. Vielleicht ist das erklärlich durch die Haltung, die ein Mitarbeiter des Instituts Niederdeutsche Sprache (Bremen) erkennen lässt. Der Philologe und Kulturwissenschaftler Ulf-Thomas Lesle hat eine sehr negative Einstellung zu dem, was er „identitätsproduktive 'Selbsterfindung'“ von Nutzern kleiner Sprachformen im Internet nennt. Das sei das „krasse Gegenbild einer universalen aufgeklärten Moderne“, denn die plattdeutschen Varietäten würden seit zwei, drei Generationen kaum noch im Alltag gesprochen. Eine Parallelgesellschaft in der virtuellen Welt des 21. Jahrhunderts entdecke „das ethnische Potential des vorgeblich sprachlich Eigenen“, was in der ersten Hälfte des 20. Jahrhunderts die imaginierte „völkisch vorbildliche Art“ gewesen sei. „Was könnten angesichts dieses Neuen, das weithin den Mustern des Alten folgt, 'sinnvolle Ziele einer nds.Wikipedia' sein?“[34]

Ganz anders antwortete hingegen Hans-Hinrich Kahrs, ein Mitglied des Rates für Niederdeutsche Sprache. Er ist Plattdeutsch-Schriftsteller und kümmert sich beim Landschaftsverband Stade um niederdeutsche Angelegenheiten. Er arbeite an einer plattdeutschen Landeskunde mit und schaue oft in die nds.WP: „Mi dücht, dor sünd gode Bidrääg in.“[35] In den Sprachinstitutionen und -verbänden gibt es also durchaus unterschiedliche Haltungen, von denen die einen der Wikipedia mehr, die anderen weniger entgegenkommen.

Belege

  1. Wikimedia-Statistik, zuletzt gesehen am 30. März 2008.
  2. Wikimedia-Statistik, zuletzt gesehen am 17. Oktober 2008 (Zitat unterhalb der Tabelle).
  3. meta:Proposals for closing projects/Closure of Volapük Wikipedia, zuletzt gesehen am 15. Mai 2008. Auf der nds.WP hatte Slomox im Januar 2007 die Artikelerstellung per Bot angekündigt und keinen Widerspruch erhalten.
  4. Proposals for closing projects/Closure of Volapük Wikipedia, zuletzt gesehen am 15. Mai 2008.
  5. Siehe Wikimedia-Statistik, zuletzt gesehen am 22. November 2008.
  6. Requests for new languages, zuletzt gesehen am 30. März 2008.
  7. Foundation-l, November 2005, zuletzt gesehen am 18. April 2008.
  8. Signpost 2005-11-28, zuletzt gesehen am 18. April 2008.
  9. Language proposal policy, zuletzt gesehen am 30. März 2008.
  10. Wikipedia:Manual of Style#National varieties of English, zuletzt gesehen am 13. Mai 2008.
  11. Wikipedia:Rechtschreibung, zuletzt gesehen am 13. Mai 2008.
  12. Help:Spellingsgids, zuletzt gesehen am 13. Mai 2008.
  13. Wikipedia:Belgisch-Nederlands, und Wikipedia:Nederlands-Nederlands, zuletzt gesehen am 13. Mai 2008.
  14. Siehe Robert B. Kaplan / Richard B. Baldauf: Language Planning from Practice to Theory, Multilingual Matters, Clevedon u.a. 1997, S. 29.
  15. Nach dem Vorbild eines Beispiels von Milos Ranic in [Foundation-l] Frustration with the conversion engines issue, 1. April 2009.
  16. Schriftliche Mitteilung von Ting Chen an den Verfasser, 16. Oktober 2008.
  17. Chat-Interview, zuletzt gesehen am 3. April 2009.
  18. Goro Christoph Kimura: La kornvala kaj Esperanto – Entreprenoj similaj? In: Detlev Blanke, Ulrich Lins (Hrsg.): La arto labori kune. Festschrift für Humphrey Tonkin. Rotterdam 2010, S. 171-179. .
  19. Blog von Muddyb, Beitrag vom 16. Juli 2010, Abruf am 7. September 2010.
  20. The Telegraph India vom 14. Juli 2010, Abruf am 7. September 2010.
  21. Nach Heinz Kloss: Die Entwicklung neuer germanischer Kultursprachen seit 1800. 2. Auflage, Schwann: Düsseldorf, 1978, S. 47-49.
  22. Schriftliche Mitteilung von Servien an ZvD, 22. April 2008.
  23. Schriftliche Mitteilung von Tom an ZvD, 18. April 2008.
  24. Schriftliche Mitteilung von Slomox an ZvD, 15. Mai 2008.
  25. Schriftliche Mitteilung von Mucalexx an ZvD, 16. April 2008.
  26. Schriftliche Mitteilung von Lou Gruber an ZvD, 20. April 2008.
  27. Raamadama, zuletzt gesehen am 22. Mai 2008.
  28. Schriftliche Mitteilung von Heinz-Dieter Pohl an ZvD, 23. Mai 2008.
  29. Schriftliche Mitteilung von Woolters an ZvD, 12. April 2008.
  30. Schriftliche Mitteilung von Ni'jluuseger an ZvD, 10. April 2008.
  31. Schriftliche Mitteilung von Servien an ZvD, 22. April 2008.
  32. Schriftliche Mitteilung von Manuel E. an ZvD, 14. April 2008.
  33. Schriftliche Mitteilung von Libellulia an ZvD, 18. April 2008.
  34. Schriftliche Mitteilung von Ulf-Thomas Lesle an ZvD, 15. Mai 2008.
  35. Schriftliche Mitteilung von Hans-Hinrich Kahrs an ZvD, 21. Mai 2008.