20 Dez

Literaturkurven

Von Felix Lüttge

Im letzten Jahr erschien bei Suhrkamp ein kleines Buch des Literaturwissenschaflters Franco Moretti. In Kurven, Karten, Stammbäume. Abstrakte Modelle für die Literaturgeschichte fordert er eine Literaturgeschichte, die nicht einzelne Werke in den Blick nimmt, sondern »die reale Vielfalt an literarischen Texten bewußt reduziert [...] und auf einer abstrakteren Ebene verhandelt«. Moretti nennt das Distant Reading und will die Literaturgeschichte methodisch und inhaltlich an die Sozialgeschichte annähern.

Als Moretti an seinem Buch schrieb (die amerikanische Originalausgabe erschien 2005), wusste er vermutlich noch gar nicht, was zeitgleich in den Google Labs ausgeheckt wurde. Eher nebenbei nämlich stellten die Entwickler letzte Woche Google ngram vor. Seit 2004 hat Google ohne viel Aufhebens (und ohne Ankündigung einer neuen Literaturgeschichte) rund 15,2 Millionen Bücher digitalisiert, schätzungsweise zehn Prozent aller je veröffentlichten Bücher. Auf 5 Millionen dieser Bücher basiert ngram: Das Programm durchsucht die 500 Milliarden Wörter der auf Englisch, Chinesisch, Spanisch, Französisch, Russisch und Deutsch verfassten Bücher und stellt die Häufigkeit ihres Vorkommens in einem Graph dar. Suchen können natürlich auch die User. Und das Beste: Google stellt Rohdaten zur Verfügung, mit denen Bastler ihr eigenes Experiment starten können.

Auf einen Blick lässt sich nun sehen, wie oft beispielsweise die Wörter ›Gold‹ (rot), ›Berlin‹ (blau) und ›Literatur‹ (grün) in deutschen Büchern zwischen 1708 und 2008 auftauchten:

Für eine vergrößerte Ansicht bitte auf das Bild klicken.

Professoren aus Harvard haben natürlich auch schon sozialhistorisch relevantere Wörter untersucht, Franco Moretti dürfte zufrieden sein.

Verwandte Artikel:

Kommentarfunktion ist deaktiviert