Mein Lieblingsspielzeug aus dem Labor: Der Books Ngram Viewer

21. Februar 2011 | Montag, Februar 21, 2011

Labels:

Schon immer haben mich Bücher fasziniert und diese Faszination konnte sich sogar über mein lange über die Regelstudienzeit hinausgehendes Philosophiestudium hinüberretten. Kein Wunder also, dass ich Google Bücher für eines der großartigsten Projekte unserer Zeit halte. Es ermöglicht uns den demokratischen Zugang zu Texten, die ansonsten oft unerreichbar blieben oder sogar verloren gehen würden. Was die Digitalisierung der mehr als 15 Millionen Bücher außerdem mit sich bringt, ist die Volltextsuche, mit der man einen digitalen Text komplett nach beliebigen Wörtern durchsuchen kann. Eine Funktion, die ich als Student in Zeiten der aufwendigen Fernleihe sehnlichst vermisste. Mit der praktischen Volltextsuche hätte ich meinen Abschluss sicher schneller geschafft.

Eine Entwicklung aus den Google Labs macht sich die Volltextsuche auf ganz spannende Weise zu nutze: Der Books Ngram Viewer greift auf einen Corpus von 500 Milliarden Wörtern aus 5,2 Millionen Büchern in Chinesisch, Englisch, Französisch, Deutsch, Russisch und Spanisch zu. Insbesondere Universitäten wie zum Beispiel die Harvard University zeigen sich begeistert von der größten jemals zur Verfügung gestellten geisteswissenschaftlichen Datenmenge. Übrigens kann jeder die Datensätze hier frei herunterladen. Die Forscher nutzen sie, um beispielsweise die Entwicklung der Grammatik, das Aufkommen von Technologien oder auch das Auftreten von Berühmtheiten auf der Weltbühne zu untersuchen.

Rund 72 Prozent der Texte sind in Englisch, aber selbst der deutsche Datensatz gibt eine Menge her. Ich habe gestaunt, als ich Helmut Schmidt, Helmut Kohl, Erich Honecker und Willy Brandt zwischen 1950 und 2008 verglichen habe. Honecker ist zwischen 1975 und 1990 der meistgenannte Name, wohl ein typischer Fall von Personenkult. Helmut Kohls Graph hat Mitte der 90er Jahre einen starken Ausschlag, als er - noch im Amt - bereits als Kanzler der Einheit in die Geschichtsbücher einging. Willy Brandt scheint jedoch dauerhaft eine für die Literatur interessante Persönlichkeit zu sein. Vielsagend ist auch der Vergleich zwischen Freud, Darwin, Galileo und Einstein. Wer hätte gedacht, dass Freud seit Anfang des letzten Jahrhunderts so sehr unser kulturelles (Unter-)Bewusstsein dominiert?

Beispiel Google Books Ngram Viewer Melancholie Depression

Auf meinem privaten Blog schreibe ich über Psychologie und Philosophie und stieß dabei auf ein Phänomen, das sich in den Graphen oben wunderbar ablesen lässt: Der Begriff Melancholie war vor dem 20. Jahrhundert populär, um zu beschreiben, was wir heute Depression nennen. Um 1905 schlug der Schweizer Psychiater Adolf Meyer in den USA vor, den Begriff Melancholie fallen zu lassen und dafür den neutraleren Begriff Depression zu verwenden. Und tatsächlich kreuzen sich die Graphen kurz darauf und der Begriff Depression setzt sich endgültig durch. Der dramatische Anstieg der Verwendung ab dem Ende der 20er Jahre bis zur Normalisierung 1940 dürfte jedoch der großen wirtschaftlichen Depression in den USA (1929–1941) geschuldet sein.

Stellt eure eigenen Untersuchungen an. Noch nie war es so leicht, Zugang zu solchen Daten zu bekommen und sie auch noch per Mausklick auszuwerten. Gerne hören wir hier im Forum von euch, was ihr herausgefunden habt. Viel Spaß beim Recherchieren!