Historische Statistik: Was ist das?

1 Nov

Version 1.1 – 14.09.2017


Die Historische Statistik als Disziplin befasst sich auf quellenkritischer Basis mit der systematischen Erfassung, Bearbeitung, Aufbereitung, Darstellung und Interpretation gesellschaftlicher und ökosozialer Tatbestände in ihrer historischen Dimension in Form von Maßzahlen und Mengenangaben zur Gewinnung von Einsichten in historische Strukturen und Entwicklungen.


Wenn man „die Statistik“ als eine Methodenwissenschaft auffasst, deren Hauptziel ein Erkenntisgewinn über Massenerscheinungen ist, steht die Beschreibung von Massenerscheinungen sicher an erster Stelle. Ob es sich hierbei lediglich um einen Zwischenschritt oder bereits um das Endziel handelt, kann durchaus als prinzipielle, fachunabhängige Frage gestellt werden. So war etwa G. Y. Yule, einer der profundesten Statistiker der Moderne, dem wir zahlreiche methodologische Konzepte verdanken, der Ansicht:

„The initial problem of the statistician is simply the description of the data presented; to tell us what the data themselves show. To this initial problem the function of sampling theory is in general entirely secondary or ancillary; to inform the investigator as to the limits within which his descriptive measures can be trusted, so far as fluctuations of simple sampling alone are concerned.“

Unabhängig von den konkreten Erkenntniszielen einer Fachwissenschaft existiert hinsichtlich der Methoden eine allgemeine Basis der Statistik.1 Zwar hat sich die Statistik im Laufe der Zeit immer wieder durch Anstöße aufgrund fachspezifischer Probleme weiterentwickelt, doch haben diese Anstöße bis heute nur in geringem Umfang zu „fachspezifischen Statistiken“ geführt. Vielmehr wurden solche Anstöße in ein allgemeines Lehrgebäude der Statistik eingebaut und hatten, davon ausgehend, Rückwirkungen in andere Wissenschaften. Die in der Biologie und Agrarwissenschaft entwickelten Konzepte bilden weitgehend auch die logischen Grundlagen für die derzeitige Anwendung der Statistik in den Wirtschafts- und Sozialwissenschaften.

Für eine Historische Statistik, wie sie hier vertreten wird, sind neben den Methoden zur Beschreibung die Inhalte von zentraler Bedeutung. Das ist die zweite Bedeutung des Begriffes „Statistik“: eine mehr oder weniger systematische Sammlung von Maßzahlen. Wir verstehen Historische Statistik hier nicht wie z.B. Kersten Krüger2 als einen Kanon statistischer Methoden, angewendet auf historische Daten zur Untersuchung historischer Thematiken, sondern vorrangig als Zusammenstellung verstreut vorliegender Daten in thematisch spezifische oder allgemeine Kompendien. Da diese Daten aber so gut wie nie bereits in einer für wissenschaftliche Erkenntnisziele geeigneten Form vorliegen, sie vielmehr erst von Wissenschaftlerinnen und Wissenschaftlern in diese Form gebracht werden müssen, dabei auch eigene – substanzwissenschaftliche Fragestellungen diese Zusammenstellungen beeinflussen, wird obige Definition vorgeschlagen.


Beispiele einer so verstandenen Ausrichtung wären

für eine quellenkritische Bewertung spezifischer Quellen:

  • Frank Hoffmann (2012), „Ein den thatsächlichen Verhältnissen entsprechendes Bild nicht zu gewinnen“
    Quellenkritische Untersuchungen zur preußischen Gewerbestatistik zwischen Wiener Kongress und Reichsgründung (= Studien zur Gewerbe- und Handelsgeschichte der vorindustriellen Zeit 32), Stuttgart: Steiner 2012.
  • Thomas Rahlf (1996), Getreide in der Sozial- und Wirtschaftsgeschichte vom 16. bis 18. Jahrhundert. Das Beispiel Köln im regionalen Vergleich (= Kleine Schriften zur Geschichte und Landeskunde 3), Trier: Auenthal.

für die Datenaufbereitung und Interpretation:

  • bei aller Kritik von Einzelaspekten insgesamt immer noch ohne Nachfolge: Walther G. Hoffmann (unter Mitarb. von Franz Grumbach und Helmut Hesse) (1965), Das Wachstum der Deutschen Wirtschaft seit der Mitte des 19. Jahrhunderts, Berlin [u.a.] : Springer.
  • Die Statistischen Arbeitsbücher zur neueren deutschen Geschichte
  • Angus Maddison (2010), The world economy. Volume 1: A millennial perspective, Volume 2: Historical statistics, Paris: OECD Publications. [online]
  • Jan Luiten Van Zanden / Joerg Baten / Marco Mira D’ercole / Auke Rijpma / Conal Smith / Marcel Timmer (Hg.) (2014), How Was Life? Global Well-Being Since 1820, Paris: OECD Publications. [online]
  • Thomas Rahlf (Hg.) (2015), Deutschland in Daten. Zeitreihen zur Historischen Statistik, Bonn: Bundeszentrale für politische Bildung. [online]
  • Ashkan Ashkpour / Albert Meroño-Peñuela / Kees Mandemakers (2015), The Aggregate Dutch Historical Censuses. Harmonization and RDF, in: Historical Methods: A Journal of Quantitative and Interdisciplinary History 48/4, S. 230-245.

für die visuelle Präsentation:

Voraussetzungen für eine solcherart verstandene Historischen Statistik bilden die 25 Bände des ehemaligen Schwerpunktprogramms zur Historischen Statistik, internationale Kompilationen3, Jubiläumsbände der amtlichen Statistik4 sowie diskurs- oder institutionenhistorische Untersuchungen zur Entwicklung der statistischen Verwaltung.5

Die Historische Statistik bildet die Grundlage für fortgeschrittene Analysen im Rahmen der quantitativen Geschichtswissenschaft (insbesondere der Wirtschaftsgeschichte), der historisch interessierten Makroökonomie oder der soziologischen Indikatorenforschung.

Aufgabe einer Historischen Statistik ist darüber hinaus auch die Beteiligung an der Erstellung und Bereitstellung von Hilfsmitteln, wie etwa für die Umrechnung von Währungen, Maßen und Gewichten (Historische Metrologie) sowie an Nachschlagewerken für Berufe (Beispiel: HISCO – History of Work), Todesursachen, etc.

Programmierkenntnisse für die Historische Statistik

Für das Betreiben einer Historischen Statistik, verstanden als Teil der „Digital Humanities“, sind Programmierkenntnisse unumgänglich. Für andere Bereiche der Digital Humanities existieren mittlerweile eine Reihe von Angeboten zum Erlernen entsprechender Fähigkeiten. Wenn man die Historisch Kulturwissenschaftliche Informationsverarbeitung in Köln studiert, dann kann (oder muß) man verschiedene Programmierkurse belegen. Das Trier Center for Digital Humanities bietet im Rahmen einer Programming Group Kurse zur Vermittlung grundlegender Programmierkenntnisse an. Fotis Jannidis hat in einem sehr erhellenden Artikel6 (auch online verfügbar) die Repräsentation und die Analyse als Schwerpunkte der Digital Humanities ausgemacht, wobei die Visualisierung der Daten einen wichtigen Aspekt der Repräsentation ausmache. Das gilt insbesondere für die Historische Statistik. Für die Bearbeitung und Visualisierung von statistischen Daten werden ebenfalls Programmierkenntnisse ausdrücklich empfohlen, so etwa von Nathan Yau:7

„Es kann nicht genug betont werden: Eignen Sie sich bitte ein paar Programmierkenntnisse an; Sie können dann viel mehr mit Ihren Daten machen, als wenn Sie lediglich Out-of-the-box Software verwenden. Programmierkenntnisse machen Sie flexibler und Sie können damit auch die unterschiedlichsten Arten von Daten analysieren.“

Ähnliche Appelle kommen aus den Sozialwissenschaften, wie kürzlich von Simon Munzert, der angehenden Sozialwissenschaftlerinnen und -wissenschaftlern Programmierkenntnisse nahelegt („Lernt programmieren!“) oder aus der Klassischen Philologie, wie z.B. von Gregory Cane auf der Falling Walls Conference im November 2016.

Für Datenjournalisten hat Björn Schwentker („Müssen Datenjournalisten programmieren können?“) eine Reihe von ganz konkreten Empfehlungen gegeben:

  1. R (freie Sprache für Statistik, Datenanalyse und -visualisierung)
  2. Zusätzlich (oder als Ersatz für R) eine flexible „Offline“-Programmiersprache, z.B. Python
  3. Ein Bisschen Regex (universelle „Suchen-und-Ersetzen“-Sprache)
  4. Das Terminal (Betriebssystem-Shell) und seine wichtigsten Befehle (inkl. Installation von Softwarepaketen „per Hand“)
  5. Grundkenntnisse von SQL und Datenbanken
  6. HTML und CSS (Webseiten „lesen“ und einfache bauen können)
  7. Javascript (und am besten auch eine Idee von jQuery)
  8. Für DDJ wichtige Javascript-Bibliotheken wie D3 und Raphaël

Diese Empfehlungen können auch für die Historische Statistik übernommen werden.


Anmerkungen:

  1. Das Folgende z.T. aus Thomas Rahlf (1998), Deskription und Inferenz. Methodologische Konzepte der Statistik und Ökonometrie (= Historical Social Research, Supplement 9), Köln.
  2. Kersten Krüger (2007), Historische Statistik, in: Hans-Jürgen Goetz (Hg.), Geschichte – Ein Grundkurs (rowohlts enzyklopadie), Reinbek bei Hamburg: Rowohlt, 3. Aufl., S. 66-87.
  3. Brian R. Mitchell (2007), International historical statistics: Europe, 1750-2005, Houndmills, Basingstoke, Hampshire/New York, N.Y: Palgrave Macmillan.
  4. Statistisches Bundesamt (1972), Bevölkerung und Wirtschaft 1872 – 1972: Herausgegeben anlässlich des 100jährigen Bestehens der zentralen amtlichen Statistik, Stuttgart [u.a.]: Kohlhammer.
  5. Michael C. Schneider (2013), Wissensproduktion im Staat: das königlich preußische statistische Bureau 1860 – 1914, Frankfurt am Main [u.a.]: Campus Verl.; Lars Behrisch (2016), Die Berechnung der Glückseligkeit: Statistik und Politik in Deutschland und Frankreich im späten Ancien Régime, Ostfildern: Thorbecke sowie meine Rezension hierzu in: Historische Zeitschrift 303/1 (2016), S. 228-229.
  6. Fotis Jannidis, Digital Humanities, in: Informatik Spektrum 39,2 (2016), 155-160.
  7. Nathan Yau (2012), Visualize This! Daten und Design: So bringen Sie Leben in Ihre Zahlen, Weinheim: Wiley-VCH, S. 100