Stellungnahme des DIW Berlin zum Vorwurf des Statistischen Bundesamtes einer ‚missbräuchlichen…
Stellungnahme des DIW Berlin zum Vorwurf des Statistischen Bundesamtes einer „missbräuchlichen Nutzung von Daten“
„Willkürakt ohne Rechtsgrundlage“
Das DIW Berlin hat die vom Statistischen Bundesamt erhobenen Vorwürfe der missbräuchlichen Nutzung anonymisierter Einkommenssteuerdaten scharf zurückgewiesen. Die Vorwürfe sind aus Sicht des DIW Berlin völlig gegenstandslos – und bislang vom Statistischen Bundesamt in keiner Weise belegt worden. Eine Gefährdung des Datenschutzes beziehungsweise des Steuergeheimnisses hat zu keinem Zeitpunkt bestanden. Vielmehr behindert das Statistische Bundesamt hiermit eine forschungsbasierte Politikberatung. Die jetzt angeordneten Zwangsmaßnahmen stellen einen Willkürakt dar, der keinen rechtsstaatlichen Grundsätzen folgt. Das DIW Berlin hat inzwischen den zuständigen Bundesinnenminister und den Bundesdatenschutzbeauftragten gebeten, die Angelegenheit zu prüfen.
In einem Schreiben an das DIW Berlin vom 3. Juli 2009 hatte das Statistische Bundesamt dem DIW Berlin einen Verstoß gegen Datenschutzbestimmungen vorgeworfen. Es forderte das Institut auf, hierzu bis zum 10. Juli 2009 Stellung zu nehmen – was inzwischen erfolgt ist. Das Statistische Bundesamt (StaBuA) kündigte noch vor Eingang der Stellungnahme des DIW Berlin an, sämtliche Lieferungen von anonymisierten statistischen Mikrodaten an das DIW Berlin auszusetzen. Außerdem wurde das DIW Berlin aufgefordert, sämtliche vom StaBuA gelieferten Daten bis zum 17. Juli 2009 zu löschen. Dazu zählen Daten aus der Steuerstatistik, dem Mikrozensus und der Einkommens- und Verbrauchsstichprobe. Dieser Beschluss solle – so das StaBuA in einer weiteren Aufforderung vom 10. Juli 2009 – unverzüglich, das heißt noch vor der Prüfung der Stellungnahme des DIW Berlin vollzogen werden. Bei Vollzug würde damit der forschungsbasierten Politikberatung in 25, zumeist größeren Projekten die Grundlage entzogen.
Dem DIW Berlin droht ein Entzug der Forschungsgrundlage
Die Aufforderung zur Datenlöschung sowie das angedrohte Aus für jeglichen Zugriff auf anonymisierte Mikrodaten stellt aus Sicht des DIW Berlin einen beispiellosen Vorgang des Eingriffs in die Freiheit der Wissenschaft dar. Die angedrohten Zwangsmaßnahmen seien völlig unangemessen und unverhältnismäßig. Eine Umsetzung würde ausschließlich Forschungsvorhaben des DIW Berlin betreffen, die mit dem betreffenden Vorgang in keinerlei Zusammenhang stehen. „Dies erinnert an Sippenhaft“, stellte dazu DIW-Präsident Klaus F. Zimmermann fest. „Das Institut müsste damit seine Arbeit in großen Bereichen einstellen. Wir werden deshalb gegen diesen Willkürakt alle uns zur Verfügung stehenden Rechtsmittel einlegen.“
Kern des Problems ist, dass sich das Statistische Bundesamt seit zwei Jahren nicht in der Lage sieht, ein vom DIW Berlin eingesetztes methodisches Verfahren zur statistischen Zusammenführung anonymisierter Individualdaten auf seine Unbedenklichkeit hin zu überprüfen. Solche Prüfungen sind entsprechend einer Vereinbarung zwischen dem Bundesfinanzministerium und dem Statistischen Bundesamt von 2008 in der Regel innerhalb eines Monats abzuschließen. An dieser Vereinbarung war auch das DIW Berlin in Absprache mit dem Bundesfinanzministerium beteiligt. „Eine mehrjährige Prüfung eines Verfahrens, das etwa in der Arbeitsmarktforschung in Deutschland längst eingesetzt wird, ist grotesk, und lässt den Verdacht aufkommen, hier handele es sich in Wirklichkeit um eine durchsichtige Behinderung der Forschung“, sagte DIW-Präsident Zimmermann. Schließlich bemühe sich das Statistische Bundesamt seit Jahren darum, dass die Datensätze der Steuerverwaltung ausschließlich im Forschungsdatenzentrum des Bundes in Wiesbaden verwendet werden können. Machtfragen sollten aber nicht auf dem Rücken der Forschung und damit letztlich der Öffentlichkeit ausgefochten werden.
Hintergrund: Eine Chronologie
Hintergrund der Auseinandersetzung ist ein im Jahr 2006 an das DIW Berlin vergebener Forschungsauftrag des Bundesfinanzministeriums (BMF). Dabei sollte unter anderem untersucht werden, wie sich die Einkommensverteilung in Deutschland entwickelt hat und ob die Ungleichheit zugenommen hat.
Zur Untersuchung dieser Frage hat das DIW Berlin anonymisierte Daten aus der vom StaBuA bereitgestellten Einkommenssteuerstatistik mit anonymen Angaben aus dem Sozio-oekonomischen Panel (SOEP) verbunden. Das SOEP ist eine am DIW Berlin angesiedelte, repräsentative Langzeitbefragung von mehr als 10.000 Haushalten zu Einkommen, Vermögen und anderen sozio-ökonomischen Variablen. Das DIW Berlin kannte zu keinem Zeitpunkt die Namen und Adressen der Steuerpflichtigen noch die der Teilnehmer an der SOEP-Studie.
Die SOEP-Befragung wird nicht vom DIW Berlin selbst, sondern in seinem Auftrag von einem renommierten Befragungsinstitut durchgeführt.
In der Untersuchung für das BMF wurden die Daten zwar statistisch verbunden, aber es erfolgte keinerlei konkrete Zusammenführung von Einzelfällen. Die Ergebnisse für den obersten Einkommensbereich basieren im übrigen ausschließlich auf den anonymen Steuerdaten, da diese Gruppe der Einkommensbezieher im SOEP faktisch gar nicht repräsentiert wird.
Auf Bitten des Bundesfinanzministeriums legte das DIW Berlin die Studie vor der Veröffentlichung der Fachgruppe Steuerstatistik des StaBuA vor. Dabei wurden Anregungen hinsichtlich der Darstellung sehr hoher Einkommensgruppen gemacht, die vom DIW Berlin umgesetzt wurden. Per E-Mail wurde dem DIW Berlin am 19. Dezember 2006 vom StaBuA mitgeteilt, dass hinsichtlich der angepassten Fassung keine Bedenken bestünden. Auch das BMF hat der Veröffentlichung zugestimmt.
Die korrigierte Fassung wurde auf Fachkonferenzen vorgetragen und in einer leicht überarbeiteten Version am 27. März 2007 als DIW Discussion Paper Nr. 683 publiziert. Dieser Beitrag wurde parallel im März 2007 bei der Fachzeitschrift „Review of Income and Wealth“ eingereicht und schließlich im Jahre 2009 im Heft 2 (Juni 2009) der Zeitschrift publiziert. Eine kürzere Fassung erschien in deutscher Sprache im Wochenbericht des DIW Berlin Nr. 13-2007.
Seit dem 04. Juli 2008 besteht eine zwischen dem BMF und dem Statistischen Bundesamt vereinbarte „Regelung zur Zustimmung zu Veröffentlichungen von Forschungseinrichtungen, die steuerstatistische Einzelangaben auf der Grundlage von § 7 Abs. 6a StStatG von obersten Finanzbehörden des Bundes oder der Länder erhalten haben“. Daran hat sich das DIW Berlin seitdem bei Veröffentlichungen gehalten und wird dies auch künftig entsprechend der Vereinbarung und in Abstimmung mit dem BMF tun.
Am 15. August 2008 hat das DIW Berlin auf Basis dieser Vereinbarung an das Statistische Bundesamt einen neuen Antrag für ein Projekt „Integrierte Datengrundlage aus Einkommensteuerstatistik und Sozio-oekonomischem Panel (SOEP): Aufbau und Analysen zur Einkommens- und Steuerlastverteilung“ gestellt. Dieses Projekt sollte das Integrationsverfahren zeitlich und inhaltlich weiter entwickeln. Im Frühjahr dieses Jahres wurde dann seitens des DIW Berlin eine konkrete Auswertung auf der Basis dieser integrierten Datengrundlage vorgeschlagen. Daraufhin wurde dem DIW Berlin seitens des StaBuA am 26. Mai 2009 mitgeteilt, dass derzeit Veröffentlichungen aus einem solchem Projekt nicht genehmigt werden könnten. Diese Ablehnung bezog sich also auf dieses neue Projekt und nicht auf das im „Review of Income and Wealth“ im Juni 2009 erschienene Papier über Einkommensungleichheit. Die mit Schreiben vom 3. Juli 2009 verkündeten Zwangsmaßnahmen stützen sich also auf eine unzulässige Vermengung zweier getrennter Vorgänge.
Kern der Debatte: Ist der Datenschutz in Gefahr?
Eine inhaltliche Begründung, warum das StaBuA den Datenschutz in Gefahr sieht, wurde dem DIW Berlin bis heute nicht vorgelegt. Deshalb ist für das DIW Berlin bislang nicht nachvollziehbar, welche rechtlichen Vorbehalte gegenüber der Datennutzung oder der Veröffentlichung des Beitrags bestehen.
Dennoch sieht das StaBuA in der rein statistischen Verbindung der Daten aus Einkommenssteuerstatistik und des SOEP offenbar eine Gefährdung des Datenschutzes beziehungsweise des Steuergeheimnisses: So könnten – so der implizite Vorwurf – wegen ihrer geringen Fallzahlen beispielsweise einzelne Bezieher sehr hoher Einkommen identifizierbar werden, wenn zufällig Statistik-Daten derselben Person vom Computer zusammengeführt werden. Um das zu erkennen, müsste man aber einen enormen Rechercheaufwand treiben und wüsste dann aufgrund der Recherche mehr über diesen einen Einzelfall, als aus einer statistischen Zahl hervorgeht. Deswegen ist der Einsatz „statistischer Matching-Verfahren“ durch die Wissenschaft auch erlaubt. Sie werden in der deutschen Arbeitsmarktforschung mit der Zustimmung der Datenschutzbehörden auch seit Jahren eingesetzt.
Was passierte bei der Verbindung der SOEP- und der Steuerdaten?
Die Wissenschaftler des DIW Berlin haben für ihre Untersuchung über die Einkommensverteilung ähnlich aussehende Fälle zusammengeführt. Dass dabei zufällig dieselben Fälle gefunden werden, ist aufgrund der kleinen Fallzahl des SOEP extrem unwahrscheinlich. Und selbst wenn es passiert wäre: Die entsprechenden Fälle wären als solche gar nicht erkennbar gewesen.
So hat das DIW Berlin weder bei den SOEP-Daten Zugriff zu Namen und Adressen einzelner Befragter, noch hatte es einen Zugriff dazu bei den Daten aus der Einkommenssteuerstatistik. Zudem haben sich die betreffenden Mitarbeiter des DIW Berlin gegenüber dem Bundesfinanzministerium als Auftraggeber vertraglich verpflichtet, jeden Versuch einer De-Anonymisierung einzelner Steuerzahler zu unterlassen.
Im konkreten Fall bestand vor diesem Hintergrund zu keinem Zeitpunkt eine De-Anonymisierungsgefahr- und zwar weder real noch theoretisch. Die Ergebnisse für den obersten Einkommensbereich basieren ohnehin nur auf den anonymen Steuerdaten, da diese Gruppe der Einkommensbezieher im SOEP faktisch gar nicht erfasst wird. Im obersten Einkommensbereich kann das vom DIW Berlin gewählte statistische Analyseverfahren daher noch nicht einmal theoretisch die Gefahr einer De-Anonymisierung von Steuerpflichtigen erhöhen. Diese Zusammenhänge wurden dem Statistischen Bundesamt seitens des DIW Berlin auf Anfrage bereits mehrmals mitgeteilt. Eine Begründung seitens des Statistischen Bundesamtes, warum durch dieses Verfahren der Datenschutz dennoch verletzt sein sollte, steht seit mehr als zwei Jahren aus.
Entspricht das Untersuchungsverfahren des DIW Berlin wissenschaftlichen Standards?
Die Zusammenführung von Daten aus unterschiedlichen Erhebungen wird auch als Matching bezeichnet. Entsprechende statistische Verfahren sind in vielen Bereichen der Arbeitsmarkt- und Sozialforschung ein übliches Analyseinstrument. So wurden bereits häufig anonymisierte Daten aus der Arbeitsverwaltung, der Sozialversicherung und dem SOEP statistisch verbunden, um den Erfolg von Programmen statistisch zu evaluieren.
In anderen Fällen geht es darum, wie bei der DIW-Studie anonymisierte Verwaltungsdaten um anonymisierte Merkmale aus Haushaltserhebungen wie dem SOEP zu ergänzen. Die Anwendung solcher Verfahren auf Steuerstatistiken stellt daher nichts grundsätzliches Neues dar – auch hier folgen Sozialwissenschaftler den regulären, für entsprechende Datenintegrationsverfahren üblichen Schutzstandards für den Datenschutz.
Was hat das DIW Berlin veröffentlicht?
Zwei Veröffentlichungen hat das DIW Berlin auf der Grundlage seines Forschungsvorhabens für das Bundesfinanzministerium im Jahr 2007 herausgegeben:
– Stefan Bach, Giacomo Corneo, Viktor Steiner: From Bottom to Top: The Entire Distribution of Market Income in Germany, 1992 – 2001, DIW Discussion Paper Nr. 683/2007, im Web: http://www.diw.de/deutsch/produkte/publikationen/diskussionspapiere/jahrgang_2007/55060.html
– Stefan Bach, Viktor Steiner: Zunehmende Ungleichheit der Markteinkommen: reale Zuwächse nur für Reiche, DIW Wochenbericht Nr. 13/2007, S. 193-198, im Web: http://www.diw.de/deutsch/produkte/publikationen/wochenbericht/jahrgang_2007/55058.html
Was sind die zentralen Ergebnisse der DIW-Untersuchung?
Über die 90er Jahre hat die Ungleichheit der am Markt erzielten Bruttoeinkommen – Löhne und Gehälter, Unternehmer- sowie Vermögenseinkommen – in Deutschland zugenommen. Während die preisbereinigten Einkommen im Durchschnitt konstant blieben, gab es für die oberen 10 Prozent der Einkommenspyramide nennenswerte Zuwächse. Diese Gruppe konnte ihr reales Markteinkommen von 1992 bis 2001 um gut 7 Prozent steigern. Die „ökonomische Elite“, die oberen 0,001 Prozent der Einkommensbezieher, erzielten gegenüber 1992 sogar einen realen Einkommensanstieg um 35 Prozent. In dieser Gruppe von 650 Personen lag das durchschnittliche Markteinkommen 2001 bei 15 Millionen Euro.
Renate Bogdanovic
Pressestelle
Deutsches Institut für Wirtschaftsforschung (DIW Berlin)
German Institute for Economic Research
Mohrenstraße 58
10117 Berlin
Tel. +49-30-897 89 249
Fax +49-30-897 89 119
mailto:presse@diw.de375322