1. Research
  2. Produkte & Themen
  3. Publikationsreihen
  4. Deutschland-Monitor
4. März 2014
Big Data wird zu einem volkswirtschaftlich relevanten Produktions-, Wettbewerbs- und somit Wachstumsfaktor. Moderne Analysetechnologien halten Einzug in sämtliche Lebensbereiche und verändern den Alltag. Insbesondere die Sensorik, biometrische Erkennungsverfahren und der allgemeine Trend zur Konvergenz von Informations- und Kommunikationstechnologien stimulieren die Big-Data-Bewegung. Daten haben einen ökonomischen Wert – dementsprechend sind die Risiken nicht zu unterschätzen. Nun gilt es, die notwendigen regulativen Rahmenbedingungen so zu setzen, dass sich die moderne Technologie und Methodik optimal entfalten kann. [mehr]
Big Data - die ungezähmte Macht Aktuelle Themen Digitale Ökonomie und struktureller Wandel Big Data wird zu einem volkswirtschaftlich relevanten Produktions-, Wettbe- werbs- und somit Wachstumsfaktor. Moderne Analysetechnologien halten Ein- zug in sämtliche Lebensbereiche und verändern den Alltag. Insbesondere die Sensorik, biometrische Erkennungsverfahren und der allgemeine Trend zur Konvergenz von Informations- und Kommunikationstechnologien stimulieren die Big-Data-Bewegung. Um die Potenziale optimal zu heben, sind enorme Herausforderungen zu bewäl- tigen. Neben zunehmenden Datenmengen, unterschiedlichen Datenstrukturen sowie Echtzeitverarbeitungen spielen auch Datensicherheit, dringend reformbe- dürftige Datenschutzbestimmungen sowie wachsende Qualifizierungsanforde- rungen der Akteure eine wesentliche Rolle. Es fehlen vielerorts geeignete Digi- talisierungs-Strategien, um auf den digitalen Strukturwandel zu reagieren. Daten haben einen ökonomischen Wert. Die Begehrlichkeiten vieler Akteure, z.B. nach personenbezogenen Daten, steigen. Der Internetnutzer selbst könnte zum gehandelten Gut werden, ohne dass es ihm zu jeder Zeit bewusst ist oder er dadurch einen monetären Nutzen erfährt. Die Chancen für Wirtschaft, Wissenschaft und Politik sind facettenreich: Sie reichen von der Produktivitätserhöhung, der Kostenersparnis sowie einer opti- malen Kundenansprache bis hin zu besseren Prognosen von sich ausbreiten- den Krankheiten oder wissenschaftlichen Modellanalysen. Zudem bieten öffent- liche Verwaltungseinheiten vermehrt nicht personenbezogene Datensätze an, um neue Produkte, Dienstleistungen und Geschäftsmodelle zu generieren. Dementsprechend sind die Risiken nicht zu unterschätzen: Viele beklagen nicht nur das wachsende Gefühl des „Information overloading“, sondern auch den zunehmenden Verlust ihrer Datenhoheit. Diverse Akteure sammeln, speichern und werten u.a. personenbezogene Daten zu unterschiedlichen Zwecken x-fach aus. Durch unverhältnismäßiges Datensammeln einiger Akteure könnte das Vertrauen in digitale Kanäle verlorengehen, zumindest spürbar sinken. Dies hätte fatale Auswirkungen auf die Innovationsfähigkeit sowie das Wachstum nicht nur im Bereich des noch jungen Forschungsfeldes der Informationstechno- logie. Die Big-Data-Bewegung ist nicht aufzuhalten. Nun gilt es, die notwendigen re- gulativen Rahmenbedingungen so zu setzen, dass sich die moderne Technolo- gie und Methodik optimal entfalten kann. Der Wirtschaftsstandort Deutschland, aber auch die Europäische Union haben jetzt die Chance, mit ihren Erfolgen im Bereich Sensorik und Biometrie sowie im Bereich Datenschutz eine internatio- nale Vorreiterrolle in Bezug auf sichere IT-Infrastrukturen einzunehmen. Autoren Thomas F. Dapp +49 69 910-31752 thomas-frank.dapp@db.com Veronika Heine Editor Lars Slomka Deutsche Bank AG Deutsche Bank Research Frankfurt am Main Deutschland E-Mail: marketing.dbr@db.com Fax: +49 69 910-31877 www.dbresearch.de DB Research Management Ralf Hoffmann 4. März 2014 Big Data D ie ungezähmte Macht Big Data – die ungezähmte Macht 2 | 4. März 2014 Aktuelle Themen 1. Big Data – Eine logische Evolutionsstufe im Internet ................................................................................. 3 2. Akteure, Daten-Charakteristik, Quellen und Treiber ................................................................................... 5 3. Sensorik und Biometrie erobern die Massenmärkte ................................................................................. 10 4. Zur Rolle digitaler Ökosysteme in der Big-Data-Welt ............................................................................... 13 5. Der ökonomische Wert von Daten ........................................................................................................... 18 6. Big Data und der Datenschutz ................................................................................................................. 21 7. (Big) Data in der Praxis: Es gibt keinen Königsweg ................................................................................. 24 8. Grenzen von Big Data ............................................................................................................................. 33 9. Fazit ........................................................................................................................................................ 35 Literaturverzeichnis ........................................................................................................................................ 37 Weiterführende Literatur ................................................................................................................................. 38 Big Data – die ungezähmte Macht 3 | 4. März 2014 Aktuelle Themen 1. Big Data – Eine logische Evolutionsstufe im Internet „Technologie ist weder gut noch schlecht. Sie ist auch nicht neutral.[…] Techn o- logie interagiert in einer Weise mit ihrer sozialen Umwelt, dass technologische Entwicklungen häufig ökologische, soziale und menschliche Konsequenzen nach sich ziehen, die weitreichender sind als die unmittelbaren Ziele der Geräte und Praktiken, um die es eigentlich geht.“ [Melvin Kranzberg, 1986] Existiert zwischen Buch- und Schuh-Käufen beim Online-Händler Amazon zu bestimmter abendlicher Uhrzeit womöglich ein Zusammenhang? Können Kreditkartenfirmen aus einzelnen Transaktionen ihrer Kunden vorhersagen, bei wem eventuell Ehekrisen bevorstehen? Kann durch die GPS-Ortung mobiler Endgeräte in Kombination mit der Auswertung von Micro-Blogging-Diensten in nahezu Echtzeit eine drohende Epidemie vorhergesagt, dadurch verhindert oder zumindest abgemildert werden? Können von einer mit dem Internet verbundenen elektronischen Zahnbürste künftig während der Mundhygiene Informationen direkt an den Zahnarzt weitergeleitet werden, um gegebenenfalls einen zeitnahen Behandlungstermin zur Karies-Entfernung zu bekommen? Diese Beispiele wirken zugegeben auf den ersten Blick etwas befremdlich, er- fahren aber aufgrund der kontroversen und immer breiter geführten Diskussion über das Megathema „Big Data“ eine völlig neue Dimension. Mit Hilfe der Sensorik, einer Vielzahl von Datensätzen sowie bestimmter Algorithmen können sich künftig automatisierte Vorhersagen über bestimmte Verhaltenspräferenzen (nicht nur online) anhand einfacher Korrelationen abbilden lassen. Im Ozean der Daten sind vermutlich jede Menge ungeahnte, überraschende und wertvolle Korrelationen zu entdecken, an die heute kaum jemand denkt. Neben den technologischen Möglichkeiten werden sich auch allmählich das Verständnis und die Einstellung der Menschen zu Daten sowie zur Datenanaly- se verändern. Das Gestaltungspotenzial dessen, was mit soliden Daten, intelli- genten Sensoren und Filterung alles gemessen und analysiert werden kann, ist aufgrund moderner Internet-Technologien noch nie so vielversprechend und lukrativ gewesen wie jetzt, in den Anfangsjahren des digitalen Zeitalters. Wir befinden uns inmitten des digitalen Strukturwandels. Die Relevanz web- basierter Technologien nimmt in allen Wirtschaftszweigen stetig zu. Beinahe jede geschäftliche und betriebliche, aber auch viele private Transaktionen sind inzwischen an moderne, digitale Informationstechnologien gebunden, bei gleichzeitig sinkenden Transaktionskosten. Die Digitalsierung verändert den sozialen und wirtschaftlichen Alltag der Menschen, und die Akteure aus Wirt- schaft, Wissenschaft oder Politik reagieren darauf – zugegeben mit unterschied- licher Geschwindigkeit. Der volkswirtschaftlich relevante Produktionsfaktor, der hinter dieser digitalen Entwicklung steckt und stetig wächst, sind einzelne, un- terschiedliche Datenpunkte, die vermehrt auch in Echtzeit nachgefragt werden. 1 Big Data ist nach einer Reihe logischer Entwicklungsstufen im Internet, wie der Individualisierung, der Verlagerung der Daten in die Cloud oder des rapide stei- genden Wunsches nach (digitaler) Mobilität, das neue kontrovers diskutierte Thema. Es schlägt Brücken zu den vorhergehenden. Prinzipiell geht es darum, unterschiedliche Datenmengen mit neuen Datensätzen zu kombinieren, eventu- elle Muster in diesen kumulierten Daten mit intelligenten Softwareprogrammen aufzuspüren, um anschließend die richtigen (möglichst wirtschaftlich lukrativen) Schlüsse aus den Ergebnissen zu ziehen. Einmal erhobene Primärdatensätze können zu unterschiedlichen Zwecken und für unterschiedliche Akteure zweit-, dritt-, oder x-fach ausgewertet werden. Dadurch erweisen sich die Daten einer- seits als Quelle für Innovation, Kreativität sowie „Out-of-the-box-Denken“ und münden idealerweise in neuen Geschäftsideen, Produkten oder Dienstleistun- 1 Aus einem Datenberg etwas Wertvolles zu extrahieren bzw. ein Muster zu erkennen, wird in der Wissenschaft auch als Data-Mining bezeichnet. Eine neue Art des Denkens über Daten bricht an 0 20 40 60 80 100 Quelle: Google Trends (www.google.de/trends/) Weltweites Interesse, 2004-heute, geglättet Websuche Begriff "Big Data" 1 60 70 80 90 100 110 120 03 04 05 06 07 08 09 10 11 12 13 Information und Kommunikation Informationsdienstleistungen Datenverarbeitung, Hosting u.Ä., Webportale Quelle: Statistisches Bundesamt Umsatzentwicklung IKT 2 Deutschland, 2010=100, arbeitstäglich - und saisonbereinigt Big Data – die ungezähmte Macht 4 | 4. März 2014 Aktuelle Themen gen. Andererseits können und werden sie den Menschen aber auch viele Sor- gen und Ängste bereiten, weil die eigene Datenhoheit, also die informationelle Selbstbestimmung, schnell verlorengehen kann, wie viele Beispiele zeigen. Am Ende des Big-Data-Prozesses gilt es, die richtigen Schlüsse aus der Kom- bination von Technologie und Methodik zu ziehen. Hier lauert für die Entschei- dungsträger eine weitere Herausforderung, denn hier treffen zwei Welten aufei- nander: Die Bits und Bytes, also die maschinellen Algorithmen auf der einen Seite, und der Mensch mit seinen Instinkten, seiner Erfahrung und seiner Intuiti- on auf der anderen Seite. Zählen im Entscheidungsmoment die Ergebnisse aus der Statistik oder die langjährigen Erfahrungen bzw. das individuelle Bauch- gefühl? Das Potenzial der maschinellen Algorithmen, wertvolle Informationen aus den kombinierten Datensätzen zu gewinnen, steckt sicherlich noch in den Kinderschuhen und ist ausbaufähig. Es bleibt aber zu hoffen, dass sich trotz des technologischen Fortschritts und der kaum fassbaren Dynamik in diesem Be- reich ein ausgewogenes Mensch-Maschine-Verhältnis herausbilden wird. Abge- sehen von den bis dato ungenügenden Datenschutzrichtlinien in diesem noch jungen (internationalen) Forschungsbereich möchten sicherlich die Wenigsten in einer Welt leben, in der Entscheidungsfindungsprozesse ausschließlich pro- grammierten (womöglich selbstlernenden) Algorithmen überlassen werden. Dagegen können moderne IK-Technologien natürlich die Effizienz erhöhen, Kosten reduzieren sowie menschliches Versagen minimieren – ein Trade-Off! Dieser nicht-trivialen Herausforderung stehen zunehmend Akteure aus Wirt- schaft, Wissenschaft, Politik und Gesellschaft gegenüber. Die ökonomische Bedeutung von (Echtzeit-)Daten, wie Finanz- und Handelstransaktionsdaten, Sensor- bzw. Messdaten, Gesundheitsdaten, Social-Networking-Analysen sowie deren Auswirkungen auf die geschäftlichen Abläufe in einer global integrierten Wirtschaft, aber auch im privaten und sozialen Umfeld nimmt kontinuierlich zu. Es werden immer mehr Daten von unterschiedlichen Akteuren erzeugt, die auch gefiltert, zu unterschiedlichen Zwecken analysiert und mehrfach ausgewertet werden könn(t)en – Tendenz: exponentiell steigend. Obwohl wir uns erst am Anfang der Big-Data-Entwicklung befinden, nähern wir uns mit moderner Technologie und Methodik langfristig einem Zustand, bei dem menschliche Handlungen, Aktivitäten sowie Gefühlszustände mehr und mehr messbar gemacht werden können. Das bedeutet, dass Daten in eine maschi- nenlesbare Form gebracht werden können, um sie gegebenenfalls (mit anderen Datensätzen) zu kombinieren und auszuwerten. Durch die Möglichkeiten der Sensorik sowie durch biometrische Erkennungsverfahren kommen wir dadurch dem seit Menschheitsgedenken bestehenden Wunsch näher, die Welt und die darin lebenden Individuen zu quantifizieren. Damit kommen wir aber auch den Visionen der humanoiden Robotik und der künstlichen, lernfähigen Intelligenz näher, wie sie bereits in vielen Science-Fiction-Filmen vorgestellt wurden und auch für die Massenmärkte Realität werden könnten. Wie bei jeder neuen und (r)evolutionären Bewegung eröffnen sich Chancen, aber auch Risiken. Beide Ausprägungen sollten jetzt, in diesem frühen Stadium der Entwicklung transparent und breit diskutiert werden. Aus deutscher bzw. europäischer Perspektive sollten aus Gründen der Wettbewerbsfähigkeit jetzt günstige Rahmenbedingungen geschaffen werden, um die Potenziale der Big- Data-Bewegung zu stimulieren. Gleichzeitig müssen unverhältnismäßige und rechtlich sowie moralisch fragwürdige Praktiken des Datenmissbrauchs durch europäische, idealerweise über Europa hinaus geltende datenschutzrechtliche Bestimmungen eingeschränkt werden. In welchen Schritten nähern wir uns Big Data? Im folgenden Kapitel werden die unterschiedlichen Akteure vorgestellt sowie die Grundlagen der Daten- Charakteristik erläutert. Darüber hinaus stehen die Quellen und Treiber der wachsenden Datenflut im Fokus und werden anhand einiger Beispiele erklärt. Der Wunsch der Menschen , die Welt zu quantifizieren 65 75 85 95 105 115 125 03 04 05 06 07 08 09 10 11 12 13 Information und Kommunikation Informationsdienstleistungen Datenverarbeitung, Hosting u.Ä., Webportale Quelle: Statistisches Bundesamt Deutschland, 2010=100 Beschäftigung im Dienstleistungs- bereich (IKT) 3 3,4 4,6 6,3 8,8 12,0 15,7 0 2 4 6 8 10 12 14 16 18 2011 2012 2013 2014 2015 2016 Quellen: Bitkom, Experton Group Mrd. EUR Marktpotenzial Big Data global 4 Big Data – die ungezähmte Macht 5 | 4. März 2014 Aktuelle Themen Das Kapitel 3 stellt insbesondere die Bereiche Sensorik und Biometrie in den Mittelpunkt. Beide Technologien werden zunehmend massentauglich und ver- sprechen künftig lukrative Wachstumspotenziale. Als branchenübergreifender Trend schafft die Konvergenz von Informations- und Kommunikationstechnolo- gien zusätzliche Impulse und Raum für Experimente sowie künftige neue Ge- schäftsmodelle, innovative Produkte und Dienstleistungen. Die Rolle der digita- len Ökosysteme in der Big-Data-Diskussion wird im 4. Kapitel analysiert. Einzel- ne große Internetfirmen erweitern ihre Kernkompetenzen mit Hilfe moderner Technologien und Methoden im Bereich Datenanalyse. Dadurch steigen nicht nur das Spektrum ihrer Produkte und Dienstleistungen, sondern auch der Lock- in-Effekt sowie die Wechselkosten für die Konsumenten. Daten haben einen ökonomischen Wert. Diverse Datensätze können von unterschiedlichen Akteu- ren zu unterschiedlichen Zwecken (mehrfach) verwendet, monetarisiert, aber auch missbraucht und zweckentfremdet werden. Grundsätzlich besteht also die Möglichkeit, verblüffende (oder gar beängstigende) detailgetreue (digitale) Profi- le der Menschen zu erstellen – größtenteils ohne deren Erlaubnis. Die für Au- ßenstehende schwer nachvollziehbare und unverhältnismäßige Sammel- Aktivität einzelner Akteure wird in Kapitel 5 diskutiert. Die für die Big-Data-Bewegung ungenügenden, aber elementaren Datenschutz- richtlinien sowie einige Lösungsansätze sind Themen des Kapitels 6. Das Kapi- tel 7 gewährt einen kurzen Einblick in die unterschiedlichen Big-Data-Projekte im Bereich Wirtschaft, Wissenschaft und öffentliche Verwaltung. Die Grenzen der Big-Data-Bewegung, allem voran die zunehmende Komplexität durch die Verschmelzung unterschiedlicher Datensätze, sind in Kapitel 8 erwähnt. Die Studie schließt in Kapitel 9 mit einem kurzen Resümee sowie einem Ausblick, wohin die Reise in den kommenden Jahren gehen könnte. 2. Akteure, Daten-Charakteristik, Quellen und Treiber „ I keep saying the sexy job in the next ten years will be statisticians. People think I'm joking, but who would've guessed that computer engineers would've been the sexy job of the 1990s?” [Hal Varian, Google´s Chief Economist on Statistics and data, January 2009] Big Data ist mehr als nur IT: Akteure aus diversen Bereichen Viele Entscheidungsträger haben erkannt, dass Big Data längst kein reines IT- Thema mehr ist. Big Data entwickelt sich vielmehr zu einer Bewegung, die das Zusammenspiel moderner Internet-Technologien und Analyse-Methoden um- fasst, welche die Erfassung, Speicherung und Auswertung großer und erweiter- barer, vor allem unterschiedlich strukturierter Daten ermöglicht. Big Data erfährt dadurch eine breite, internationale Dimension mit unterschiedlichen wissen- schaftlichen Erkenntnissen und Erwartungen hinsichtlich Wachstums- oder Effi- zienzsteigerungen. Big Data öffnet vor allem den Raum für Experimente, Inno- vation und Kreativität, bietet einen reichen Fundus an neuen möglichen Daten- kombinationen und steht somit auch für die Entdeckung ungeahnter Zusam- menhänge. Dadurch birgt Big Data das Potenzial, neue Geschäftsmodelle, Pro- dukte und Dienstleistungen zu schaffen bzw. Innovationen voranzutreiben. Aufgrund der Ressourcenknappheit sowie der Stärke wissensintensiver Produk- te und Dienstleistungen in Deutschland, hat die Big-Data-Bewegung durchaus Potenzial, sich zu einem künftig stabilen komparativen Vorteil für den deutschen Wirtschaftsstandort zu etablieren. Big Data kann zu einem volkswirtschaftlich relevanten Produktions- und Wettbewerbsfaktor mit damit einhergehenden neu- en Möglichkeiten der Wertschöpfung werden und für ähnlich (r)evolutionäre Bewegungen wie die massenhafte Nutzung des Internet selbst sorgen. Allem voran versprechen sich viele Anbieter neuer und effektiver Datenanalyse-Tools 53,4 98,3 208,2 334,7 475,3 657,5 75,2 133,5 227,7 315,6 411,1 522,6 69,3 119,4 214,7 306 398,3 505,8 0 400 800 1.200 1.600 2.000 2011 2012 2013 2014 2015 2016 Services Software Hardware Mio. EUR Quellen: Bitkom, Experton Group Marktpotenzial Big Data in DE 5 Big Data – die ungezähmte Macht 6 | 4. März 2014 Aktuelle Themen langfristige Effizienzsteigerungen und insbesondere lukrative Umsatzchancen, u.a. durch die Gewinnung und Analyse detaillierter kundenspezifischer Informa- tionen, d.h. Big Data verspricht am Ende vor allem auch Big Business . Neben der IT-Branche sehen sich also auch Akteure aus Wirtschaft, Wissen- schaft oder öffentlicher Verwaltung zunehmend mit Big Data konfrontiert. Die Analyse der Datenberge, die in den unterschiedlichen Bereichen entstehen, kann nicht nur den volkswirtschaftlichen Nutzen erhöhen, sondern wird zuneh- mend auch dafür eingesetzt, die gesellschaftlichen sowie humanitären, z.B. medizinischen, Probleme zu mildern, wie ein Beispiel in Kapitel 7 zeigt. Dies kann aber nur unter der zwingenden Voraussetzung gelingen, dass sich die modernen Technologien und Entwicklungen innerhalb eines verbindlichen Rechtsrahmens bewegen. Dieser muss den Datenschutzrichtlinien auf europäi- scher, bestenfalls internationaler Ebene genügen bzw. das Recht auf informati- onelle Selbstbestimmung in den Vordergrund rücken. Die Charakteristik von Daten: komplex und heterogen, aber wertvoll In der Big-Data-Diskussion werden den unterschiedlichen Daten im Wesentli- chen drei Eigenschaften zugeordnet, die gemäß ihren englischen Bezeichnun- gen als die drei „Vs“ bekannt sind und im Folgenden anhand einiger Beispiele und Illustrationen vorgestellt werden: 0 10 20 30 40 50 60 70 06 07 08 09 10 11 12 Deutschland USA Südkorea Japan UK China Schweden Patente im IKT* - Bereich 7 %, Anteil gewährter Patente an den Patentanmeldungen Quelle: EPO * Definition EPO: Audio - visuelle Technologie, Telekommunikation, digitale Kommunikation, elementare Kommunikationsprozesse, Computertechnologie, IT - Methoden für das Management, Halbleiter und elektrische Maschinen, Apparate, Energie 35 30 28 23 23 22 21 19 19 18 17 17 17 0 10 20 30 40 Controlling Optimierung der IT - Infrastruktur Finanzplanung/Budgetierung Preisoptimierung Kundenrentabilität Optimierung des Kundenverhaltens IT - Traffic - Monitoring und - Optimierung Vertriebsanalyse und - steuerung Bessere Maschinenauslastung Kampagnen - Mngm. u. - Optimier. Werkauslastung und - steuerung Höhere Mitarbeiterauslastung Fraud Detection/Gesetzliche Regularien Geschäftsbereiche mit größtem Nutzen 8 *Mehrfachnennungen möglich Quelle: IDC % der Befragten* (n=254), 2012 45 42 36 33 33 31 30 28 27 24 22 0 10 20 30 40 50 Kostenoptimierung Schnellere Informationsgewinnung Besseres Informationsmanagement Bessere Unternehmenssteuerung Detailliertere Information Bessere Infobasis f. Untern.entsch. Optimierung vorh. Business Cases Erkennen neuer Geschäftspot. Verbesserung Compliance - Aspekte Präziseres Finanz - Reporting Data Governance Unternehmerisches Potenzial von Big - Data 9 *Mehrfachnennungen möglich % der Befragten* (n=254), 2012 Quelle: IDC 48 48 44 37 32 20 14 0 10 20 30 40 50 DE SE JP GB US KR CN Quelle: EPO %, Anteil gewährter Patente an den Patentanmeldungen im Durchschnitt 2003 - 2012 DE und SE: Höchste Raten an erteilen IKT - Patenten 6 Big Data – die ungezähmte Macht 7 | 4. März 2014 Aktuelle Themen — Volume (Datenmenge) Das erste Kriterium behandelt die Datenmengen, die im privaten sowie ge- schäftlichen, wissenschaftlichen oder öffentlichen Bereich anfallen. Aufgrund der fortschreitenden Digitalisierung sind beinahe alle Bereiche des modernen Lebens involviert. Alleine im privaten Bereich speichern und archivieren die Menschen eine enorme Datenmenge im dreistelligen Gigabyte-Bereich. Hierzu zählen z.B. digitale Fotos, Dokumente, Tabellen, E-Mails, Musiktitel oder Kino- filme. Unternehmen, wissenschaftliche Institute oder öffentliche Verwaltungen speichern, archivieren und werten Datenmassen ebenfalls aus, allerdings in viel größeren Dimensionen. Der Speicherplatz auf mobilen Endgeräten (Smartphone, Tablet-PC, E-Reader) oder auf Notebooks ist im Gigabyte-Bereich und somit kapazitätsmäßig noch vorstellbar. 2 Aber Unternehmen, wissenschaftliche Institutionen oder auch Ge- heimdienste, die täglich hohe Datenbestände generieren, verwalten und aus- werten, rechnen mittlerweile im Tera-, Peta-, Exa-, und Zettabyte-Bereich. Im vergangenen Jahr wurden weltweit 1,8 Zettabyte an Daten produziert. Ein Zettabyte entspricht einer Trilliarde Bytes. Das ist eine Zahl mit 21 Nullen: 1.000.000.000.000.000.000.000. „Experten haben hochgerechnet, dass die Menschheit vom Beginn der Zeit- rechnung bis zum Jahre 2003 rund fünf Milliarden Gigabyte an Daten erzeugt hat. […] Im Jahr 2011 sammelte sich dieselbe Datenmenge – 4,4 Exabyte – bereits alle 48 Stunden an.“ 3 Unter Fortsetzung dieses Trends, insbesondere aufgrund leistungsfähigerer Rechner, günstigerer Speichermedien sowie intelli- genterer Algorithmen, fielen diese Datenmengen im Jahr 2013 bereits alle zehn Minuten an. Glaubt man den Experten, so verdoppelt sich das Volumen also alle zwei Jahre. Der „digitale Heustock“ wird folglich immer größer, und die Su- che nach den relevanten Stecknadeln immer schwieriger. Dabei wird zu Recht die kritische Frage gestellt, welche unterschiedlichen Akteure eigentlich welche Stecknadeln im permanent wachsenden Heuhaufen suchen. Vor allem ist inte- ressant zu erfahren, wer genau Zugang zu welchen Datensätzen hat und wer dabei für welche Zwecke, welche Analysemethoden anwendet. Mitunter liegt die Herausforderung auch an den beschleunigten Entstehungsraten der Daten, welche die Unternehmen möglichst in Echtzeit auswerten möchten. Dies bildet die Grundlage für die zweite Charakteristik: — Velocity (Geschwindigkeit) Während die Daten im analogen Zeitalter noch in überschaubaren Frequenzen anfielen, erfasst und ausgewertet wurden, fließen die Datenströme im digitalen Zeitalter aufgrund der Vielzahl an vernetzten Sensoren und der Verschmelzung 2 Auf zwei Gigabyte verfügbaren Speicherplatz passen z.B. rund 360 MP3s in guter Klangqualität, ein eineinhalb Stunden langer Film in HD (High Definition) sowie etwa 150 Fotos mit einer 5- Megapixel-Auflösung. 3 Heuer, S. (2013). Kleine Daten, große Wirkung. Big Data einfach auf den Punkt gebracht. Lan- desanstalt für Medien Nordrhein-Westfalen (LfM). Düsseldorf. Mehr Bits und Bytes wie Sand am Meer Übersicht Maßeinheiten für Datengrößen 10 1 Byte = 8 Bits = 1 1 Kilobyte (kB) = 10 3 Byte = 1.000 1 Megabyte (MB ) = 10 6 Byte = 1.000.000 1 Gigabyte (GB) = 10 9 Byte = 1.000.000.000 1 Terabyte (TB) = 10 12 Byte = 1.000.000.000.000 1 Petabyte (PB) = 10 15 Byte = 1.000.000.0 00.000.000 1 Exabyte (EB) = 10 18 Byte = 1.000.000.000.000.000.000 1 Zettabyte (ZB) = 10 21 Byte = 1.000.000.000.000.000.000.000 1 Yottabyte (YB) = 10 24 Byte = 1.000.000.000.000.000.000.000.000 Quelle: Eigene Darstellung 7.973 10.424 0 4.000 8.000 12.000 16.000 20.000 11 12 13 14 15 16 17 18 19 Mobile PC/Router/Tablet Smartphone Datenverkehr mobile, web - basierte Endgeräte 11 Petabytes pro Monat Quelle: Ericsson 2013 Big Data – die ungezähmte Macht 8 | 4. März 2014 Aktuelle Themen der Informations- und Kommunikationstechnologien (IKT) rund um die Uhr quer über den Erdball. Um auch zeitkritischen Geschäfts- und Entscheidungsprozes- sen gerecht zu werden, wird es immer wichtiger, die anfallenden Datenströme sowohl von internen als auch externen Quellen in Echtzeit zu integrieren bzw. zu analysieren. Gerade hiervon versprechen sich viele Entscheidungsträger enorme Wettbewerbs- und Effizienzvorteile. Auch die Wissenschaft profitiert von Echtzeitdaten, wenn es beispielsweise darum geht, dass Krankheitserreger zeitnah erkannt werden sollen, um eventuelle präventive Schritte einzuleiten, bevor es zu einer starken Verbreitung der Krankheit kommen kann. — Variety (unterschiedliche Datenbeschaffenheit) Es geht aber nicht ausschließlich um die Datenflut, sondern auch um die Vielfalt an unterschiedlichen Datentypen und -strukturen, die möglichst einheitlich und harmonisiert verarbeitet werden müssen, um sie miteinander kombinieren zu können. Grundsätzlich kann zwischen strukturierten, halbstrukturierten und un- strukturierten Daten unterschieden werden. Während bisher größtenteils strukturierte Informationen in relationalen Daten- banken verarbeitet werden, verlieren neuere Daten, z.B. aus sozialen Netzwer- ken, zunehmend an Struktur und können kaum mit herkömmlichen Datenban- ken nutzenstiftend verwertet werden. Zu den strukturierten Daten zählen bei- spielsweise Kundenstammdaten, wie Geschlecht, Geburtsdatum, Adresse etc. Unstrukturierte Daten sind z.B. Bilder, Videos und Audiodateien. E-Mails wieder- um zählen zu den halbstrukturierten Daten, weil sie in der Kopfzeile einen Ab- sender, einen Empfänger und einen Betreff, also strukturierte Daten, haben. Der Rumpf der E-Mail ist hingegen unstrukturiert, weil für den Text einer E-Mail kei- ne vorgegebene Struktur existiert. Experten schätzen, dass heute nur 15% der Daten strukturiert und ca. 85% der Daten unstrukturiert sind. 4 Die aktuelle Herausforderung für IT-Netzwerkarchitekten besteht also darin, heterogene Datenformate aus unterschiedlichen Datenquellen miteinander kompatibel zu machen, um sie anschließend analysieren, verknüpfen und aus- werten zu können. Die Integration dieser Daten ist aber komplex. Es müssen Informationen aus Bildern, Videos, MP3-Dateien, Streaming-Diensten, Micro- Blogging-Diensten, Blogs, Foren, Suchmaschinen, Klickprotokollen, E-Mails, Internet-Telefonie, digitaler Korrespondenz und/oder aus Sensoren lesbar ge- macht werden, damit am Ende aus den unterschiedlichen Rohdaten maschinen- lesbare Daten werden. Gerade bei Ton, Video- oder Bilddateien ist die Um- wandlung in einheitliche maschinenlesbare Daten technisch besonders heraus- fordernd. Hier müssen die zugrundeliegenden Algorithmen z.B. Sprache(n) ver- stehen und transkribieren, Gesichter oder Firmenembleme erkennen oder auch urheberrechtlich geschützte digitale Inhalte erkennen können. 5 In der von Tim Berners-Lee 6 initiierten Diskussion um das semantische Web 7 (Web 3.0) zur Weiterentwicklung des Internet der Dinge (Ubiquitous Computing) wird gefordert, dass die von Maschinen zusammengetragenen Informationen auch von anderen Maschinen gelesen und richtig eingeordnet werden können. Beispiele: Meint der Begriff „Golf“ im Kontext jetzt die Sportart, das Fahrzeug oder eine Meeresbucht im Atlantik; wie wandelt die elektronische Zahnbürste via Sensordaten eventuelle Zahnstein- oder Karies-Bildungen in maschinenlesbare 4 TNS Infratest GmbH – Geschäftsbereich Technology: Quo Vadis Big Data – Herausforderungen – Erfahrungen – Lösungsansätze, 2012. 5 Vgl.: Heuer, S. (2013). Kleine Daten, große Wirkung. Big Data einfach auf den Punkt gebracht. Seite 12. 6 Begründer des World Wide Webs. 7 Während das Internet eine Möglichkeit bietet, Daten miteinander zu vernetzen, zeigt das seman- tische Web einen Weg auf, um Informationen auf der Ebene ihrer Bedeutung miteinander zu ver- knüpfen. Die Daten in einem semantischen Web sind strukturiert und in einer Form aufbereitet, welche es Computern ermöglicht, sie entsprechend ihrer inhaltlichen Bedeutung zu verarbeiten. Zudem erlaubt ein semantisches Web Computern aus den vielen Informationen der weltweiten Daten Wissen herzuleiten und vor allem neues Wissen zu generieren. Big Data und der US - Wahlkampf 12 Während der letzten Wahlkampagne von Barack Obama kamen einige moderne Big- Data-Analyse-Tools zum Einsatz. Im Vorder- grund standen Fragen, inwiefern der Wir- kungskreis des Wahlkampfes verbessert wer- den kann bzw. wie die richtigen Wähler effektiv von jenen, die bereits verloren waren, zu un- terscheiden sind. Hierfür wurden soziodemo- grafische Daten herangezogen, also z.B. Daten aus dem Bereich Konsumverhalten (Informationen aus Loyality-Programmen, Einkaufsverhalten, Klickverhalten im Internet, etc.) sowie Daten aus sozialen Netzwerk- Plattformen (z.B. Profile bei Facebook). Sämt- liche Daten wurden mit den Wählerlisten korre- liert, um eventuelle Muster von jenen Men- schen zu erkennen, die nicht zur Wahl gehen wollen, aber dennoch für Obama stimmen würden. Mit Hilfe verschiedener Prognose- Instrumente (Predictive Analytics) wurden bis zu 100 Variablen in das System eingefüttert um somit das Wahlverhalten zu ermitteln. Datenschützer kritisieren, dass sich viele der Anwendungen in einem Graubereich befinden und die informationelle Selbstbestimmung der Individuen verletzt wird. Da die Gesetzeslage in den USA aber nicht mit deutschen oder europäischen Datenschutzrichtlinien überein- stimmt, konnten die diversen Datensätze der Wähler in den USA kombiniert und zu Wahl- zwecken ausgewertet werden. Quelle: http://www.predictiveanalyticsworld.com/patimes/eric- siegel-explains-how-the-obama-2012-campaign-used- predictive-analytics-to-influence-voters-2/ Big Data – die ungezähmte Macht 9 | 4. März 2014 Aktuelle Themen Sprache um, damit die Infos, wenn sie beim Zahnarzt ankommen, auch ausge- wertet werden können? Besonders interessant sind auch subjektive Äußerungen in Text-, Wort-, oder Videobeiträgen. Jede PR-, oder Wahlkampfagentur sowie Werbe- oder Marke- tingabteilung ist daran interessiert die Stimmungen oder Meinungen der Men- schen zu gewissen Themen möglichst in Echtzeit einzufangen. Um die zum Teil emotionalen Äußerungen zu Produkten, Marken oder Ereignissen maschinen- lesbar zu machen, werden intelligente Analyse-Instrumente und Algorithmen benötigt, die wertende Aussagen erkennbar machen. Dies wird künftig sicherlich die Königsdisziplin im Bereich Big Data werden, weil es technisch besonders herausfordernd ist und weiterer Forschung bedarf. Zusätzlich zu den gängigen drei Charakteristika wird von Experten inzwischen ein weiteres „V“ diskutiert: — Veracity 8 (Richtigkeit, Zuverlässigkeit von Daten) Insbesondere bei subjektiven Stimmungs- oder Meinungsäußerungen sind be- stimmte Ereignisse und Daten naturgemäß nicht vorhersehbar. Ähnlich verhält es sich bei Wetterdaten, seismologischen Messdaten, makroökonomischen Indikatoren oder Prognosedaten. Gerade für komplexe Berechnungen von Sze- narien in der Wissenschaft sind aber derartige Prognosedaten elementar wich- tig. Doch trotz der Relevanz dieser Daten kann die Unsicherheit – analytisch gesehen – nicht durch irgendwelche Bereinigungsmethoden eliminiert werden. Wie so oft bei jungen Technologien steckt die wissenschaftliche Potenzialanaly- se auch bei Big Data (noch) in den Kinderschuhen. Daher bleiben einige Fragen weiterhin unbeantwortet. Aus den Datenanalysen können natürlich Risiken ab- geleitet werden, die mit Hilfe entscheidungstheoretischer Ansätze und unter- schiedlichen Wahrscheinlichkeiten benannt werden können; es gibt aber auch unsichere Faktoren, die nicht vorhersehbar sind, sogenannte schwarze Schwä- ne. 9 Die Notwendigkeit, Unsicherheiten zu erkennen und sie möglichst realis- tisch einzubeziehen, ist eine weitere Eigenschaft von Daten und eine perma- nente Herausforderung, für die auch Big Data kein Allheilmittel darstellt. Quellen/Treiber von Big Data: Branchenübergreifender digitaler Strukturwandel Die Fülle an möglichen Datenquellen ist schier unerschöpflich. Sie lassen sich nach ihrem Ursprung grob in drei Gruppen unterteilen. Oft werden die Daten auch durch eine Kombination der drei Gruppen generiert: 10 — Von Maschinen generierte Daten: z.B. Sensor- oder Logdaten 11 , Spra- che/Audio/Video, Klickstatistiken, Datendienste. — Von Menschen generierte Daten: z.B. Social Networking, Korrespondenz, Publikationen/Patente, Bilder, Freitext, Formulare, Protokolle, Open Da- ta/Web Content, Sprache/Audio/Video; — Geschäftsdaten: z.B. Stamm- und Falldaten, CRM 12 - und Transaktionsda- ten. 8 Schroeck, M. et al. (2012). Analytics: Big Data in der Praxis. Wie innovative Unternehmen ihre Datenbestände effektiv nutzen. Seite 4f. 9 In Anlehnung an „Der schwarze Schwan: Die Macht höchst unwahrscheinlicher Ereignisse“, von Nassim Nicholas Taleb (2007). Im Prinzip geht es darum, dass bei Unsicherheit keine Eintritts- wahrscheinlichkeiten verfügbar sind, während in Risikosituationen Eintrittswahrscheinlichkeiten für Ergebnisse bzw. Umweltzustände gegeben sind. 10 Vgl. Fraunhofer IAIS (2012). Big Data – Vorsprung durch Wissen. Seite 20. 11 Eine Logdatei/Protokolldatei enthält das automatisch geführte Protokoll aller oder bestimmter Aktionen von Prozessen auf einem Computersystem. 12 CRM = Customer Relationship Management (dt. Kundenbeziehungsmanagement oder Kunden- pflege). 88 73 59 57 43 42 42 41 41 40 38 34 0 15 30 45 60 75 90 Transaktionen Protokolldaten Ereignisdaten E - Mails Soziale Medien Sensoren Externe Daten - Feeds RFID - Scans oder POS - Daten Freiformtext Geodaten Audiodaten Standbilder/ Videos Hauptsächlich interne Quellen 14 % der Befragten (n pro Nennung=557 - 867 aus 1.144), 2012 Quellen: IBM Institute for Business Value, Saïd Business School Oxford 0,5 0,9 1,3 1,9 2,6 3,3 3,9 4,5 5,1 5,6 0 1 2 3 4 5 6 10 11 12 13 14 15 16 17 18 19 Quelle: Ericsson Mobility Report 2013 Weltweiter Bestand an Smartphones 13 Mrd. Big Data – die ungezähmte Macht 10 | 4. März 2014 Aktuelle Themen Zu den dominanten Treibern zählen sicherlich die flächendeckende Durchdrin- gung der Digitalisierung (digitaler Strukturwandel) von Infrastrukturen in den Bereichen Energie, Gesundheit, Verkehr, Bildung oder der öffentlichen Verwal- tung sowie die zunehmende private und berufliche Nutzung mobiler, web- basierter Endgeräte. Sei es beim Surfen im Internet, wo rund um die Uhr einzel- ne Klicks der Nutzer mit Hilfe von Tracking-Software verfolgt und gespeichert werden, oder bei der Erfassung von Orts- und Bewegungsmustern die über RFID 13 , Infrarot oder Wireless-Technologien (z.B. NFC [Near Field Communica- tion]) erfasst werden, um Aufenthaltsorte von Individuen sichtbar zu machen. Es werden permanent Film- und Musikdateien hoch- und runtergeladen sowie Streaming-Dienste in Echtzeit genutzt. Gleichzeitig interagieren Millionen von Nutzern auf sozialen Netzwerk-Plattformen und produzieren digitale Inhalte, die ebenfalls in Echtzeit viral gestreut werden. All das führt zu einer explodierenden Datenmenge, die einerseits wertvoll sein kann, andererseits aber auch hohe Anforderungen an die Infrastruktur und Architektur der IT-Systeme stellen. Tatsächlich verhält es sich jedoch so, dass die umfangreichsten Datenbestände nicht von sozialen Netzwerk-Plattformen stammen. So sind z.B. alle Kurznach- richten einer Micro-Blogging-Plattform (Tweets) zu bestimmten Themen längst nicht so umfangreich wie Datensätze aus der Industrie und/oder der Wissen- schaft. Große Datensätze stammen z.B. von geophysischen Messanalysen auf Ölplattformen oder von Seismographen und Wetterstationen sowie aus komple- xen Berechnungen von Szenarien der naturwissenschaftlichen oder Ingenieurs- Disziplinen. Ein Teil der großen Datensätze stammt sicherlich auch aus dem global vernetzten Finanzsektor. Alleine die digitalen Handelssysteme generieren sekündlich Millionen von Transaktionen, die gespeichert und in Echtzeit ausge- wertet werden könn(t)en. Der digitale Strukturwandel als Haupttreiber für Big Data bietet insbesondere für die Sensorik 14 sowie die Biometrie als essentielle Schlüsseltechnologien ein enormes experimentierfreudiges und lukratives Einsatzgebiet. Diese Technolo- gien haben quasi die Funktion eines Turboladers im Bereich Big Data, weil Sensoren an immer mehr alltäglichen (massenmarkttauglichen) Gegenständen, Maschinen oder sonstigen Objekten angebracht werden. Damit kommen die Menschen ihrem Ziel, alles um sie herum messbar zu machen, näher. Diesem relevanten und dynamischen Treiber widmen wir daher das kommende Kapitel: 3. Sensorik und Biometrie erobern die Massenmärkte Die Eroberung der Massenmärkte durch Sensoren und biometrische Erken- nungsverfahren ist mitunter dadurch zu erklären, dass sich mittlerweile eine Vielzahl diverser Sensoren in jedem Smartphone/Tablet oder sonstigen mobi- len, web-basierten Endgeräten befindet. Immer mehr Nutzer kommen auf die- sem Wege mit der Sensortechnologie oder der Messung individueller Körper- merkmale in Verbindung. Durch die stabiler und schneller werdenden Mobil- funknetze sind viele Menschen mit ihren mobilen Endgeräten auch permanent mit dem Internet verbunden, was der Konnektivität „Maschine zu Mensch“ bzw. „Maschine zu Maschine“ einen zusätzlichen Schub verleiht. Die eingearbeiteten Sensoren unterstützen die Entwicklung neuer Funktionen bei Internetdiensten, beispielsweise via Apps, und werden täglich millionenfach genutzt. Gemessen werden können Temperaturen, Distanzen, Längen, Licht, Zeit, Tie- fen, Geschwindigkeiten, Körpermerkmale, Gewichte, etc. Kein Bereich der 13 Die RFID-Technologie (engl. radio frequency identification) ermöglicht die automatische Identifi- zierung und Lokalisierung von Gegenständen und Lebewesen und erleichtert damit erheblich die Erfassung von Daten. 14 Die Sensorik umfasst in der Technik die Wissenschaft und die Anwendung von Sensoren zur Messung und Kontrolle von Veränderungen von umweltlichen, biologischen oder technischen Systemen. 59 53 47 44 35 34 31 24 13 1 0 20 40 60 Mobile Internetnutzung Cloud Computing IP - basierte Kommunikation Social Media Video - Streaming/ Media Distribution Digitalisierung von Geschäftsmodellen Collaboration (File Sharing, etc.) Machine to Machine (Sensorik, Logistik, … Online Gaming/ Entertainment Sonstige Globale Treiber für Big Data 16 Umfrage dt.Unternehmen > 500 MA, Mehrfach - nennungen möglich [n=100], %, 2012 Quelle: Eine Studie der Experton Group AG im Auftrag der GmbH & Co. oHG 839 1.803 4.934 1.585 1.263 0 2.000 4.000 6.000 8.000 10.000 12.000 11 12 13 14 15 16 17 18 19 Lateinamerika Nordamerika Asien Pazifik Zentral - und Osteuropa Westeuropa Datenverkehr mit Smartphones 15 Quelle: Ericsson 2013 Petabytes pro Monat Big Data – die ungezähmte Macht 11 | 4. März 2014 Aktuelle Themen Mess-, Steuer-, Regelungs- oder Automatisierungstechnik kommt heutzutage ohne Sensoren aus. Moderne Mikroelektronik, die Miniaturisierung von Senso- ren, die somit immer kleiner, leistungsfähiger und günstiger werden, verstärken diese Entwicklung zusätzlich. Mobile Endgeräte beinhalten u.a. Bewegungssensoren, Lichtsensoren, Höhen- messer, digitale Kompasse, Fingerabdruck-, Gang- oder Spracherkennungs- sensoren, Näherungssensoren etc. Letztere sorgen beispielsweise dafür, dass sich die berührungsempfindliche Oberfläche des Gerätes (Touchscreen) auto- matisch deaktiviert, wenn es ans Ohr gehalten wird. Zunehmend wird in mobilen Endgeräten auch mit biometrischen Erkennungstechnologien experimentiert. Mit einem Bewegungssensor oder Mikrofon kann z.B. das Gehen, Laufen, Spre- chen oder Fahren gemessen werden. Durch bestimmte Algorithmen lassen sich dann Gang-, Sprach- oder Fahrprofile erstellen und im Smartphone oder ande- ren mobilen Endgeräten speichern, d.h. Smartphones erkennen ihre Besitzer am Gehen, Sprechen oder Fahren. 15 Die Sensorik und die Biometrie spielen folglich eine entscheidende Rolle für die Informationsgewinnung aus der umgebenden Umwelt, aus Prozessen und Ver- fahren in der Medizin, aus der Robotik oder der Fahrzeugtechnik sowie der Haushalts- und Bürotechnik. Die damit einhergehende stetig steigende Informa- tionsflut der smarten Verbindung von Gegenständen wird das bisherige Vorstel- lungsvermögen vieler Menschen sprengen und neue Möglichkeiten der Vernet- zung mit sich bringen. Die somit generierten Datenmengen können nur noch mit spezialisierter Hard- und Software verarbeitet werden. Sowohl für die Wirtschaft als auch für die Wissenschaft bieten die Technologien viel Raum für Experimen- te, Forschung und Entwicklung, gepaart mit hohen Wachstumsaussichten. All die einzelnen Datenpunkte stellen neue und vor allem steigende Anforde- rungen an bestehende IT-Netzwerkarchitekturen, um die wachsenden Daten- mengen möglichst rasch, flexibel und zu niedrigen Kosten verarbeiten zu kön- nen. Die Zukunft wird für jene Entscheidungsträger lukrativ werden, die diese Daten nicht nur erheben und speichern, sondern in maschinenlesbare Struktu- ren umwandeln, Muster erkennen und die richtigen Schlüsse ziehen. Um aber die gewünschten Effizienzsteigerungen zu erreichen, müssen zuerst sämtliche Datenquellen a) in ein maschinenlesbares Format gebracht werden und b) miteinander in Verbindung gesetzt werden. Denn nur so können die un- terschiedlichen Daten mit weiteren Standortdaten von Smartphones oder RFID- Technologien, mit Transaktionsdaten aus dem Online-Handel oder mit Profilda- ten aus sozialen Netzwerken korreliert werden. Daraus können dann neue un- geahnte, versteckte und überraschende Zusammenhänge herausgefiltert wer- den, die den jeweiligen Akteuren einen Mehrwert stiften werden. Die IKT-Konvergenz als Basis für ungeahntes Innovationspotenzial Künftig wird die Vernetzung von Alltagsgegenständen, die miteinander kommu- nizieren und den Menschen im Alltag einen höheren Nutzen stiften, vermehrt in den Mittelpunkt rücken. Die jeweiligen Technologien werden in die Umgebung und in die tägliche Handlung des Menschen möglichst flexibel eingebunden und bieten dadurch als moderne Schnittstelle zwischen Mensch und Maschine neue (digitale) Geschäftsmodelle. Die Verschmelzung von IKT geht auch einher mit der Diskussion um den Begriff „Internet der Dinge“. Dahinter verbirgt sich die Vision, dass das Internet eine Brücke zwischen der realen und der virtuellen Welt schlägt, und viele Alltagsgegenstände aus den Arbeits- und Lebenswelten 15 Dadurch kann sich der Besitzer eines Smartphones relativ leicht für diverse Transaktionen oder Aktivitäten im Netz authentifizieren ohne die Eingabe von Passwörtern oder Codes, weil individu- elle Bewegungsmerkmale einzigartig sind. Siehe hierzu auch Dapp, T. (2012). Der vermessene Mensch. Biometrische Erkennungsverfahren und mobile Internetdienste, Seite 7ff. Mobile Endgeräte bieten eine Fülle an Sensoren … … sowie zunehmend auch biometr i- sche Erkennungsverfahren 227 521 766 855 3.931 5.602 4.612 3.587 2.883 0 2.000 4.000 6.000 8.000 10.000 11 12 13 14 15 16 17 18 19 Mobile PC/Router/Tablet Smartphone Trad. Mobiltelefon Quelle: Ericsson 2013 Weltweiter Bestand an mobilen Endgeräten 17 Mio. Big Data – die ungezähmte Macht 12 | 4. März 2014 Aktuelle Themen der Menschen „smart“ zusammenführt (Smart Home, Smart City, Smart Glass, Smart Grid, Smart Car, Smart „Everything“). Das können Gegenstände wie Smartphones, Tablets, häusliche Elektronik, Fahrzeuge, Ampeln, Parkplätze, Sportgeräte, Kleidung, aber auch Gebäude, Liefercontainer und Maschinenan- lagen aus der Industrie sein (auch bekannt unter dem Begriff Industrie 4.0). Die Gegenstände werden durch Programmierbarkeit, Speichervermögen, Sen- soren und Kommunikationsfähigkeit intelligent und können u.a. web-basiert sowie kabellos eigenständig Informationen austauschen. Durch die gemeinsa- me Kommunikation können diverse Aktionen ausgelöst sowie wechselseitige Steuerung vorgenommen werden. Dabei dienen die mit dem Internet verbunde- nen Gegenstände auch als physische Zugangspunkte zu diversen Internet- diensten, womit der zunehmende Wunsch vieler Menschen nach digitaler Mobi- lität befriedigt werden kann. In diesem eher jungen Forschungsfeld schlummern noch weitreichende und ungeahnte Möglichkeiten, um künftige Wertschöpfung voranzutreiben, wie folgende Beispiele zeigen: Waschmaschinen kommunizieren mit Kleidung Beispielsweise können im Bereich der häuslichen Umgebung web-basierte Ja- lousien oder vernetzte Heizkörper sowie Klimaanlagen via Smartphone fernge- steuert werden. Waschmaschinen aktivieren künftig ihren Waschvorgang auto- matisch erst dann, wenn der Strom gerade günstig ist. Thermometer in der Waschmaschine sind in der Lage, die Wassertemperatur so zu steuern, dass die Enzyme im Waschmittel optimal wirken können. Intelligente Kleidung kann der Waschmaschine übermitteln, dass sie nur mit 40° und im Schonwaschgang gewaschen werden darf und die Farbe Blau hat. Im Alter noch selbstbestimmt handeln können Wenn es darum geht, im hohen Alter noch selbstbestimmt und möglichst lange in den eigenen vier Wänden wohnen zu können, bieten Sensoren bzw. kognitive Assistenzsysteme künftig aktive Unterstützung in den Bereichen Mobilitätserhal- tung, physische Assistenz, Kommunikationsunterstützung, medizinisches Monitoring sowie medizinische Behandlung. 16 So lassen sich Bewegungssenso- ren in den Fussboden einarbeiten, die automatisch einen Notalarm auslösen, sobald ein Mensch stürzt. Monitoring-Systeme können permanent medizinisch relevante Daten, wie Blutdruck, Herzschlag, Sauerstoffsättigung des Blutes oder den Stresslevel eines älteren Patienten erfassen. An einem Badezimmerspiegel angebrachte Miniatursensoren werden demenzkranke Menschen daran erin- nern, dass sie ihre Medikamente noch einnehmen oder sich noch die Zähne putzen müssen. Mit Hilfe von Sensoren kann z.B. auch gemessen werden, wenn Menschen beim Führen eines Pkw einen Schweißausbruch bekommen oder sonstige Symptome zeigen, die auf eine plötzliche körperliche Störung bis hin zum Herzinfarkt oder eine Krankheit hinweisen. Damit lassen sich dann Technologien entwickeln, die auf diese erfassten Muster reagieren und z.B. die Geschwindigkeit drosseln, das Fahrzeug via Autopilot sicher am Straßenrand zum Halten bringen und automatisch den Notdienst alarmieren. Vernetzungspotenzial in der Industrie Ein ähnliches Vernetzungspotenzial existiert auch bei Maschinenanlagen und Produktionsketten in branchenübergreifenden Industrien. Im Automobilsektor wird beispielsweise in Bezug auf das „vernetzte Fahren“ daran gearbeitet, dass die Elektrik und Elektronik im Fahrzeug mit dem Internet verbunden werden. Die 16 Vgl.: Beck, S. , M. Grzegorzek et. al. (2013). Mit Robotern gegen den Pflegenotstand. Big Data – die ungezähmte Macht 13 | 4. März 2014 Aktuelle Themen Mobilitätsbedürfnisse der Fahrzeughalter ändern sich. Sie erwarten in ihren Fahrzeugen einen ähnlichen Komfort sowie ähnliche Funktionen wie bei mobi- len und vernetzten Endgeräten. Künftig zählen also nicht nur Qualität, Sicherheit und zuverlässige Leistung des Fahrzeugs, der digitale Alltag der Menschen soll in einer möglichst personalisierten Art und Weise mit dem Führen eines Fahr- zeugs verbunden werden. Im Vordergrund dieser Entwicklung stehen mehrere Trends: Zum einen wird die Vision des automatisierte Fahrens mittelfristig Reali- tät, zum anderen werden sich langfristig effizientere, emissionsärmere Fahrzeu- ge durchsetzen. Durch den Brückenschlag zwischen industrieller und digitaler Welt werden neue Geschäftsmodelle den Markt erobern, welche moderne und vor allem personalisierte Dienstleistungen für den Fahrer in den Mittelpunkt stellen. Dazu zählen z.B. die cloud-basierte Spracherkennung, der Echtzeit- Austausch von Verkehrsflussdaten oder das vorausschauende, durch Online- und Navigationsdaten unterstützte Fahren, wie automatisiertes Bremsen, Gas geben und sogar lenken (teilautomatisierter Autopilot). Wenn künftig immer mehr Alltagsgegenstände über das Internet ansprechbar und kontrollierbar werden, genügen die Kommunikationsfähigkeiten der RFID- Technologien nicht mehr aus, um das ganze Konvergenz-Potenzial optimal zu nutzen. Die Alltagsgegenstände bekommen daher künftig eine eigene IP- Adresse, um mit anderen smarten Objekten und Netzknoten kommunizieren zu können. Aufgrund der großen Zahl benötigter IP-Adressen wird bei dieser Ent- wicklung künftig auf die neuere IPv6 17 -Version mit 128-Bit-Adressen zurückge- griffen, die allmählich die bisherige IPv4-Version ablöst. Das bedeutet aber auch, dass weitere Anstrengungen im Bereich Infrastruktur und Netzausbau unternommen werden müssen. Allerdings beurteilen Datenschutzexperten die Entwicklung zum Internet der Dinge durchaus kritisch, weil viele Sensoren auch ohne Einwilligung der Men- schen Daten an unterschiedliche Akteure zur Auswertung weiterleiten können. Somit wird schon heute die informationelle Selbstbestimmung verletzt. 4. Zur Rolle digitaler Ökosysteme in der Big-Data-Welt Der Begriff Big Data wird je nach Verwendung unterschiedlich diskutiert und interpretiert. Ein Reduzieren auf kommerzielle Interessen des Handels oder die Möglichkeiten, die mit Social-Networking-Anwendungen digitaler Ökosysteme, wie Amazon, Twitter, Facebook, Apple oder Google, möglich sind, wird dem Begriff sicherlich nicht gerecht. Denn Big Data bietet auch Potenzial, gesellschaftliche Probleme, z.B. im Be- reich der Medizin, des internationalen Cybercrimes oder im Klimawandel zu lösen oder zumindest zu lindern. Es steht auch für einen grundsätzlichen Wan- del in der Wissenschaft. Wenn Forscher bisher vorgefasste Modelle genutzt haben, um die Realität u.a. mit Stichprobenanalysen abzubilden, können zu- sätzlich datengetriebene Beobachtungen in Echtzeit mit einer weitaus größeren Grundgesamtheit ohne große Kosten herangezogen werden, um Prognosen mit mehr Informationen anzureichern. Im IT-Sicherheits- oder Finanzbereich bieten sich z.B. neue Möglichkeiten, Kreditkartenbetrüger schneller dingfest zu ma- chen 18 bzw. Risiken und Compliance-Angelegenheiten besser einzuschätzen; die Produktion eines Unternehmens im Verarbeitenden Gewerbe kann mit mehr Effizienz gefahren werden; Logistikketten lassen sich optimieren sowie sensible Infrastrukturen sicherer gestalten. Medizinische Forschungsergebnisse lassen sich mit anderen Forschungsfeldern kombinieren, um eventuelle versteckte Er- 17 http://de.wikipedia.org/wiki/Ipv6. 18 Aus einer Vielzahl von Daten zur Kreditkartenkriminalität wird das Verhaltensmuster von Kredit- kartenbetrügen herausgefiltert, um es mit aktuellen Fällen zu vergleichen. Das Ziel ist, herauszu- finden, mit welcher Wahrscheinlichkeit ein Betrüger seine nächste Tat begeht. Alltagsgegenstände bekommen eine eigene Internetadresse Datenschutz - Experten warnen Die gute Seite der Macht 18 16 15 13 13 10 8 7 0 5 10 15 20 Größere Bandbreite an Infos Neue Arten von Daten und Analysen Echtzeitinformationen Zustrom von Daten aus neuen Technologien Moderne Medienarten Große Datenmengen Das neue Modewort Daten aus sozialen Medien Big Data wird breit interpretiert 18 % der Befragten (n=1.144), 2012 Quellen: IBM Institute for Business Value, Saïd Business School Oxford Big Data – die ungezähmte Macht 14 | 4. März 2014 Aktuelle Themen kenntnisse zu gewinnen und/oder seltene Krankheiten zu heilen. Darüber hin- aus lassen sich Kosten dauerhaft senken, die Entscheidungsgrundlage optimie- ren, das Konsumverhalten und die Zufriedenheit der Kunden genauer analysie- ren und/oder zielgruppenspezifische Produkte und Dienstleistungen erstellen. Big Data haftet aber auch eine dunkle Seite (der Macht) an. Im Zuge der Big- Data-Debatte werden zunehmend auch Orwell`sche Big-Brother-Methoden à la „1984“ 19 bzw. unverhältnismäßige Überwachungsvorhaben diskutiert. Hier ent- stand auch die Vision des gläsernen Menschen. Im Gegensatz zu Orwell domi- niert in der Big-Data-Diskussion allerdings kein diktatorisches System und die Menschen partizipieren zunächst freiwillig, während sich im Hintergrund diverse Interessen unterschiedlicher Akteure (Handel, Wissenschaft, NGOs, Geheim- dienste etc.) tummeln. Im Fokus steht aber die durchaus nachvollziehbare Sor- ge, dass Bürger und Konsumenten zunehmend zu einem Spielball einiger Ak- teure werden bzw. sich (unfreiwillig) zum gläsernen Individuum entwickeln. So scheint Orwells Roman z.B. mit Blick auf die Geheimdienst-Affäre einigen Beobachtern näher an der Realität als jemals zuvor. 19 Der Roman von George Orwell (1949) wird häufig genannt, wenn unverhältnismäßige, staatliche Überwachungsmaßnahmen diskutiert werden. Die dunkle Seite der Macht Digitale Ökosysteme bescheren uns „Smart Everything“ DX Grafik: Oliver Ullmann. Deutsche Bank Research. Quelle: Dapp, T. (2014). Big Data – die ungezähmte Macht. Deutsche Bank Research. Frankfurt am Main. Big Data – die ungezähmte Macht 15 | 4. März 2014 Aktuelle Themen Die Ziele digitaler Ökosysteme sind weitreichender als von vielen angenommen Einerseits entstehen also viele nützliche Produkte und Dienste, die den Men- schen bei alltäglichen und routinemäßigen Handlungen unterstützen sollen, wie die oben erwähnten Sensorik-Beispiele im Pflegebereich. Andererseits stehen aber digitale Ökosysteme im Verdacht, Geschäftspraktiken zu betreiben, die nicht ausschließlich den primären Nutzen des Produktes oder die Dienstleistung für den Kunden in den Mittelpunkt stellen. So können einmal erhobene Daten teils zweckentfremdet und ohne den Nutzer zu informieren mehrfach genutzt bzw. monetarisiert werden. Wenn z.B. Google eine web-basierte Brille anbietet oder an der Entwicklung autonom fahrender Fahrzeuge forscht, dann umfasst dies mehr als nur das An- gebot eines selbstfahrenden Autos und mehr als nur das Angebot einer mit dem Internet verbundenen Brille. Beide Produkte erlauben einen beinahe schranken- losen Zugriff auf teils intime und persönliche Daten. Ein einzelnes Unternehmen bekommt Einblicke in die täglichen Handlungsweisen der Menschen, deren Aktivitäten, Neigungen und Identitäten. Eine web-basierten Brille offenbart z.B., wohin die Blicke der Menschen zielen, wie lange und wie oft sie ihre Blicke auf Gegenstände, Werbung oder Menschen richten. Damit erhält das Unternehmen die Möglichkeit, die Big-Data-Analyse-Instrumente optimal in Echtzeit einzuset- zen, um wertvolle Muster aus den gesammelten Daten zu ziehen, diese gege- benenfalls zu monetarisieren bzw. Menschen individuelle Werbebotschaften zu senden. Die Begehrlichkeiten der großen Internetunternehmen, diese zusätzli- chen Informationen für unterschiedliche Zwecke mehrfach zu nutzen, nehmen zu, während die gesellschaftlichen Folgen (bis jetzt) weitgehend unerforscht sind. Auch das autonom fahrende Fahrzeug wird diejenigen, die es nutzen, völlig gläsern erscheinen lassen. 20 Während des Gebrauchs, aber auch über die ge- samte Nutzungsdauer hinweg, können alle möglichen Informationen gemessen, gesammelt und anschließend ausgewertet werden. Dabei werden mittelfristig natürlich Muster zu beobachten sein, die folgende Fragen künftig beantworten können: Wohin fahren die Menschen? Zu welcher Tages- und Nachtzeit nutzen sie das Fahrzeug? Wo arbeiten sie und was sind beliebte Freizeitziele? Wie lange sitzen sie durchschnittlich im Fahrzeug, welche Musik wird gehört, welche Temperaturen werden präferiert, mit wem wird kommuniziert/telefoniert und welche digitalen Inhalte werden während der Fahrt konsumiert? Halten sie sich an die vorgeschriebene Geschwindigkeit, konsumieren sie während der Fahrt Lebensmittel/Getränke/Tabak etc? Jede beschriebene Aktion könnte folglich von einem Unternehmen monetarisiert werden. Mit jeder Aktion wird Geld ver- dient, indem entweder maßgeschneiderte Produkte und Dienste aus einer Hand angeboten werden oder die persönlichen Daten an interessierte Akteure bran- chenübergreifend weiterverkauft werden. Vor allem gelingt es so, die Menschen künftig auch im realen Leben auf Schritt und Tritt zu begleiten und somit die entscheidende Brücke zu schlagen zwischen virtueller und realer Welt. Die Zahlungsströme müssen also nicht zwingend von den Endkonsumenten eines gewissen Angebots direkt an den Anbieter fließen. Stattdessen kann die- ser seine Einnahmen auch dadurch maximieren, dass die gesammelten Daten dritten Unternehmen zur Verfügung gestellt werden. Für Start-Ups oder Ni- schenanbieter wird es somit möglich sein, sich an Ökosysteme mit hohen Markt- anteilen anzudocken, um komplementäre Produkte und Dienste anzubieten, die das Leistungsangebot für den Nutzer noch attraktiver machen. Denkbar sind natürlich auch Übernahmen durch digitale Ökosysteme. 21 Somit ändert sich 20 Morozov, E. (2013). Big Data. Warum man das Silicon Valley hassen darf. FAZ.10.11.2013. 21 Siehe z.B. http://www.spiegel.de/wirtschaft/unternehmen/google-kauft-nest-labs-fuer-3-2- milliarden-dollar-a-943362.html. Automatisiertes Fahren: Einst eine Vision, heute schon Realität Viele Monetarisierungsstrategien Big Data – die ungezähmte Macht 16 | 4. März 2014 Aktuelle Themen auch die Wettbewerbssituation und einzelne Unternehmen bauen ihre Markt- stellung aus. Das Silicon Valley als globaler Innovationstreiber Die digitalen Fußabdrücke der Internet-Nutzer werden immer deutlicher, präzi- ser und leichter aufzuspüren. Alleine auf Plattformen der beliebten digitalen Ökosysteme wie Google, Twitter, Facebook, LinkedIn, Amazon oder Apple hinterlegen sie teils ohne Scheu private und intime Informationen, wie Bezie- hungsstatus, Freizeitinteressen, Reisegewohnheiten, Konsumgewohnheiten, präferierte Musik- und Filmgenre, Fotografien und „liken“ querbeet alles, was ihnen im Netz unter den Finger bzw. den Cursor kommt. Jede gefolgte oder selbst erstellte Kurznachricht auf Micro-Blogging-Diensten steht für eine individuelle Präferenz. Durch die Auflistung der gesamten Tweets kann relativ einfach ein Profil über politische oder gesellschaftliche Neigungen der Individuen erstellt werden. Auf Facebook oder vergleichbaren sozialen Netzwerken können anhand der geposteten Beiträge und der Vernetzung zu anderen Nutzern relativ einfach Aufenthaltsorte, Interessen, Hobbies oder sexuelle Neigungen abgelesen und zusammengeführt werden. Viele Internetnutzer kommen an einigen digitalen Ökosystemen kaum noch vorbei, egal, ob sie privat oder beruflich im Internet surfen. Für alle möglichen Lebens- und Arbeitsbereiche werden nützliche und beliebte Internet-Dienste „aus einer Hand“ angeboten, z.B. Suchmaschinendienste, Betriebssysteme für diverse Endgeräte, E-Mail-Dienste, Navigation, Cloud-, Streaming-, und Wiki- Dienste sowie eigene Märkte für digitale Güter (iStore, Playstore, etc.). Selbst ohne eine Registrierung bzw. ohne ein E-Mail-Konto können die Suchanfragen der Nutzer gespeichert und ausgewertet werden, um Profile zu erstellen. Dahin- ter verbirgt sich u.a. das Ziel, so viele Informationen (z.B. personenbezogene Daten) wie möglich digital zu organisieren. Jedoch entfaltet sich das gesamte Nutzungspotenzial erst dann, wenn sich die Internetnutzer registrieren. Der Ratschlag zur Datensparsamkeit, sollte sie bevorzugt werden, bietet auch keine Lösung – vor allem, weil auch die Nicht-Teilnahme in der digitalen Welt Spuren hinterlässt, die Rückschlüsse auf einzelne Personen und deren Verhal- ten erlauben (z.B. durch Re-Anonymisierungsmaßnahmen). Es zeigt sich, dass die Anonymisierung bei der Weitergabe personenbezogener Daten nicht aus- reicht, um Privatsphären zu schützen, denn bereits einzelne Suchanfragen (evtl. kombiniert mit weiteren Daten) lassen exakte Rückschlüsse auf die Urheber der Daten zu – auch dann, wenn Username oder IP gelöscht wurden, so geschehen bei der anonymisierten Weitergabe von Suchanfragen bei AOL. 22 Das Internet dient als Spielwiese für eingezäunte, digitale Ökosysteme Nicht nur Google, sondern auch weitere Internetfirmen, wie Apple, Facebook oder Amazon, werben mit vielen attraktiven, modernen (sozialen) und teils kos- tenfreien IKT-Diensten. Diese Ökosysteme profitieren von einer relativ hohen, loyalen Kundenzahl im dreistelligen Millionenbereich und verfügen über ausrei- chend liquide Mittel, mit denen sie weitere Innovationen vorantreiben können. Zudem erhöhen sie Attraktivität, indem sie für eine hohe Verfügbarkeit von zu- sätzlichen, komplementären Internet-Diensten und Apps innerhalb ihrer um- zäunten Spielwiesen sorgen. In regelmäßigen Abständen werden komplementä- re Internet-Dienste mittels strategischer Allianzen mit Dritt- oder Nischenanbie- tern oder durch Übernahmen auf dem Markt angeboten. Die Innovationsrate 22 http://www.nytimes.com/2006/08/09/technology/09aol.html?_r=0. 23 Vgl.: Bahr, F. et al. (2012). Schönes neues Internet? Chancen und Risiken für Innovation in digi- talen Ökosystemen. Seite 3ff. Im Internet werden pro Minute… 19 100 Stunden Videomaterial auf YouTube hochgeladen 4.112.500 Google - Suchanfragen getätigt 3.300.000 Einträge auf Facebook geteilt 347.000 Tweets auf Twitter versandt 48.000 Apps bei Apple heruntergeladen 38.200 Fotos auf Instagram geteilt Quellen: Youtube, Google, Facebook, US Securities and Exchange Commission, Apple, Instagram … schreitet branchenübergreifend voran Starker Lock - In - Effekt Die Ökosystemisierung 23 im Internet … Big Data – die ungezähmte Macht 17 | 4. März 2014 Aktuelle Themen dieser technologiegetriebenen Internetunternehmen ist zumindest beachtlich und sucht auf deutscher bzw. europäischer Ebene ihresgleichen. Zudem ist zu beobachten, dass die großen Internet-Plattformen ihre Fühler zu- nehmend auch außerhalb ihrer ohnehin größer werdenden Kernkompetenz ausstrecken und somit branchenübergreifend bestehende Wettbewerbskonstel- lationen aufwirbeln und traditionelle Unternehmen unter Druck setzen. So inves- tiert Amazon in eigene mobile Zahlungsverkehrslösungen, in eigene TV-Produk- tionen und Cloud-Dienste für Premiumkunden 24 , während Google verstärkt im Bereich Haushaltsgegenstände und Robotik investiert und sogar eine neue Sparte mit humanoider Roboterentwicklung ins Leben ruft. 25 Digitale Ökosyste- me sind und bleiben beliebte und akzeptierte Plattformen. Durch die Nutzung der Dienste digitaler Ökosysteme entstehen Lock-in-Effekte, die relativ starke Wechselkosten nach sich ziehen. So steigen die Möglichkeiten für die Plattfor- men, die individuelle Aufmerksamkeit bzw. die persönlichen Daten der Nutzer im Netz mit Hilfe von Walled-Garden-Strategien zweckzuentfremden bzw. zu monetarisieren, weiter an. 26 Ambivalentes Verhalten der Menschen im Internet Bei all der durchaus berechtigten Kritik an digitalen Ökosystemen zeigt die Realität aber, dass viele Internetnutzer (noch) bereit sind, partielle Freiheitsgra- de an die Plattformbetreiber abzugeben, um die bevorzugten Internetdienste bequem und aus einer Hand zu konsumieren. Dabei ist die Präferenz hinsicht- lich Kostenfreiheit und Komfort offensichtlich häufig so groß, dass der Nutzer unwidersprochen persönliche und intime Daten von sich preisgibt, die Weiter- gabe an Dritte erlaubt, die heimliche Speicherung biometrischer Scans von Sprache und Gesicht zulässt sowie personalisierte Werbebotschaften in Kauf nimmt. Die Nutzer solcher Plattformen haben kaum Kontrolle über die Sicherheit des angebotenen Systems, über eventuelle Zugriffe auf persönliche Daten, über die Sicherheit und Verwendung ihrer Daten sowie deren Löschung. Dennoch über- lassen sie den großen Internet-Plattformen in den meisten Fällen die Kontrolle über ihre Daten und gehen davon aus, dass die Plattformen für die nötige Si- cherheit sorgen und die Nutzer vor Missbrauch schützen. Das Verhalten der Menschen auf digitalen Kanälen ist also durchaus ambivalent. Kritiker betonen vermehrt, es erhärte sich auch der Verdacht, dass der Internetnutzer selbst zum gehandelten Gut wird. Für viele Unternehmen bedeutet dies vor allem ein lukratives Geschäft. Der Großteil der Konsumenten wird weiterhin die Vielfalt an Services und personali- sierten Diensten trotz etwaiger Datenschutzbedenken nutzen. Einige werden allmählich den Eindruck gewinnen, dass sie zu einem hohen Grade manipulier- bar und transparent geworden sind, oder sich sogar ihrer Datenhoheit beraubt fühlen. Es bleibt zudem abzuwarten, ob die Menschen den relativ hohen Preis dieser individualisierten Dienste (umfassendes, persönliches, digitales Profil) mittel- bis langfristig weiterhin kritiklos zahlen oder versuchen, ihre Nachfrage nach Diensten und Produkten mehr und mehr zu verweigern bzw. zu substituie- ren. Aufgrund der momentanen marktlichen Wettbewerbssituation stellt sich jedoch zu Recht die Frage, ob sich bei einigen Internet-Diensten mittelfristig überhaupt ernstzunehmende Substitutionsmöglichkeiten auf dem Markt für den 24 Beispiel: Amazon steigt in den Markt für mobile Zahlungsverkehrslösungen ein. http://www.businessinsider.com/report-amazon-has-bought-square-competitor-gopago-2013-12. 25 http://www.zeit.de/digital/2013-12/google-roboterfirma. sowie http://www.zeit.de/wirtschaft/unternehmen/2013-12/google-roboter-android-erfinder-andy-rubin. 26 Vgl.: Dapp, T. (2013). Die Zukunft des (mobilen) Zahlungsverkehrs: Banken im Wettbewerb mit neuen Internet-Dienstleistern. Seite 21ff. Wofür nutzen die Menschen ihr Mobilfunkgerät? 20 54% surfen im Internet 37% halten sich in soziale n Netzwerken auf 17% shoppen online 21% teilen Dokumente, Videos etc. 26% schauen Videos und hören Musik 16% tätigen mobile Bezahlung n=4.500 aus 9 ausgewählten Ländern (DK, FR, DE, IT, NL, PL, RU, SE, GB) Quelle: Norton, 2012 Manipulation und Intransparenz Big Data – die ungezähmte Macht 18 | 4. März 2014 Aktuelle Themen Kunden etablieren werden/können und ob die Adaptionsgeschwindigkeit mo- derner Technologien sinkt aufgrund der Praktiken. Datenschützer sehen die Verknüpfung teils privater und intimer personenbezo- gener Daten zwischen einzelnen Internetfirmen unisono mit großer Besorgnis. Denn es wird zunehmend kritisch diskutiert, ob durch die eingezäunten Spiel- wiesen der digitalen Ökosysteme Innovationen, Kommunikations- und Informa- tionsströme kontrolliert sowie Datenschutzbestimmungen und Nutzerautonomie unterminiert werden. Weiterhin merken Datenschützer an, dass auf intranspa- rente Weise Nutzeraktivitäten zweckentfremdet monetarisiert werden. 27 5. Der ökonomische Wert von Daten „Sie verstehen nicht oder sie wolle n nicht wissen, dass sie so mit bauen an ei- nem digitalen Zwilling ihrer realen Person, der neben ihren Stärken eben auch ihre Schwächen enthüllt – oder enthüllen könnte. Der ihre Misserfolge und Ver- führbarkeiten aufdecken oder gar sensible Informationen über Krankheiten preisgeben könnte. Der den Einzelnen transparent, kalkulierbar und manipulier- bar werden lässt für Dienste und Politik, Kommerz und Arbeitsmarkt.“ [Bundes- präsident Joachim Gauck, 3. Oktober 2013, Stuttgart] Für eine optimale Analyse im Bereich Big Data sind einzelne Datensätze im Besitz eines einzelnen Unternehmens, isoliert betrachtet, nur bedingt nützlich. Erst, wenn mehrere Datenpunkte teils aus unterschiedlichen Quellen zusam- mengeführt werden, können bestimmte Muster herausgefiltert werden. Nur we- nige Unternehmen bieten so viele diverse Produkte und Dienste aus einer Hand an, um ein breites Spektrum an unterschiedlichen Kundeninformationen unter einem Dach zu versammeln. 28 Sofern es sich um personenbezogene Daten handelt, können dadurch umfassende und relativ detailgetreue Profile von Men- schen erstellt werden. Die unterschiedlichen Daten, die gespeichert, archiviert und ausgewertet werden, stammen größtenteils aus digitalen Werbe-, Informati- ons-, Transaktions- oder sonstigen Netzwerkkanälen. Relativ einfach lassen sich die Informationen über die jeweiligen Internetprovider, IP- oder E-Mail- Adressen sowie verwendete Suchmaschinen sammeln. Bei jedem Besuch auf der Amazon-Plattform werden diese Informationen z.B. gespeichert und in Kombination mit dem jeweiligen historischen Klick- und Konsumverhalten der Menschen ausgewertet. Nur so kann Amazon seinen Online-Kunden auch auf fremden Internetadressen bei jedem Besuch individualisierte Kaufempfehlungen anbieten, bzw. nur so funktioniert die Individualisierung im Internet per se. Durch die wachsende Datensammlung der Akteure lassen sich dann mit relativ geringem Aufwand virtuelle und reale Welt verknüpfen, sodass auch Wohnad- ressen und Telefonnummern der Individuen relativ leicht zu identifizieren sind. Darüber hinaus sind weitere Rückschlüsse, z.B. auf Immobilien- bzw. Mietpreise einer Wohngegend, Informationen über den Arbeitgeber und damit einherge- hend Daten zum Gehalt (zumindest innerhalb branchenüblicher Gehaltsbänder) und zum verfügbaren Einkommen möglich. Was würde geschehen, wenn die persönlichen Daten zusätzlich mit weiteren Informationen aus sozialen Netz- werken, mit Daten zum Konsumverhalten, mit Ortungsdaten (GPS-Tracking), Daten zum Beziehungsstatus oder zum Einkommen in Relation gesetzt wer- den? Die sich ergebenden Datenkorrelationen erlauben wiederum neue, rele- vante Rückschlüsse auf die persönlichen Neigungen und Identitäten. 27 Siehe Walled-Garden-Strategien in Kapitel 6 aus Dapp, T. (2013). Die Zukunft des (mobilen) Zahlungsverkehrs. Seite 21ff. 28 Google ist hier sicherlich die Ausnahme, da das Unternehmen aufgrund seiner Reichweite und seiner überdurchschnittlich hohen Datenmenge in der Lage ist, eigene Daten zu kombinieren. Schieflage in der Datenhoheit Wir haben einen „digitale n Zwilling“ Die Kombination aus diversen Date n- sätzen verspricht neue Erkenntnisse Big Data – die ungezähmte Macht 19 | 4. März 2014 Aktuelle Themen Digitale Fußabdrücke werden zu handelbaren und begehrten Profilen Stellen Sie sich folgendes Szenario vor: Sie gelangen aufgrund einer Daten- panne oder dank eines Whistleblowers zufällig an einen Datensatz zu Ihrer Per- son. Ihr Profil weist ziemlich detailgetreue Informationen auf, die von einem auf Datenerhebung spezialisierten Unternehmen oder von einem „befreundeten“ Geheimdienst stammen. In Ihrem Profil lesen Sie dann folgendes über sich: „ X ist männlich, 43 Jahre, promovierter Ingenieur, verheiratet mit V, weiblich, 37 Jahre; X lebt mit Individuum V in Ein-Familienhaus in Frankfurt und hält eine Katze; X bezieht regelmäßig das Magazin „Schöner Wohnen“ sowie das digitale Abo des „Maschinenbauers“ direkt auf sein mobiles Endgerät de r Marke A; X kauft regelmäßig Fach-Literatur, Kleidung und Elektronikgegenstände beim Onlinehändler A; X interessiert sich für diverse Umweltthemen und unterstützt mittels Dauerauftrag einige internationale NGOs; X interagiert mehrmals täglich auf diversen sozialen Netzwerk-Plattformen über mobile und stationäre Geräte und unterhält überdurchschnittlich viel Kontakt zu den Individuen H (männlich, 41 Jahre), S (weiblich, 29 Jahre), und K (weiblich 35 Jahre); X konsumiert Vi- deo-on-demand-Angebote und surft im Schnitt 1 bis 2 Stunden täglich ab 22:00 Uhr im Internet; X unterhält mehrere Kontoverbindungen zu den deutschen Banken D und P sowie der schweizerischen Bank U; X bevorzugt digitale, web- basierte Bezahlmethoden; X besitzt zwei Kreditkarten der Anbieter M und A, Kreditkarte M wird auch von Individuum V (Ehefrau) mitbenutzt, Umsätze lau- fender Monat der Kreditkarte A: Reiseführer Paris EUR 9,95, Flugreise nach Paris für 2 Personen EUR 379,00 Hotel Paris EUR 440,00 Gastronomie Paris EUR 90,00, Schmuck Paris EUR 399,00, Umsätze laufender Monat der ge- meinsam genutzten Kreditkarte M: keine Umsätze; X kauft regelmäßig Sportar- tikel für Outdoor-Aktivitäten; X lässt sich vermehrt Angebote diverser Kfz- Anbieter zumailen (ist folglich im Begriff, ein Fahrzeug zu kaufen/zu leasen/zu mieten); X vergleicht Preise von Stromanbietern (wägt eventuell einen Stroman- bieterwechsel ab); X bucht jährlich online Winterurlaube in Österreich und leiht im Voraus online die Ski-Ausrüstung bei zwei Anbietern (neigt ansonsten zu Fernreisen mit Individuum V und kurzen Städtereisen, zuletzt mit Individuum S (X unterhält höchstwahrscheinlich partnerschaftliche Beziehung zu Individuum S) 29 ; X bezieht mehrmals im Quartal rezeptpflichtige Medikamente (X ist Allergi- ker, neigt zu hohem Blutdruck), X besucht regelmäßig unterschiedliche Foren und partizipiert an Diskussionen zu seltenen Krankheiten (X benutzt hierfür ent- weder den anonymen Avatar „neugierig“ oder „curious_1970“). X besitzt Kfz- Haftpflicht-, Rechtschutz und Hausratversicherung von Unternehmen A; X be- zog 2012 juristische Dienste von Unternehmen A in einem Verkehrsdelikt- Prozess, der Prozess ist noch im Gange. Echtzeit-Zusatzinformation: Im Mo- ment hält sich Individuum X in der Seitensprungstraße 7 auf. Hier wohnt Indivi- duum S. “ Ein derartiges Personenprofil ist hinsichtlich der vielen digitalen Fußabdrücke, die der Mensch im Netz mittlerweile (auch unbewusst) hinterlässt, sowie der hierfür notwendigen Datenanalyse-Instrumente sicherlich realistisch und techno- logisch erstellbar. Auf diese Weise ist es den Akteuren möglich, kontextüber- greifend zeitliche Abläufe und digital erfasste Profile über Aufenthaltsorte, sozia- le Beziehungen, Konsum- und Mediennutzungsverhalten, Gesundheit, Einkom- men, Beruf etc. zu erstellen. 3031 Jede einzelne Information in diesem fiktiven Profil hat einen ökonomischen Wert mit wertvollen Anknüpfungs- bzw. Monetarisierungspunkten für unterschiedliche 29 An dieser Stelle wird nochmal auf die eingangs erwähnte Frage hingewiesen, ob Kreditkartenan- bieter aus den einzelnen Transaktionen ihrer Kunden vorhersagen können, bei wem eventuell ei- ne Ehekrise bevorsteht. Die Antwort lautet: Ja, sie können. 30 Vgl.: Weichert, T. (2013). Big Data: Das neue Versprechen der Allwissenheit. 31 Verwendet werden die englischen Begriffe „personalizing“, scoring“, „profiling“ oder „tracking“. Denn s ie wissen, was wir tun! Personenbezogene Daten haben einen hohen Preis 4 5 7 13 6 11 61 55 45 41 65 65 0 10 20 30 40 50 60 70 DE AT CH SE UK US 2012 2013 Angst vor Datendiebstahl 21 Umfrage, in % DE (n=571); AT (n=586); CH (n=476); SE (n=346); UK (n=435); US (n=409); Mehrfachnennungen möglich Quelle: eGovernment MONITOR 2013 Big Data – die ungezähmte Macht 20 | 4. März 2014 Aktuelle Themen Akteure aus Wirtschaft (z.B. Versicherungsunternehmen, Konsumgüterhersteller oder diverse Dienstleister) Wissenschaft (Neurowissenschaften, Soziologie, Verhaltenswissenschaften, etc.) oder Politik (z.B. Finanzamt, öffentliche Verwal- tungseinheiten, Geheimdienste). Die Menschen werden durch ihre digitalen Fußabdrücke zu transparenten (gläsernen) Individuen im Netz, ohne dass ihnen dies unter Umständen zu jedem Zeitpunkt ihrer Onlineaktivität bewusst wäre (z.B. (De)Aktivierung des GPS-Signals). Die Summe dieser Informationen wird zu individuellen digitalen Profilen aggre- giert, die je nach Angebot und Nachfrage einen Preis haben. Welcher monetäre Wert könnte einem einzelnen Kundenprofil bzw. diesem immateriellen Wert zugrundeliegen, vor allem, wie könnte er ermittelt werden? Ein einfaches Re- chenbeispiel kann dies illustrieren: Die Marktkapitalisierung z.B. von Facebook beträgt derzeit ca. EUR 70 Mrd. 32 . Facebook wirbt mit einer Anzahl an Facebook-Nutzern von über 1,2 Mrd. 33 Der monetäre Wert eines durchschnittli- chen Facebook-Nutzerprofils könnte sich durch simple Division auf ca. EUR 58 belaufen. Unter der weiteren Annahme, dass nur ca. zwei Drittel der Konten tatsächlich aktiv sind, erhöht sich der Wert auf ca. EUR 88. Dieser kalkulierte Wert könnte die Basis für Verhandlungen über den Preis einzelner Nutzerprofile zwischen Investoren oder sonstigen Akteuren sein. Ob sich diese Annäherung allerdings auch für die Berechnung eines „Return on Investments“ eignet, sprengt den Rahmen dieser Studie, zeigt aber auf, dass es bei Big Data bzw. beim Handel von Daten zum großen Teil um monetäre Interessen geht. Personenbezogene Daten werden zur virtuellen Währung im Netz Die Menschen bewegen sich also immer tiefer in einen datengetriebenen Alltag. Tägliche, routinemäßige Handlungen werden mit modernen web-basierten Technologien verbunden und erleichtern z.B. mit sogenannten Applikationen (Apps, Internet-Diensten) das Leben. Mit jedem Klick auf Onlineportalen, mit jedem Sprachbefehl auf mobilen Endgeräten oder jeder GPS-Ortung kann Zeit eingespart und können Suchkosten reduziert werden. Diese Dienste erhöhen somit die Effizienz und den Komfort (Convenience) im Alltag. Ihre Nachfrage ist ungebrochen. Die Dienste sind aber nicht umsonst und haben einen im Verhält- nis durchaus hohen Preis. Denn die Nutzung vieler beliebter web-basierter Dienste ist zwar kostenfrei, wird aber mit der i.d.R. (freiwilligen) Preisgabe indi- vidueller, digitalisierter Persönlichkeit bezahlt, was viele Nutzer im Moment ihrer Entscheidung unberücksichtigt lassen. Denkbar sind künftige Geschäftsmodelle, die den eigentlichen Datenlieferanten, also den Internetnutzern selbst, auch einen monetären Nutzen in Aussicht stellen. Gerade die Nutzung personenbezogener Daten weckt bei den Akteuren viele diverse Begehrlichkeiten und nährt die Hoffnung auf steigende Umsätze. Per- sonenbezogene Daten können einem Individuum direkt zugeordnet werden. Hierbei handelt es sich z.B. um Konto- oder Bonitätsdaten, Kreditkarteninforma- tionen, medizinische Diagnose- oder Gesundheitsdaten, Daten zu Konsum- und Mediennutzungsverhalten, Daten aus Videoüberwachungen oder biometrischen Erkennungsverfahren, Nutzungsdaten aus Applikationen (Apps) oder aus sozia- len Netzwerken, Sensordaten mobiler Endgeräte, Standortdaten, E-Mails, Chat- oder anderen Internet-Kommunikationsdaten. Viele Menschen sind sich der möglichen Gefahr (noch) nicht bewusst, dass eine Vielzahl unterschiedlicher Akteure und Algorithmen mit heterogenen Interessen und Zielsetzungen digitale Informationen sammeln und speichern, um sie zu einem späteren Zeitpunkt auszuwerten und eventuell zu monetarisieren. Im Internet werden die Menschen an unterschiedlicher Stelle und zum Großteil unbewusst individuell umworben 32 Stand: 24.01.2014 auf http://www.onvista.de/aktien/Facebook-Aktie-US30303M1027. 33 http://allfacebook.de/zahlen_fakten/infografik-10-unglaubliche-zahlen-zur-facebook-nutzung-10- jahre-facebook. Datengetriebener Alltag 75 74 73 64 57 53 48 46 30 30 27 26 25 25 0 20 40 60 80 Finanzinformationen Gesundheitsdaten Ausweisnummer Fingerabdruck Adresse Handynummer Fotos Name Karriereverlauf Identität von Freunden Meinung/Einstellung Nationalität Hobbys etc. Besuchte Webseiten Quelle: Europäische Kommission Was sind personenbezogene Daten? 22 % der Befragten, EU 27, 2011 (n=26.574) 56 52 42 41 47 0 20 40 60 Indien China US Westliches Europa Weltweit Quelle: IDC Digital Universe Study %, geschätzter Anteil ungeschützter Daten an schutzwürdiger Gesamtdatenmenge, 2012 Ungeschützte Daten: Globales Problem 23 Big Data – die ungezähmte Macht 21 | 4. März 2014 Aktuelle Themen (z.B. Werbebanner bei Internet-Providern), mit Hilfe von kleinen Softwarepro- grammen online verfolgt und ausgespäht (Cookies 34 ). Sind die Daten erst mal gespeichert, können sie auch erst Jahre später wieder auftauchen und im schlimmsten Fall beruflichen Karrieren oder privaten Beziehungen dauerhaft schaden. Denn Profile lassen sich natürlich auch manipulieren, um Menschen bewusst zu schaden oder zu diskriminieren, z.B. beim Abschluss einer bestimm- ten Versicherung, bei Bewerbungsprozessen oder durch die Verwehrung weite- rer Dienste. Solange es also keine Lösungen gibt, informierte Entscheidungen zu treffen um die Herausgabe privater, persönlicher Daten auch zu verweigern oder sie lö- schen zu lassen, scheint die Entwicklung dieses Teilaspekts von Big Data hin- sichtlich des Datenschutzes alles andere als erfreulich. Personenbezogene Daten wecken viele Begehrlichkeiten Big Data wird inzwischen von vielen Akteuren aus Politik, Wirtschaft oder Wis- senschaft aus unterschiedlichem Interesse propagiert. Bei all den lukrativen Wachstumschancen, die Big Data bzw. das breite Angebot moderner web- basierter Technologien mit sich bringen, werden Risiken und Probleme gerne ausgeklammert. Insbesondere in die neuen, hochgehandelten Algorithmen zur Reduzierung von Komplexitäten oder zur Erstellung von Berechenbarkeitsana- lysen werden hohe Erwartungen gesteckt. Die Realität zeigt aber, dass Fragen hinsichtlich dahinterliegender Interessen, Machtverhältnisse, Ethik und Moral, Kontrolle, Rechte und Pflichten oftmals nur eine untergeordnete Rolle spielen. Das Geschäftsmodell digitaler Ökosysteme beruht zu einem großen Teil darauf, Daten zu monetarisieren. Es spielt aber eigentlich keine Rolle, ob Google, Facebook oder andere Internet-Dienstleister, die Polizei, Finanz- oder Statistik- ämter, Krankenkassen, Versicherungen, Banken oder – wie jüngst kontrovers debattiert – Geheimdienste auf diese personenbezogenen Daten zugreifen. Für die Nutzung und den Zugriff auf nicht anonymisierte Daten gelten für alle grund- sätzlich gesetzliche Vorgaben des Datenschutzrechts. 6. Big Data und der Datenschutz „IT -Sicherheit wird zu einer wesentlichen Voraussetzung zur Wahrung der Frei- heitsrechte. Die gesellschaftlichen Chancen und ökonomischen Potenziale der Digitalisierung dürfen nicht gefährdet werden. […] Die Themen IT -Sicherheit und die Abwehr von Wirtschaftsspionage sollen darüber hinaus eine besondere Rol- le spielen“ , so steht es geschrieben im aktuellen Koalitionsvertrag von CDU, CSU und SPD „Deutschlands Zukunft gestalten“. 35 Ein ambitioniertes Ziel der künftigen Bundesregierung. Seit Bekanntwerden der Abhörskandale im Juni 2013 sind allerdings noch keine konkreten Handlungen erfolgt. Grundsätzlich gibt es aber Datenschutzrichtlinien auf nationaler sowie europäischer Ebene. In Deutschland ist dies das Grundrecht auf informationelle Selbstbestimmung sowie das Grundrecht auf Gewährleistung der Vertraulichkeit und Integrität informationstechnischer Systeme. Diese sollen sicherstellen, dass persönliche Daten nicht außerhalb ihres ursprünglichen Kontextes und ohne die Einwilligung der jeweiligen Person gespeichert, weitergegeben oder analysiert werden. Das Bundesverfassungsgericht hat im Zuge der Volkszählungsentscheidung 1983 das erste Grundrecht auf Datenschutz verabschiedet. Das sogenannte Recht auf informationelle Selbstbestimmung besagt, dass Individuen grundsätz- 34 http://de.wikipedia.org/wiki/HTTP-Cookie. 35 https://www.cdu.de/sites/default/files/media/dokumente/koalitionsvertrag.pdf, S. 139. Wer kontrolliert die vielversprochenen Algorithmen? 49 45 38 36 35 0 20 40 60 Datenschutz und - sicherheit Budget/ Prioritätensetzung Technische Herausforderungen des Datenmgmts. Expertise Mangelnde Bekanntheit von Big Data - Anwendungen und Technologien Quelle: Fraunhofer IAIS % der Befragten (n=82*), 2012 Hauptprobleme im Bereich Big Data 24 *KMU und Großunternehmen aus verschiedenen Branchen Big Data – die ungezähmte Macht 22 | 4. März 2014 Aktuelle Themen lich selbst die Befugnis darüber haben, wer was wann und bei welcher Gele- genheit über sie weiß, also wem welche Daten für welchen Zweck zur Verfü- gung gestellt werden. Die Verfügung von persönlichen Daten erfolgt i.d.R. durch informierte Einwilligungen betroffener Personen. Weiterhin gilt das Zweckbin- dungsprinzip, wonach personenbezogene Daten grundsätzlich nur für jene Zwecke verwendet werden dürfen, für die sie ursprünglich erhoben wurden. Einschränkungen des Grundrechts, insbesondere durch staatliche Stellen, sind nur im Allgemeininteresse zulässig und müssen dem Prinzip der Verhältnismä- ßigkeit entsprechen. Die Datensparsamkeit bei Informationssystemen sieht zu- dem vor, dass möglichst wenige Daten erhoben und verarbeitet werden sollen. „Außerdem fordert die Verfassungsrechtsprechung technisch-organisatorische und verfahrensrechtliche Vorkehrungen zum Schutz des Rechts auf informatio- nelle Selbstbestimmung. Zentral für die Verwirklichung der Selbstbestimmung sind die Betroffenenrechte, also der Anspruch auf Auskunft über die in Bezug auf die eigene Person gespeicherten Daten sowie – bei Bedarf – auf Berechti- gung, Sperrung und Löschung. Zur Umsetzung der Regelungen zur informatio- nellen Selbstbestimmung bedarf es unabhängiger Kontrollinstanzen (BVerfGE 65, 1ff.).“ 36 Keine zeitgemäße Grundlage: Richtlinie aus dem Jahr 1995 Das Grundrecht auf Datenschutz wurde 2009 in die Europäische Grundrechte- charta unter Artikel 8 aufgenommen. Unter Verwendung des EU-Rechts ist das Datenschutzgrundrecht nicht nur von den Stellen der EU, sondern auch den Mitgliedstaaten zu beachten. Reformen sind aber unvermeidlich, da die Daten- schutzrichtlinien nicht von allen Mitgliedsländern einheitlich umgesetzt und an- gewendet werden und die eher veralteten Datenschutz-Richtlinien (von 1995) auch nicht mit der Adaptionsgeschwindigkeit web-basierter Technologien und generell mit der Evolution des Internets mithalten können. Im Januar 2012 hat die EU-Kommission einen Vorschlag für eine EU-Datenschutz-Grundverordnung vorgelegt. Sie soll die Datenschutzrichtlinie aus dem Jahre 1995 ersetzen und wird seither im Rat der Union und im Europäischen Parlament diskutiert. 37 Der Änderungsvorschlag sieht vor, den Geltungsbereich der Grundverordnung künftig nicht mehr ausschließlich an den Umstand zu knüpfen, wo geographisch gesehen die verantwortliche Stelle niedergelassen ist und wo die Verarbeitung der Daten erfolgt, sondern auch danach zu fragen, ob hiervon personenbezo- gene Daten von Personen in der EU betroffen sind. Das sogenannte Marktort- prinzip wird dafür sorgen, dass sich große datenspeichernde US-Unternehmen, wie digitale Ökosysteme, nicht mehr darauf berufen können, das europäische Recht binde sie nicht. 38 Anscheinend haben die USA eine andere Auffassung von datenschutzrechtli- chen Aspekten. Da sich aber Millionen europäischer und deutscher Bürger täg- lich auf sozialen Netzwerk-Plattformen und Onlinehandelsplattformen amerika- nischer Internetfirmen tummeln, treffen hier natürlich zunehmend unterschiedli- che Datenschutz-Kulturen aufeinander. Da ist Konfliktpotenzial programmiert. Angesichts der jüngst bekannt gewordenen Verstöße gegen das Datenschutz- gesetz sind die strukturellen und regelungstechnischen Fehler und Defizite im deutschen, europäischen aber auch im internationalen Datenschutzrecht schnellstmöglich zu beseitigen. Nur so kann der Schutz der Privatsphäre ge- währleistet und das Vertrauen der Bevölkerung in die digitale Welt erhöht wer- den. Ein höheres Vertrauen in digitale Infrastrukturen würde dem Internet als optimaler Katalysator für Innovation und Wachstum noch mehr Schub verleihen. 36 Vgl.: Weichert, T. (2013). Big Data: Das neue Versprechen der Allwissenheit. 37 Siehe hierzu ausführlich: Schaar, P. (2013). Big Brother und Big Data – Was heißt eigentlich Datenschutz auf Amerikanisch? Seite 5. 38 Vgl.: Schaar, P. (2013). Seite 6. Kampf der Kulturen 36 40 51 35 43 30 0 10 20 30 40 50 60 DE USA BR CN IN KR % der Befragten DE: n=1.213, USA: n=1.218, BR: n=1.215, CN: n=1.207, IN: n=1.211, KR: n=1.214 "Ich versuche so wenig persönliche Informationen im Internet preiszugeben als möglich" 25 Quelle: Münchner Kreis 2013, www.zukunft - ikt.de 42 31 62 30 49 28 0 10 20 30 40 50 60 70 DE USA BR CN IN KR % der Befragten DE: n=1.213, USA: n=1.218, BR: n=1.215, CN: n=1.207, IN: n=1.211, KR: n=1.214 "Unternehmen sollen transparent machen, wie und für was sie persönliche Daten nutzen" 26 Quelle: Münchner Kreis 2013, www.zukunft - ikt.de Big Data – die ungezähmte Macht 23 | 4. März 2014 Aktuelle Themen Lösungsansätze sollten möglichst international gelten Einige Big-Data-Analysepraktiken verletzen grundsätzliche Konzepte des Da- tenschutzgesetzes, insbesondere jene Datenanalysen mit Personenbezug. Die- ser Konflikt könnte entschärft werden, wenn eine Anonymisierung der Datensät- ze erreicht wird. 39 Diese muss die Möglichkeit eines Personenbezugs für die Dauer der Speicherung und Verarbeitung ausschließen. Allerdings bleibt die Gefahr der Re-Identifizierung grundsätzlich bestehen. Denn je mehr individuelle Merkmale in einen Datensatz fließen, desto größer ist das Risiko, dass mit ent- sprechendem Zusatzwissen Rückschlüsse auf Individuen möglich sind. Eine weitere Anonymisierungsmaßnahme stellt die Datenaggregation dar, also die Zusammenfassung individueller Datensätze zu Gruppendatensätzen. Daten könnten absichtlich „unscharf“ gemacht werden, damit bei einer Analyse keine exakten Zahlen, sondern eher Näherungswerte gewonnen werden können. Damit wird die Rückgewinnung individueller Erkenntnisse deutlich schwieriger. 40 Darüber hinaus können bei der Anwendung und Analyse von Datensätzen Maßnahmen zur Transparenz dem mangelnden Vertrauen der Internetnutzer entgegenwirken und Datenschutzverletzungen minimieren. Die Transparenz sollte sämtliche Analyse-Schritte umfassen, d.h. sowohl die Erhebung der Da- ten, deren Verschmelzung mit weiteren Datensätzen sowie die eigentliche Ana- lyse und die anschließende(n) Ergebnisverwendung(en). Wenn die unterschied- lichen Akteure, entweder durch einen regulativen Rahmen oder durch selbst- auferlegte Maßnahmen, ihre Analysepraktiken transparenter gestalten, erhalten die Menschen die Möglichkeit, informiert und selbstbestimmt über die Weiterga- be ihrer Daten zu verfügen bzw. einer Analyse zuzustimmen. Dadurch wird dem „Black Box“-Charakter von Big Data entgegengewirkt. Beim Handel zwischen Staaten gelten in der Regel international vereinbarte Handelsabkommen. Dadurch sollen Welthandel und Weltwirtschaft gefördert werden. Ähnlich wie diese Handelsabkommen den internationalen Warenver- kehr regeln, könnte auch ein Bündnis von Ländern internationale Algorithmen- Abkommen verabschieden, die den Handel mit personenbezogenen Daten ver- einheitlichen und durch z.B. externe „Algorithmiker“ 41 zertifizieren lassen. Da- durch könnten Analysemethoden standardisiert und transparent gemacht wer- den. Dies würde nicht nur das Bürger-Staat-Verhältnis (in Sachen Geheim- dienstpraktiken) einbeziehen, sondern beträfe auch die international tätigen digitalen Ökosysteme. Die Änderung des Datenumfangs hat auch zu einer Änderung des Datenwe- sens geführt, was den Schutz der Privatsphäre vor eine große Herausforderung stellt. Die Ausmaße und Potenziale von Big Data sind zum jetzigen Zeitpunkt nur zu erahnen. Daher gestaltet es sich schwierig, alle Eventualitäten juristisch abzudecken. Das Potenzial kann sich dann optimal entfalten, wenn die agieren- den Menschen Vertrauen in web-basierten Technologien haben, d.h. ihre Pri- vatsphäre unangetastet bleibt und ihre Grundrechte respektiert und gewahrt werden. Das Vertrauen in digitale Kanäle ist bereits angekratzt Seit im Juni 2013 die Dokumente von Ex-Geheimdienstmitarbeiter Edward Snowden veröffentlicht wurden, wird die Diskussion um Big Data kaum noch ohne die Überwachungspraktiken von Geheimdiensten geführt. Kritiker glauben, 39 Vgl.: Weichert, T. (2013). Big Data: Das neue Versprechen der Allwissenheit. 40 Vgl.: Weichert, T. (2013). Big Data – eine Herausforderung für den Datenschutz. 41 Vgl.: Mayer-Schönberger, V. und Cukier, K. (2013). Anonymisieren und aggregieren von personenbezogenen Datensätze Forderung nach mehr Transparenz Internationale Algorithmen - Abkommen bieten Standardisierung und Zertifizierung Die Basis i st „Vertrauen“ Big Data – die ungezähmte Macht 24 | 4. März 2014 Aktuelle Themen dass alles, was technologisch möglich ist, auch getan wird, um an persönliche Daten zu gelangen, unabhängig von etwaigen (nationalen) datenschutz- rechtlichen Grenzen. „If you’re looking for the needle in the ha ystack, you have to have the entire haystack first“ [Deputy Attorney General James Cole, stellvertretender US-Justizminister] Problematisch ist, dass hierzulande geltendes Datenschutzrecht durch den Ein- satz von Technologien umgangen werden kann. Beispielsweise läuft ein Groß- teil des deutschen Telekommunikationsverkehrs über das Ausland (hauptsäch- lich die USA), weil die inländischen Serverkapazitäten offensichtlich mit der Datenfülle überfordert sind. Es gibt Berichte, dass Daten abgegriffen, gespei- chert und weiterverwendet werden, ohne dass offiziell das deutsche Daten- schutzrecht verletzt wird. 42 Inwiefern große Teile der digitalen Kommunikation auch bewusst über ausländische Server umgelenkt wurden und ob sich deut- sche Telekommunikationsunternehmen den Begehrlichkeiten der Geheimdiens- te überhaupt entziehen können, bleibt wohl, wie viele Einzelheiten der gesam- ten Ausspähaktion, ein wohlbehütetes Geheimnis. Abhörpraktiken gefährden womöglich die Innovationskraft Die jüngst diskutierten Abhörpraktiken könnten jedoch weitreichende volkswirt- schaftliche Konsequenzen mit sich bringen und sollten nicht unterschätzt wer- den. Die ökonomische Gefahr liegt vor allem darin, dass die Menschen, auf- grund sinkenden Vertrauens und zunehmender Unsicherheit ihr Mediennut- zungs- und Konsumverhalten mittel- bis langfristig anpassen sowie ihre Adapti- onsgeschwindigkeit web-basierter Technologien reduzieren könnten. Das mag der Entwicklung web-basierter Technologien eventuell einen Wachstumsdämp- fer bescheren, insbesondere für die digitalen Ökosysteme, aber auch für viele Nischenanbieter und Start-Ups im Bereich IKT, die bereits jetzt verstärkt damit beschäftigt sind, ihren Kunden sichere IT-Infrastrukturen und Betriebssysteme zu versprechen und mögliche Sicherheitslücken zu schließen. Selbst wenn viele Menschen die bekannt gewordenen Abhörpraktiken der Ge- heimdienste nicht als direkte Gefahr einstufen, könnte sich aufgrund der dauer- haften medialen Berichterstattung unterschwellig eine gewisse Unsicherheit einschleichen. Wenn mehr Menschen sich im Internet beobachtet und abgehört bzw. kontrolliert fühlen, hat das Auswirkungen auf die individuelle Entfaltung, Freiheit, Kreativität und zuletzt sicherlich auch auf die Innovationskraft und die Wettbewerbsfähigkeit einer gesamten Volkswirtschaft. Eine 100%ige Daten- sicherheit ist und bleibt natürlich Illusion. Dennoch wird die Sicherheit von IT-Infrastrukturen für die Nutzer künftig an Bedeutung gewinnen. Unternehmen, die glaubwürdig sichere Internet-Dienste und -Technologien anbieten, dürften davon profitieren. 7. (Big) Data in der Praxis: Es gibt keinen Königsweg Die durch Datenexplosion und -auswertung entstehenden neuen Nutzungs- und vor allem Kommerzialisierungsmöglichkeiten stellen die Akteure folglich vor die Frage, ob es sich für sie lohnt, die prinzipiell zur Verfügung stehenden Daten zu filtern, zu analysieren bzw. generell in Big-Data-Projekte zu investieren. Diese Frage kann sicherlich bejaht werden. Denn ähnlich, wie es sich die Anbieter von Produkten und Dienstleistungen heutzutage nicht mehr leisten können, Dis- kussionen und Bewertungen über ihre Unternehmensleistungen auf sozialen Netzwerk-Plattformen und/oder Foren durch ihre (potenziellen) Kunden zu igno- 42 http://www.heise.de/security/meldung/Raetselhafte-Entfuehrungen-im-Internet-2053503.html. Nationale Datenschutzbestimmungen können umgangen werden No p ath$$SheetNameNo sheetname$$TextTableTextTable Volkswirtschaftlicher Schaden sollte nicht unterschätzt werden No path$$SheetNameNo sheetname$$TextTableTextTable Sichere IT - Architekturen gewinnen zunehmend an Bedeutung Big Data – die ungezähmte Macht 25 | 4. März 2014 Aktuelle Themen rieren 43 , so ist es ratsam, vorhandene interne und/oder externe Datensätze auszuwerten. Anderenfalls könnten den Unternehmen mangels relevanter In- formationsvorsprünge mittelfristig wertvolle Wettbewerbsvorteile verlorengehen. Die Akteure sind daher gut beraten, wenn sie die Fülle an Informationen und Datenströmen als potenzielles Wachstumsfeld anerkennen und schnell lernen, sie effektiv zu kanalisieren. Hierfür brauchen die Akteure eine anpassungsfähi- ge Digitalisierungsstrategie. Beispielsweise werden neue IT-Systeme künftig so in bestehende IT-Architekturen eingebettet, dass sie Trends und Vorhersagen schneller aufspüren können, um z.B. Analysen und Prognosen bezüglich der Verhaltensmuster der Kunden, Geschäftspartner und/oder Wettbewerber durch- führen zu können. Die Möglichkeit, Prozesse und Strukturen effizienter zu ge- stalten, IT-Systeme zu optimieren, eventuelle Synergien zu erreichen und somit Kosten zu senken, sind ebenfalls nicht zu vernachlässigende Vorteile. Um wettbewerbsfähig zu bleiben, sollten die Akteure lernen, ihren steigenden Datenpool mit modernen Managementmethoden zu verbinden und in adäquate Geschäftsstrategien sowie entsprechend angepasste Produkte und Dienstleis- tungen zu transformieren. Mag auch einigen Akteure anfangs der große Wurf nicht gelingen, so schlummert doch in vielen Geschäftsprozessen branchen- übergreifend Effizienzpotenzial, das auch in kleinen Schritten gehoben werden kann. Für Finanzinstitute könnte das z.B. bedeuten, dass sich ihre Aufmerk- samkeit weniger auf Finanzprodukte (z.B. Derivate) und andere neue, virtuelle Finanzprodukte richten, sondern vielmehr auf die Bankdienste, die rund um den Finanzbereich entstehen (web-basierte Beratung, Informationsdienste, Foren etc.). Im Angebot der Bank werden künftig sicherlich mehr Dienste zu finden sein, die auf gefilterten Kundeninformationen basieren. Aufholpotenzial für den deutschen Mittelstand Gemäß der Innovationspotenzialanalyse des Fraunhofer Instituts für Intelligente Analyse- und Informationssysteme (IAIS) gaben die Teilnehmer der Umfrage an, dass sie branchenübergreifend und langfristig vor allem auch Potenzial für die Individualisierung von Dienstleistungen (z.B. tägliche Gesundheitsdiagno- sen, individuelles Entertainmentprogramm on demand, etc.) sehen. 44 Zudem wünschen sie sich vermehrt intelligente Produkte (z.B. selbstlernende und selbstregulierende Häuser, autonom fahrende Fahrzeuge etc.). Gleichzeitig wurde aber auch von 95% der Umfrageteilnehmer der Wunsch nach Förderung in Form von Best Practices oder Schulungen geäußert, um bestehende Wis- sensdefizite im Bereich Big Data zu reduzieren. Der vielversprechende Datenschatz, der aus unterschiedlichen Quellen stammt, wird von vielen (mittelständischen) Unternehmen (noch) weitgehend ignoriert. Das wird sich in Zukunft sicherlich ändern. So stehen auch deutsche mittelstän- dische Unternehmen vor der enormen Herausforderung, die anfallenden Da- tenmengen zu erfassen, zu speichern und gewinn-, bzw. effizienzbringend zu verarbeiten. Im Gegensatz zu den großen Internetfirmen fehlen aber vielen mit- telständischen Unternehmen die notwendigen digitalen Strategien bzw. das Know-how, ihre internen sowie externen Wertschöpfungsprozesse mit moder- nen Datenanalysetechnologien auszustatten. Wer nicht zeitnah auf diese Ent- wicklung mit adäquaten und vor allem flexiblen Softwarelösungen und Filter- instrumenten reagiert, verpasst unter Umständen wertvolle Wettbewerbsvorteile und büßt womöglich sogar Marktanteile ein. Allerdings handelt es sich bei dem Implementierungsprozess moderner Big-Data-Instrumente um keinen Selbstläu- fer. Ein zusätzlicher Ressourceneinsatz ist erforderlich. Unabhängig von den 43 Vgl.: Dapp, T. (2011). Die digitale Gesellschaft. Seite 7ff. 44 Vgl.: Fraunhofer IAIS (2012). Big Data – Vorsprung durch Wissen. 91 77 71 67 65 56 52 43 35 26 25 0 20 40 60 80 100 Abfragen und Reporting Data Mining Datenvisualisierung Vorhersagemodelle Optimierung Simulation Text in natürlicher Sprache Geodatenanalyse Analyse von Datenströmen Videoanalyse Sprachanalyse Big Data Analyse - Tools 27 % der Befragten (n pro Nennung=508 - 870 aus 1.144), 2012 Quellen: IBM Institute for Business Value, Saïd Business School Oxford 65 64 59 58 54 51 45 45 44 42 42 38 - 5 10 25 40 55 70 Datenintegration Skalierbare Speicherinfrastruktur Leistungsfähiges Data Warehouse Sicherheit und Governance Scripting - und Entwicklungstools Spaltenorientierte Datenbanken Komplexe Ereignisverarbeitung Workload Optimierung Analytic Accelerators Hadoop/MapReduce NoSQL* Engines Stream Computing *NoSQL = Nicht - relationale Datenbanken, geeignet für datenintensive Applikationen, wie z.B. die Indexierung großer Dokumentenmengen % der Befragten (n pro Nennung=297 - 351 aus 1.144), 2012 Welche Plattformkomponenten werden verwendet? 28 Quellen: IBM Institute for Business Value, Saïd Business School Oxford Big Data – die ungezähmte Macht 26 | 4. März 2014 Aktuelle Themen unterschiedlichen Akteuren sollten die Entscheidungsträger zu Beginn des Big- Data-Prozesses grob folgende Fragen beantworten können: — Welche Ziele werden verfolgt? Beispielsweise Effizienz- und/oder Umsatz- steigerung, Optimierung von IT-Netzwerk- und Systemarchitektur, Öffnungs- prozesse vorantreiben (z.B. externe Wissensträger implementieren, Daten aufbereiten und veröffentlichen), Kundenprofile erstellen, Szenarien- oder Modellberechnungen optimieren — Welche Daten sind für die Analyse relevant? — Welche Daten sind bereits vorhanden; welche Daten können intern/extern zusätzlich aggregiert werden? — Welche Analysetechnologien und -methoden werden benötigt? — Welche zusätzlichen Ressourcen werden benötigt und wer verfügt über die Entscheidungshoheit? Know-how (interne/externe Fach- und Management- kompetenzen), interne/externe Hardware/Software (Analysetools, Data Warehousing, Speicherkapazität), Zeit, finanzielle Mittel (interne/externe Finanzierung) etc. Um das Potenzial sowie die breiten Einsatzmöglichkeiten von Big Data aufzu- zeigen, werden im Folgenden kurz einige durchaus erfolgreichen Big-Data- Projekte aus Wirtschaft, Wissenschaft und dem öffentlichen Sektor vorgestellt: Big-Data-Projekt im Gesundheitssektor Bislang mussten sich Gesundheitsbehörden bei der Analyse von Grippewellen auf die Anzahl der meldepflichtigen Krankheitsfälle stützen. Da aber viele Men- schen tendenziell nicht gleich bei ersten Krankheitssymptomen zum Arzt gehen und die Dauer des Übermittlungsprozesses der amtlichen Meldung von Krank- heitsfällen relativ hoch ist, können die Behörden i.d.R. nur mit einer (gerade für den Gesundheitsbereich) erheblichen zeitlichen Verzögerung von 1 bis 2 Wo- chen 45 auf den Ausbruch von Krankheitswellen reagieren. 46 Ein Big-Data-Projekt von Google kann hier Abhilfe leisten: Seit Ende 2008 gibt es inzwischen für mehr als 25 Länder das für Nutzer kostenlos zur Verfügung stehende Onlinetool „Google Grippe-Trends“. 47 Ein auf Daten basierendes Früh- warnsystem von Grippewellen kann für die unterschiedlichen Gesundheitsbe- hörden als Ergänzung zu herkömmlichen Grippe-Überwachungsmechanismen verwendet werden, um zeitnah, vielleicht sogar präventiv, aktiv zu werden. 48 Die Google-Forscher Ginsberg und Mohebbi 1 entwickelten einen Algorithmus, der die täglich am häufigsten vorkommenden 50 Millionen Suchanfragen nach grip- perelevanten Begriffen filtert. Suchvolumenanalysen (ebenfalls mit Tools aus der Google-Welt) zeigen, dass sich die Suchanfragen zu Beginn einer Grippe- welle überdurchschnittlich häufen. Die Datenfilterung lässt ein Muster erkennen, das insbesondere saisonale Volatilitäten aufweist. Der nachträgliche Daten- Vergleich von tatsächlichen Krankheitszahlen, bereitgestellt durch die jeweiligen Gesundheitsbehörden, mit den auf elektronischen Suchanfragezahlen beruhen- den Vorhersagen zeigt ein nahezu übereinstimmendes Bild. Da die regionalen Unterschiede im Bereich Grippeausbreitung relativ groß sind, benutzt Google Informationen über Krankheitsfälle von regionalen Anbietern. 45 Ginsberg, Jeremy et al. (2009). Detecting influenza epidemics using search engine query data. 46 Vgl.: Mayer-Schönberger, V. und Cukier, K. (2013). Big Data. Die Revolution, die unser Leben verändern wird. S. 7ff. 47 http://www.google.org/flutrends/intl/de/about/how.html. 48 Dieses Analysemodell beschränkt sich bislang auf die Analyse von Grippewellen und das Den- guefieber – die Vorhersage anderer Krankheitswellen ist in naher Zukunft nicht geplant. Die 4 Einführungsphasen bei Big Data 29 1. Informieren Konzentration auf Recherche und Marktbeobachtung 24%* 2. Planen Entwicklung einer Strategie und Roadmap auf Basis geschäftlicher Anforderungen und Herausforderungen 47% 3. Prüfen Start von Big Data - Initiativen zur Überprüfung von g e- schäftlichem Nutzen und Anforderungen 22% 4. Umsetzen Implementierung von zwei oder mehr Big Data - Lösungen und Einsatz von Advanced Analytics 6% * Prozent aller Befragten, 2012 (n=1.061, Prozentsatz entspricht aufgrund Rundung nicht 100%) . Quellen: IBM Institute for Business Value, Saïd Business School Oxford Big Data verschafft Informations - vorsprünge Big Data – die ungezähmte Macht 27 | 4. März 2014 Aktuelle Themen Insgesamt ergibt sich ein durchaus realitätsnahes Bild ohne zeitliche Verzöge- rung – im Vergleich zu den zeitlich hinterherhinkenden herkömmlichen Grippe- überwachungssystemen. Auf dieser Basis lassen sich also exakte Schätzungen zur aktuellen Grippelage in verschiedenen Regionen anstellen. Dieser Informa- tionsvorsprung verschafft den Gesundheitsbehörden wertvolle Zeit, um Grippe- epidemien schnell zu erkennen und eventuell einzudämmen. Das Google-Analysemodell wird jährlich überprüft und ggf. angepasst, sollte sich das elektronische Suchverhalten nach Gesundheitsinformationen ändern, z.B. hinsichtlich der Terminologie. 49 Die Google-Vorhersagen für Anfang 2013 überschätzten die tatsächliche Erkrankungsrate (s. Grafik). Google kündigte an, den Algorithmus an die neuen Suchgewohnheiten anzupassen. Forscher ver- muteten, dass die Warnungen der Medien vor einer drohenden Grippewelle zu Beginn des Jahres 2013 die Menschen dazu veranlassten, rein präventiv nach gripperelevanten Begriffen zu „googeln“, ohne jegliche Symptome zu haben. Dies verzerrte die Vorhersage des Google-Tools – zumindest für die USA. Durch unmittelbare Grippevorhersagen, kann der Gesundheitssektor effektiver gesteuert werden. Somit bietet das Analysetool von Google ein Indiz für die Innovationskraft, die hinter Big Data stecken kann, sowie einen möglichen volks- wirtschaftlichen Nutzen. Jedoch darf nicht vergessen werden, dass für die Vor- hersagen persönliche Daten gespeichert und ausgewertet werden müssen. Google versichert, dass der einzelne Nutzer nicht identifiziert werden könne, da die Auswertung der Suchanfragen anonymisiert erfolge. Lediglich das große Ganze sei von Interesse, da nur so verlässliche Aussagen möglich seien. Doch genügt in diesem Fall die Vorgehensweise von Google hinsichtlich datenschutz- rechtlicher Bestimmungen? Zwar setzt sich die Analyse milliardenfach verschie- dener Suchanfragen individueller Nutzer zusammen. Um regionale Vorhersagen treffen zu können, erfolgt die geographische Zuordnung der Suchanfragen je- doch über die jeweiligen IP-Adressen. 50 Daten basierend auf IP-Adressen las- sen sich jedoch ohne größeren Aufwand re-anonymisieren. Letztendlich schwingt immer etwas Misstrauen mit. Misstrauen dahingehend, dass solche Tools auch eine elegante Rechtfertigung dafür sind, persönliche Daten dauer- haft zu speichern und gegebenenfalls zu monetarisieren. 49 Beispielsweise war gleich im Jahr 2009 eine Anpassung des Ausgangsmodells notwendig, um auch die nicht saisonal verlaufene Schweinegrippe-Pandemie bestmöglich analysieren zu kön- nen. Siehe: Cook, Samantha et al. (2011). Assessing Google Flu Trends Performance in the Uni- ted States during the 2009 Influenza Virus A (H1N1) Pandemic. 50 Internetprotokolladresse: jedem Gerät in einem Netzwerk wird eine Adresse in Form von Zahlen- folgen zugeordnet; die eine genaue Adressierung und Zustellung von Datenpaketen ermöglicht. Misstrauen schwingt dennoch mit 0 40.000 80.000 120.000 Übermittelte Daten Google Grippe - Trends - Schätzungen Grippe-Häufigkeit Vereinigte Staaten 30 Historische Schätzungen Quellen: U.S. Centers for Disease Control; Google Grippe-Trends (http://www.google.org/flutrends) Big Data – die ungezähmte Macht 28 | 4. März 2014 Aktuelle Themen Big-Data-Projekt im Marketingbereich „What scares me about this is that you know more about my customers after three months than I know after 30 years .” [Lord MacLaurin, ehem. CEO von Tesco, Reak- tion auf die ersten Ergebnisse aus Test von Treuekarten] Vor allem bei großen (amerikanischen) Einzelhandels-Ketten ist die Analyse- Methode, Daten für Marketingzwecke einzusetzen, inzwischen gängige Praxis. Die noch bis vor wenigen Jahren anonyme Beziehung zwischen großen Einzel- händlern und dem einzelnen Kunden soll durch ein „One-to-one-Marketing“, nach dem Prinzip des Tante-Emma-Ladens in größerer Dimension, in eine indi- viduelle Händler-Kunden-Beziehung umgewandelt werden. 51 Tante Emma wusste aufgrund ihrer detaillierten Kundenkenntnis genau, welchem Kunden sie welche Produkte zu welchem Zeitpunkt empfehlen und schlussendlich verkau- fen konnte. Diese eher analoge „Datenbank“ möchten die Supermarktketten in großem Maßstab einsetzen. Hierfür werden kontinuierlich kundenspezifische Daten gespeichert, aktualisiert und analysiert. Die Daten hierfür stammen hauptsächlich aus Kreditkartenkäufen und Einkäufen im jeweiligen Onlineshop – aber auch Daten von Kundenkarten (Loyalty-Programme, Kunden- oder Bonus- karten) geben Aufschluss über Konsumvorlieben. Die herkömmliche Marktforschung mit ihren personenbezogenen Umfragen wird immer mehr durch eine datenbasierte Analyse des Kaufverhaltens in Echtzeit ersetzt. Um herauszufinden, welche Kundengruppe welches Produkt kauft, braucht es somit gute Programmierer und Datenanalysten sowie lernfähige Al- gorithmen. Mit den richtigen Rückschlüssen kann dem Kunden zum gewünsch- ten Zeitpunkt das gewünschte Produkt angeboten werden, in Form von Gut- scheinen, individuellen Werbeprospekten, Werbe-E-Mails etc. Big-Data- Anwendungen haben also aus Sicht des Handels vor allem das Potenzial, zum lukrativen Marketinginstrument zu werden. Die US-Amerikanische Kaufhauskette Target untersuchte z.B. das Kaufverhal- ten von Kundinnen, die sich für den Baby-Geschenke-Service registrieren lie- ßen. 52 Es zeigte sich folgendes Kaufmuster: Schwangere kaufen ab dem dritten Schwangerschaftsmonat verstärkt parfümfreie Lotionen, einige Wochen später spezielle Nahrungsergänzungsmittel. Die sich im Verlauf der Schwangerschaft ändernden Konsumgewohnheiten weisen ein so einheitliches Muster auf, dass sie der Supermarktkette sogar relativ genaue Rückschlüsse auf den jeweiligen Geburtstermin erlauben. Target legt, basierend auf diesen Kenntnissen, Pro- duktlisten an, die als Frühwarnsignal für Schwangerschaften bei Kundinnen dienen. Zeigt das Kaufverhalten einer Kundin plötzlich dieses „Schwanger- schaftsmuster“, so ist es bei Supermarktketten mittlerweile üblich, die Kundin dementsprechend durch gezielte Werbung oder Gutscheine anzusprechen. Die individuelle Kundenansprache ist mittlerweile so ausgefeilt und sicher in ihrer Vorhersage, dass sie sogar familiäre Krisen auszulösen vermag. So geschehen in den USA: ein Vater warf der Einkaufskette vor, seine junge Tochter mit ge- zielter Werbung für Babyprodukte zu einer Schwangerschaft anzustiften. Wie er kurz darauf jedoch feststellen musste, hatte Target jedoch einen Informations- vorsprung. Die Analyse der Kaufgewohnheiten der Tochter entsprach dem Mus- ter, das viele Frauen in den ersten Schwangerschaftsmonaten aufweisen. Die Tochter war tatsächlich schwanger. Die weltgrößte Einzelhandelskette Walmart analysierte in ihrer bisherigen Big- Data-Geschichte diverse Datensätze zum Kaufverhalten ihrer Kunden und ent- deckte dabei erstaunliche und, wie sich herausstellte, umsatzsteigernde Korre- lationen: Der amerikanische Snack „Pop-Tart“ 53 wird z.B. besonders oft gekauft, 51 Bloching, B., et al. (2012). Data Unser. Wie Kundendaten die Wirtschaft revolutionieren. 52 Vgl.: Mayer-Schönberger, V. und Cukier, K. (2013). 53 http://de.wikipedia.org/wiki/Pop-Tart. Individuelle Kundenansprache 49 18 15 14 4 Kundenorientierte Ergebnisse Betriebliche Optimierung Risiko - /Finanzmanagement Neues Geschäftsmodell Mitarbeiterzusammenarbeit % der Befragten, gewichtet und zusammenge - fasst, n=1.067, 2012 Big Data - Ziel: Kundenorientierung 31 Quellen: IBM Institute for Business Value, Saïd Business School Oxford Big Data – die ungezähmte Macht 29 | 4. März 2014 Aktuelle Themen wenn Unwetterzentralen Hurrikan-Warnungen heraus geben. 54 Auch stellte Walmart fest, dass in den Abendstunden Bier und Pampers vergleichsweise oft im gleichen Einkaufskorb landeten. 55 Walmart setzt seitdem Big-Data- Marketinginstrumente zur Regaloptimierung ein. Windeln und Bier werden bei Walmart-Filialen in benachbarten Regalen aufgebaut und wenn ein Wirbelsturm naht, werden Paletten mit „Pop-Tarts“ direkt neben den Kassen positioniert. Big-Data-Projekt in der Wissenschaft „ Torture the data long enough, and it will confess to anything. “ [Ronald Coase, Economist] Das „FuturICT Knowledge Accelerator and Crisis-Relief System“ 56 ist ein euro- päisches Forschungsvorhaben im Bereich der IKT. Dieses wissenschaftliche Großprojekt wird von zahlreichen internationalen Forschungsinstitutionen unter- stützt, initiiert durch Dirk Helbing, der Professor an der ETH Zürich ist. Die Vision ist die Entwicklung einer auf einem „Supercomputer“ basierenden Wissensplattform. Hier sollen alle globalen Datenströme zu einem möglichst genauen Abbild der Realität zusammengeführt werden. Wissenslücken techni- scher, wirtschaftlicher, gesellschaftlicher und ökologischer Art werden durch Computersimulationen und Daten-Analysen minimiert bzw. geschlossen. Insbe- sondere sollen Wechselwirkungen zwischen den verschiedensten Bereichen aufgedeckt werden. Virtuell simulierte Zukunftsszenarien helfen diese Wechsel- beziehungen zu managen und zeigen präventive Maßnahmen auf, die ergriffen werden könnten, um drohende Krisen im Weltgeschehen, wie Finanzkrisen, abzumildern oder sogar zu verhindern. Damit dies möglich wird, soll FuturICT auf drei Pfeilern aufgebaut sein: einem „planetaren Nervensystem“ (Planetary Nervous System), einem „lebendigen Weltsimulator“ (Living Earth Simulator) und einer „globalen Beteiligungsplattform“ (Global Participatory Platform). Das Planetary Nervous System soll die Visualisierung des aktuellen Weltge- schehens hauptsächlich basierend auf den Daten eines weltumspannenden Netzwerks von Sensoren zum Ziel haben. Diese Darstellung der globalen Ge- sellschaft basiert auf Reality Mining, also der Echtzeit-Gewinnung von Daten- strömen, produziert in allen Lebens- und Arbeitsbereichen. Besonders heraus- fordernd dabei ist die ständige Anpassung an neue Umstände, denn wie einst der griechische Philosoph Heraklit treffend bemerkte: „Nichts ist beständiger als der Wandel“, d.h. die Menschen und ihre Umgebung befinden sich in einem permanenten Transformationsprozess. Mit Hilfe des zweiten Pfeilers, des Living Earth Simulators, sollen – basierend auf den im Planetary Nervous System und der Partizipationsplattform gespei- cherten Daten – mögliche Zukunftsszenarien simuliert werden. Dieser politische „Windkanal“ 57 soll Aufschluss darüber geben, wie sich das globale System ver- hält, wenn sich unterschiedliche Bedingungen ändern. Hier werden also „Was wäre, wenn…“-Szenarien durchgespielt. Den jeweiligen Szenarien werden Ein- trittswahrscheinlichkeiten beigemessen, auf deren Basis sich ein Frühwarn- system entwickeln lässt. Von besonderem Interesse sind natürlich jene Einfluss- faktoren, die das globale System destabilisieren (können). Die Simulation beruht auf dem Experimentieren mit verschiedenen Modellen und deren Kombination (= pluralistische Modellierung), eingebettet in eine Open-Source-Software- umgebung. Diverse Forscher sollen somit die Möglichkeit erhalten, neu ent- wickelte Analysetools direkt einspeisen zu können. 54 http://www.nytimes.com/2004/11/14/business/yourmoney/14wal.html?_r=0. 55 http://www.forbes.com/forbes/1998/0406/6107128a.html. 56 www.futurict.eu. 57 Geiselberger, H., Moorstedt T. (Hrsg.) (2013). Big Data: Das neue Versprechen der Allwissenheit. Suhrkamp Verlag. Berlin. Die Philosophie von Open Innovation schwingt mit Big Data – die ungezähmte Macht 30 | 4. März 2014 Aktuelle Themen Die Idee der interaktiven Infrastruktur setzt sich auch bei der offenen Partizipati- onsplattform fort: Sie basiert auf der Idee eines „Prosumers“, also dem koprodu- zierenden Konsumenten. „Prosumer“ können die auf der Plattform bereitgestell- ten Datenreihen, Simulationen und Applikationen einsehen und zugleich selbst- bestimmt Informationen in das System einspeisen. Jeder, ob Individuum, Unter- nehmen oder Organisation, behält in diesem komplexen System also die Kon- trolle über die eigenen Daten und hat zugleich die Möglichkeit, die eingepflegten Ideen anderer einzusehen. Mit dieser interaktiven Partizipation erfährt das FuturICT-Modell eine Art „Open Innovation“-Komponente, die insbesondere externe Wissensträger involviert und somit für eine laufende Qualitätsüberprü- fung sorgt. Kernkonzepte von FuturICT sollen also Offenheit, Transparenz und Partizipationsmöglichkeit sein. Wann und in welchem Umfang FuturICT allerdings umgesetzt wird, ist nach der ausgebliebenen Förderung von 1 Mrd. EUR durch das 7. EU-Forschungs- rahmenprogramm „Future Emerging Technologies“ (FET) 58 ungewiss. Trotz des offensichtlichen Nutzens für die Gesellschaft ist die Durchführbarkeit von FuturICT auch kritisch zu sehen. Ein globales, komplexes System, auf das eine Vielzahl von Nutzern permanent und zeitgleich zugreifen kann, erfordert immen- se Serverkapazitäten. Angesichts der aktuellen technischen Rahmenbedingun- gen ist jedoch fraglich, ob ein Projekt dieser Größenklasse trotz des Fortschritts bei der Serverkapazität verwirklichbar bzw. finanzierbar ist. Eine andere Hürde ist sicherlich auch eine fehlende fundierte Theorie über das menschliche Verhalten, auf der ein Vorhersagemodell basieren könnte. Kritiker bemängeln zudem, dass die Welt komplexer und auch chaotischer ist als jedes Modell oder alle Kombinationen von Modellen. Das Nichtwissen wird immer größer sein als das Wissen, und der Drang, mehr Kohärenz zu erkennen, als gegenwärtig erreichbar ist, führt schnell zu einer vorschnellen Generalisierung und Vereinfachung von komplexen Zusammenhängen. Schon Friedrich August von Hayek schrieb in seinem Buch über den „Weg zur Knechtschaft“ von dem Vorwurf, dass es sich die gesellschaftlichen Planer, mechanistisch auch als Sozialingenieure bezeichnet, gefallen lassen müssen, dem konstruktivistischen Irrglauben aufzusitzen, dass eine Gesellschaft am Reißbrett entworfen werden könne. 59 Es bleibt zudem fraglich, ob die Handlungsempfehlungen, die sich im Living Earth Simulator ergeben würden, für die Menschen nachvollziehbar wä- ren. Unterschiedlich zu interpretierende Vorschläge, die nicht plausibel sind, werden politisch wohl kaum umgesetzt werden können. Open-(Big-)Data-Projekte in der öffentlichen Verwaltung Viele Big-Data-Projekte werden ausschließlich durch partikularinteressierte Monetarisierungsstrategien getrieben. Die unterschiedlichen Anwendungen von Daten können aber auch, unabhängig von ihrem Datenvolumen, einem Zweck dienen, der einen wertvollen und ökonomischen Nutzen für die Gesellschaft stiftet. „Open Data“ 60 oder „Open Government Data“ dienen im Gegensatz zu den üblicherweise diskutierten Big-Data-Anwendungen nicht primär monetären Zwecken, bieten aber ebenfalls einen oft unterschätzten reichen Datenschatz, der von unterschiedlichen Akteuren zu unterschiedlichen Zwecken mehrfach verwendet werden kann. Open Data steht für die Öffnung digitaler (nicht perso- nenbezogener) Informationen, die der Bevölkerung (nahezu) uneingeschränkt zur Verfügung stehen. 58 http://cordis.europa.eu/fp7/ict/programme/fet_en.html. 59 Hayek, F. A. von (2004). Der Weg zur Knechtschaft. 4. Auflage. Mohr Siebeck Verlag, Tübingen. 60 http://opendatahandbook.org/de/why-open-data/index.html. Finanzierung als Hürde Kritik der Freiburger Schule aktueller denn je Big Data – die ungezähmte Macht 31 | 4. März 2014 Aktuelle Themen Primär handelt es sich um Datensätze (z.B. Karten und Satellitenaufnahmen, Geo- oder Umweltdaten) und weniger um Textmaterial wie Dokumente und Akten(notizen). Getrieben wird diese Bewegung durch die steigende Nachfrage der Bürger nach Transparenz, Interaktion und Kollaboration. Ein weiterer öko- nomisch wertvoller Aspekt ist die Innovation durch Daten. Denn die „offenen“ Datensätze dürfen von Bürgern, Konsumenten, Journalisten, Forschern, Unter- nehmen, Organisationen etc. für unterschiedliche, sowohl private als auch kommerzielle Zwecke verwendet und vor allem mehrfach weiterverarbeitet wer- den. Die dabei frei zur Verfügung gestellten Daten schaffen in Kombination mit web-basierten Technologien somit einen volkswirtschaftlichen Nutzen in Form neuer Geschäftsmodelle, innovativer Produkte und Dienstleistungen. So rei- chern beispielsweise Journalisten ihre investigativen Berichte durch unter- schiedliche offene Datensätze an und treiben dadurch das Themenfeld „Daten- journalismus“ voran. 61 Open Data lebt davon, dass die Daten auch nachgenutzt bzw. wiederverwendet werden können. Hierfür organisiert z.B. die Open Knowledge Foundation 62 (OKF) in Deutschland regelmäßige sogenannte „Hackathons“. 63 Hier tauscht sich eine bunte Mischung an Interessierten, wie Journalisten, Open-Data-Experten oder Softwareentwickler aus, um vorhande- ne, frei zugängliche Daten zu analysieren und daraus eventuelle neue web- basierte Dienste in Form von Apps zu programmieren. Obwohl Open Data sämtliche erhobenen Daten einschließt, wird der Begriff oft synonym für Open Government Data verwendet. Die allmähliche Öffnung von Verwaltungsdaten wandelt zunehmend das Bürger-Staat-Verhältnis. Denn die kostenlos zur Verfügung gestellten Daten schaffen auch neue demokratische Dimensionen; z.B. werden bislang undurchsichtige Behördenabläufe transpa- renter. Vor allem die angelsächsischen Staaten ( data.gov; data.gov.uk ), aber auch einige nordische Länder haben eine Vorreiterrolle bei der Öffnung von Verwaltungsdaten. Hier wurden bereits mehrere Open-Data-Projekte erfolgreich implementiert und auch von den Bürgern angenommen. 64 In den vergangenen Jahren wurde eine Liste an Standards entwickelt, heute bekannt als die zehn Prinzipien zum Öffnen von Regierungsinformationen. Die- se sollen Regierungen und Verwaltungen dabei helfen, ihre Datenbestände für die Allgemeinheit zu öffnen. Erst Mitte 2013 verpflichteten sich die G8-Mitglied- staaten 65 durch die Unterzeichnung einer „Open Data Charter“ dazu, fünf politi- sche Prinzipien 66 zur Öffnung ihrer Datenbestände bis 2015 zu implementieren. Ein Beispiel für Open Data ist die britische Online-Steuerauskunftsdatei 67 . Hier können die Bürger einer übersichtlichen Aufschlüsselung entnehmen, wofür der britische Staat ihre Steuergelder ausgibt. Diese Option gibt es auch in Deutsch- land: die Homepage offenerhaushalt.de , ein weiteres Projekt der OKF, gibt de- taillierte Informationen über die Haushaltsausgaben auf Bundesebene, mit An- gaben dazu, welchem Ressort welches Budget zur Verfügung steht. Spätestens seit 2005, als das Informationsfreiheitsgesetz 68 erlassen wurde, hat jeder Bürger auch das Recht, sich über solche Sachverhalte informieren zu dürfen. Die Da- tendarstellung auf der Homepage ermöglicht es, sich schnell über die Ausgaben zu informieren, die Informationen auszuwerten und weiterzuverarbeiten. 61 http://datajournalismhandbook.org/. 62 Die OKF hat z.B. ein Minimum-Set von zehn Datensätzen definiert, die nationale Regierungen als Open Data veröffentlichen sollten und misst entsprechend Länder in ihrem „Open Data Census“. Zuletzt wurde der Zensus, der inzwischen fast 80 Länder umfasst, für den G8-Gipfel erhoben. Siehe http://census.okfn.org/. 63 Siehe z.B. http://energyhack.de/ oder http://jugendhackt.de/. 64 Siehe hierzu z.B. das Open Data Institute (http://theido.org). 65 Deutschland, Frankreich, Großbritannien, Italien, Japan, USA, Kanada und Russland. 66 Open Data by Default, Qualität und Quantität, Nutzbar von allen, Veröffentlichung von Daten für besseres Regierungshandeln, Veröffentlichung von Daten für Innovation. 67 http://wheredoesmymoneygo.org/. 68 Das Gesetz gewährt jeder Person einen voraussetzungslosen Rechtsanspruch auf Zugang zu amtlichen Informationen von Bundesbehörden. Dabei ist eine Begründung durch rechtliche, wirt- schaftliche oder sonstige Interessen nicht erforderlich. Innovation durch Daten Etablierung von Standards im Bereic h Open Data 0 10 20 30 40 50 60 70 DE AT CH SE UK US Ja Nein, aber geplant Nein Weiss nicht DE (n=600); AT (n=713); CH (n=702); SE (n=725); UK (n=713); USA (n=576) Nutzung eGovernment - Dienste via mobile Endgeräte 32 Umfrage in %, 2013 Quelle: eGovernment MONITOR 2013 Big Data – die ungezähmte Macht 32 | 4. März 2014 Aktuelle Themen In Großbritannien sind aber nicht nur die Steuerausgaben online abrufbar. Open Data auf lokaler Ebene wird der Allgemeinheit auf der Internetseite OpenlyLocal bereits in vergleichsweise hohem Maße zur Verfügung gestellt. 69 So hat immer- hin schon knapp ein Viertel der britischen Gemeinden ihre lokalen Verwaltungs- daten hier öffentlich zugänglich gemacht, und täglich kommen mehr Kommunen hinzu. Zu den veröffentlichten Daten zählen neben den aufgeschlüsselten Ge- meindeausgaben auch alle sonstigen öffentlichen Gemeinderatsinformationen sowie Bevölkerungsstatistiken oder lokale Finanzdaten. Eine Organisation aus London ( MySociety ) hat die Plattform „Fix my Street“ ins Leben gerufen. Hier können die Bürger über eine App Schlaglöcher, defekte Ampeln oder Straßenlaternen direkt an die zuständigen Abteilungen melden. So senden die Bürger ein Foto des Schlaglochs via Smartphone an die entspre- chende Behörde, die dann anhand der GPS-Daten einen Reparaturauftrag er- teilen kann. Der Bürger bekommt regelmäßig Updates über den Reparaturfort- schritt. Diese Plattform wird mittlerweile in vielen europäischen Städten nachge- ahmt. Von derartigen Plattformen können also sowohl die Stadtverwaltung als auch die Bürger profitieren – nicht selten scheitert aber die zeitnahe Ausbesse- rung am Budgetmangel der Kommunen. In Deutschland fehlt (noch) eine Datenbank, in der alle Gemeindedaten gesam- melt werden. Aber vereinzelte deutsche Kommunen, wie Köln 70 oder Frankfurt am Main, bieten inzwischen solche Tools für ihre Stadt an. Auf der von Bürgern geschaffenen elektronischen Plattform „ Frankfurt gestalten – Bürger machen Stadt“ 71 . (ebenfalls ein Projekt der OKF) werden z.B. lokale Informationen der Stadt Frankfurt kostenlos online zur Verfügung gestellt. Die Bürger können sich über die Schnittstelle OpenStreetMap aber auch über eine gezielte Filterung der vorhandenen Datensätze zur Lokalpolitik und sonstige Vorkommnisse z.B. Poli- zei- oder Baustellenmeldungen informieren. Diverse Foren bieten den Bürgern zudem die Möglichkeit, sich über lokale Entwicklungen auszutauschen. Die genannten Projekte zeigen, dass sich Open Data als alternative Datenver- wendung in der Big-Data-Diskussion nicht nur um „Geld verdienen“ dreht, sie stellen vielmehr den gesellschaftlichen Nutzen in den Vordergrund. Somit stellt sich die Frage, inwiefern die Big-Data-Diskussion auch zusätzliche Impulse freizusetzen vermag, um Open Data bzw. die Schaffung von Werten voranzu- treiben. Die Öffnung bislang nicht zugänglicher Daten ist nicht nur für den Ver- waltungssektor relevant, sondern hat sicherlich auch für andere Bereiche Po- tenzial. Beispielsweise ist im Bildungswesen (Open Research Data) eine Öff- nung schon dahingehend wahrnehmbar, dass Lehrstühle ihre Vorlesungen, ganze Vortragsreihen und die dazugehörigen Unterlagen als Youtube-Video oder auf der jeweiligen Universitäts-Homepage der Allgemeinheit zur Verfügung stellen (wie z.B. die Online-Plattform MITOpenCourseware 72 des Massachusetts Institute of Technology [MIT]. 69 http://openlylocal.com/. 70 http://www.offenedaten-koeln.de/. 71 http://www.frankfurt-gestalten.de/. 72 http://ocw.mit.edu/index.htm. Die 10 Prinzipien für offene Daten 33 1. Vollständigkeit Sämtliche Rohdaten eines öffentlichen Daten- satzes sollen in vollem Umfang zur Verfügung gestellt werden – bestenfalls unter Angabe von Formeln sowie Erklärungen zur Datenberech- nung. Als öffentliche Daten werden hierbei Daten verstanden, die nicht berechtigten Da- tenschutz-, Sicherheits- oder Zugangsbe- schränkungen unterliegen. 2. Primärquellen Die Daten sollen an ihrem Ursprung gesam- melt werden, und zwar mit dem höchstmögli- chen Feinheitsgrad, also nicht in aggregierten oder anderweitig modifizierten Formaten. 3. Zeitliche Nähe Daten werden so zügig wie zur Werterhaltung notwendig zur Verfügung gestellt – bestenfalls direkt nach deren Erhebung und Zusammen- stellung. 4. Leichter Zugang Daten werden so vielen Nutzern wie möglich für möglichst viele Verwendungszwecke bereit- gestellt. Die gewünschten Informationen sollen hierbei so leicht als möglich eingeholt werden können. 5. Maschinenlesbarkeit Um Daten automatisiert verarbeiten zu kön- nen, müssen die Informationen strukturiert in den weitverbreiteten Datenformaten zur Verfü- gung gestellt werden. 6. Diskriminierungsfreiheit Ohne vorherige Identifikation (Registrierung oder sonstige Mitgliedschafts-Voraus- setzungen) sollen die Daten jedem zu jeder Zeit zur Verfügung stehen. 7. Verwendung offener Standards Daten werden in standardisierten, kostenlos verfügbaren Formaten bereitgestellt, über die keine juristische Person die alleinige Kontrolle hat. 8. Lizenzierung Daten unterliegen keinen Nutzungsbeschrän- kungen wie Urheberrecht, Patent, Markenzei- chen oder Geschäftsgeheimnis. Sinnvolle Datenschutz-, Sicherheits- und Zugangsbe- schränkungen sind jedoch zulässig. 9. Dauerhaftigkeit Öffentliche Datenströme sollen dauerhaft in Online-Archiven verfügbar gemacht werden. 10. Niedrige Nutzungskosten http://sunlightfoundation.com/blog/2011/07/14/vivek-kundras- 10-principles-for-improving-federal-transparency/. http://wiki.okfn.de/10-Prinzipien-fuer-offene-Daten Big Data – die ungezähmte Macht 33 | 4. März 2014 Aktuelle Themen 8. Grenzen von Big Data Neben dem datenschutzrechtlichen Nachholbedarf gibt es noch weitere Aspek- te, welche die Grenzen und Schwächen moderner Big-Data-Analysemethoden aufzeigen. Mit den modernen Technologien und Methoden im Bereich Big Data eröffnen sich den Akteuren sicherlich neue Wege, bestehende Datenmodelle und Szenarien beispielsweise mit Echtzeit-Daten anzureichern, um somit aus- sagekräftigere Ergebnisse zu erlangen und bestenfalls Trends zu prognosti- zieren. Allerdings bewirkt Big Data auch keine Wunder, denn die Gesetze der Statistik lassen sich auch aufgrund der Fülle neuer Daten(korrelationen) nicht aushebeln. Nur weil datengetriebene Analysen plötzlich mit neuen, bisher un- geahnten quantifizierbaren Datensätzen angereichert werden können, sind die Ergebnisse nicht objektiver als in der Analysezeit vor Big Data, d.h. trotz der zunehmenden Quantifizierbarkeit menschlicher Handlungen, trotz der neuen maschinenlesbaren Kaufpräferenzen oder Gefühlsäußerungen der Menschen werden keine zwangsläufigen Tatsachen geschaffen. Dies gilt insbesondere hinsichtlich von Datensätzen aus dem Bereich sozialer Netzwerke. 73 Die Bewer- tung von Analyseergebnissen aus wissenschaftlichen Datenanalysen, seien die Analysen auch noch so quantifizierbar und leidenschaftslos, sie bleiben Inter- pretationen von Menschen (Subjekten), die auch irren können. Steigende Komplexität bei der Verschmelzung von Datensätzen Darüber hinaus gibt es weiterhin methodologische Probleme, wie die Unzuver- lässigkeit, die Fehleranfälligkeit und Unvollständigkeit großer Datensätze. Diese Probleme verstärken sich zudem, wenn unterschiedliche Datenquellen kombi- niert werden (Datenabgrenzungsproblem). Bei der Zusammenführung diverser Datensätze steigt mit jeder Korrelation die Komplexität der zugrundeliegenden Datenbestände. Das Zusammenführen bedeutet nicht, dass es (nur) zu einer einfachen Addition dieser Daten kommt. Wenn z.B. zehn Informationen aus Umweltsensoren mit zehn Informationen aus dem Verkehrsaufkommen ver- knüpft werden, resultieren am Ende nicht 20 neue Datensätze, sondern sie mul- tiplizieren sich zu 100 neuen Informationen, die wiederum neu interpretiert wer- den können. Damit steigen die Komplexität sowie die Anforderungen an den neu entstandenen Datensatz stark an, mit der impliziten Gefahr, aus der zu- grundeliegenden Analyse Muster erkennen zu wollen, die gar nicht existieren. Dies könnte zu fehlerhaft abgeleiteten Handlungen führen. Ursache und Kausalität Obwohl die Daten immer „bigger“ werden, gilt nach wie vor „Qualität vor Quanti- tät“. Big Data kann nicht mit Vollständigkeit gleichgesetzt werden. Die zur Ver- fügung stehenden Informationen und Datenreihen können unter Zuhilfenahme der bereits vorhandenen Analysetools auf Korrelationen untersucht werden. Doch sind diese durch Algorithmen gefundenen Zusammenhänge nicht immer logisch. So kann die Kausalität der gefundenen Zusammenhänge auch mit dem heutigen Stand der Technik nicht belegt oder hinterfragt werden, sondern dies obliegt nach wie vor dem menschlichen Verstand, seinen Erfahrungen und Intui- tionen. Der Mensch muss herausfinden, welche Fragestellungen und Antworten die Daten hergeben können. Algorithmen stellen also lediglich ein Kombinati- onstool dar und ermitteln, WELCHE Zusammenhänge die Daten aufweisen, nicht aber, WARUM es diese Zusammenhänge gibt. Datenanalysen bleiben also die Entscheidungsbasis, die Entscheidungsmacht hingegen sollte nicht auf 73 Vgl.: Boyd, D., Crawford, K. (2013). Big Data als kulturelles, technologisches und wissenschaftli- ches Phänomen. Sechs Provokationen. Big Data ist kein Allheilmittel Steigende Komplexität bei Datenkombinationen Big Data liefert keine Kausalität, sondern nur Korrelation Big Data – die ungezähmte Macht 34 | 4. März 2014 Aktuelle Themen die Algorithmen übertragen werden. Big Data beruht zwar auf Korrelationen, ist zur Beurteilung deren Kausalität aber ungeeignet. 74 Wo bleibt die menschliche Intuition? Die neuen Technologien und Methoden könnten die Menschen dazu verleiten, Zusammenhänge nicht mehr nur durch Zuhilfenahme bzw. Entwicklung von Modellen zu finden, sondern Daten zunehmend für sich sprechen zu lassen, ohne weitere Dateninterpretationen. Dies könnte die Menschen langfristig in ihrer Denkweise beeinflussen, weil sie sich zu stark auf Big Data verlassen, ohne Zusammenhänge zu hinterfragen. Die Denkmuster werden also potenziell in bestimmte Bahnen gelenkt, was vor allem die menschliche Intuition und Krea- tivität negativ beeinflussen kann. Beide Eigenschaften stellen jedoch zentrale Größen im Innovationsprozess dar. Dürfen Daten also ohne weitere Interpretati- onen Handlungsempfehlungen automatisch ableiten? Eine potenziell präventive Nutzung von Datenauswertungen sollte nicht gängige Praxis werden. In einem Extremszenario würde die Polizei z.B. eine Person verstärkt überwachen, nur weil sie aufgrund ihres aktuellen „digitalen Fußabdrucks“ (Tweets, Suchanfra- gen, Kreditkarte- oder Online-Käufe etc.) in ein durch Algorithmen ermitteltes typisches Verhaltensmuster früherer Bankräuber passt, ohne dass die Person kriminell geworden ist oder dies jemals beabsichtigen würde. Natürlich klingt es zunächst verlockend, wenn mit Hilfe von Big Data ein Verbrechen vorhergesagt werden kann, bevor es verübt wird. Tatsächlich ist es jedoch informationeller Missbrauch, wenn Menschen aufgrund flächendeckender und anlassloser Pro- filerstellung plötzlich in elektronisch ermittelte Raster fallen und per se unter Generalverdacht gestellt werden. Ein solches Vorgehen gilt generell als Gefahr für ein freiheitliches und demokratisches System und wird daher nicht erst seit den jüngst bekannt gewordenen Spähaffären diskutiert. Fragwürdige Datensätze Einige Akteure, darunter auch Wissenschaftler, nutzen gerne Datensätze von sozialen Netzwerk-Plattformen, um möglichst neue Muster aus Stimmungen und Gefühlslagen der Menschen zu filtern, um mediale Events, politische Proteste oder sonstige gesellschaftliche Bewegungen erklären oder bestenfalls vorher- sagen zu können. Aber selbst die Analyse solcher umfangreichen Datensätze erlaubt nicht das Ableiten allgemeingültigen menschlichen Verhaltens. Auch ein großer Teil z.B. aus der Facebook-Gemeinde ist lediglich eine spezifische Teil- menge. Je nach Analyse und abgeleiteter Botschaft unterscheiden sich die Nut- zer sozialer Netzwerke von anderen Menschen. Hier spielen unterschiedliche Identitäten, wie Alter, Geschlecht, Bildungsgrad, Internet-Affinität, die Bereit- schaft, persönliche Bilder und Botschaften zu posten, etc., eine große Rolle. Zudem kann nicht mit Sicherheit festgestellt werden, ob es sich bei den offiziell angegebenen Kontenzahlen sozialer Nezwerke nicht auch um „Fake“-Konten handelt bzw. ob Nutzer und Konto übereinstimmen. Weiterhin kann nicht aus- geschlossen werden, dass einzelne soziale Netzwerk-Plattformen problemati- sche Inhalte der Nutzer zensieren und somit die Aussagekraft der Meldungen von Anfang an verzerren. Diese methodologischen Fragen müssen im Hinter- kopf behalten werden, um zu entscheiden, welche Fragen bzw. welche Analyse und darauf abzielend, welche Interpretationen am Ende der Analyse noch zu- lässig sind. 75 Daher gilt trotz oder gerade wegen der Big-Data-Bewegung: Auch Smart Data kann zu guten Ergebnissen führen. 74 Vgl.: Mayer-Schönberger, V. und Cukier, K. (2013). 75 Vgl.: Boyd, D., Crawford, K. (2013). Es droht der informationelle Missbrauch Daten von sozialen Netzwerken liefern kein e allgemein gültigen Aussagen über menschliches Verhalten Big Data – die ungezähmte Macht 35 | 4. März 2014 Aktuelle Themen Ethik und Moral Eine ausführliche Diskussion über Ethik und Moral innerhalb der Big-Data- Diskussion würde den Rahmen dieser Studie sprengen. Aber natürlich spielen auch ethische und moralische Fragestellungen eine große Rolle, wenn es da- rum geht, personenbezogene Datensätze aus unterschiedlichen Quellen und Kontexten teils mehrfach und durch unterschiedliche Akteure zu verwerten. Viele Fragen in der Big-Data-Diskussion z.B. bezüglich Zugang, Zweck, Kontrol- le, Machtverhältnissen oder Wahrheitsgehalt bleiben unbeantwortet. Welchen Status haben z.B. Daten, die auf diversen sozialen Netzwerk-Plattformen als „öffentlich“ gekennzeichnet sind, also nicht nur für Freunde zugänglich sind, sondern quasi für alle Internetnutzer? Dürfen Interessierte diese Datensätze für Analysen verwenden oder gibt es einen Probandenschutz, was dazu führen würde, dass von jedem Einzelnen zuvor eine informierte Einwilligung eingeholt werden muss? Die Tatsache, dass es digitale Inhalte gibt, die öffentlich zugäng- lich sind, bedeutet nicht automatisch, dass jeder mit diesen Inhalten machen kann, was er möchte. Das Internet ist kein rechtsfreier Raum. 9. Fazit Die Datenflut ist Realität. Big Data lässt sich ebenso wie die Globalisierung nicht aufhalten. Mit Big Data ist auch die IT-Sicherheit ein entscheidender Teil des gesamten Wertschöpfungsprozesses geworden. Während sich die Akteure frü- her eher mit der Limitiertheit von Daten herumgeschlagen haben, kämpfen sie heute mit der Analyse-Limitiertheit bzw. der Frage, welche wertvollen Informati- onen den anfallenden Datenmengen noch entlockt werden können. Obwohl sich die Entscheidungsträger durchaus im Klaren sind, dass Big Data mittel- bis langfristig ein Thema mit hoher strategischer Relevanz und lukrativen Wachstumschancen ist, mangelt es in vielen Fällen an geeigneten Digitalisie- rungsstrategien, geschultem Personal für die neuen Herausforderungen sowie den notwendigen adäquaten Management-Kompetenzen. Aufgrund fehlender oder veralteter Datenschutzbestimmungen sowie (noch) eher starren Siloden- kens bestehen nach wie vor auch Hemmungen, im Bereich Big Data experimen- tell aktiv zu werden. Big Data wird die Struktur bestehender Wirtschaftszweige verändern, weil es neue Wettbewerbskonstellationen geben wird. Viele etablierte Geschäftsmodel- le werden durch den digitalen Strukturwandel aus den Angeln gehoben und bekommen in ihren jeweiligen Branchen künftig mehr Konkurrenz von bran- chenfremden Unternehmen, die sich auf Produkte und Dienste im Bereich web- basierter Informations- und Kommunikationstechnologien bzw. auf die Analyse von Daten spezialisiert haben. Zudem werden neue Berufszweige entstehen, wie z.B. Datenanalysespezialisten oder Algorithmiker. Insbesondere breiten sich Start-Ups und Nischenanbieter aus, die sich auf die Auswertung und Analyse unterschiedlicher, teils öffentlich zugänglicher Daten spezialisieren und daraus Produkte und Dienste kreieren. Dadurch erhöhen sie den Druck auf etablierte Geschäftsmodelle. Eine Applikation für web-basierte Endgeräte, die das individuelle Mediennutzungs- bzw. Leseverhalten der Men- schen auswertet, kann in kürzerer Zeit bessere Prognosen darüber abgeben, was die Menschen gerne lesen, als es ein Verlagshaus mit jahrelanger Erfah- rung im Kundenservice je konnte. Mühsam und lang erarbeitetes Expertenwissen innerhalb etablierter Geschäfts- bereiche wird künftig schneller in Frage gestellt, weil die Geschäftsmodelle neu in den Markt eintretender Technologie-Unternehmen darauf basieren, dass in- telligente Algorithmen in kürzerer Zeit und zu geringeren Kosten Prognosen mit einer höheren Eintrittswahrscheinlichkeit abgeben als einzelne Experten, die ihr Wissen jahrelang aufbauen mussten. Was bedeutet eigentlich „öffentlich zugänglich“? Big Data ist nicht aufzuhalten Es entstehen neue Jobs und Berufe Daten sprechen lassen Big Data – die ungezähmte Macht 36 | 4. März 2014 Aktuelle Themen Dies wird rasch zu mehr Konkurrenz sowie einem Umdenken im Markt führen. Etablierte Geschäftsmodelle werden zum Teil schmerzhafte Transformations- prozesse durchlaufen müssen. Zudem werden sich die Qualifizierungsanforde- rungen auf dem Arbeitsmarkt anpassen, d.h. Wirtschaft, Wissenschaft und auch der öffentliche Sektor stellen aufgrund der gestiegenen Dynamik durch den digi- talen Strukturwandel höhere Anforderungen an künftige Mitarbeiter. Bei einer steigenden Nachfrage nach Big-Data-Methoden haben Quereinsteiger aus den Bereichen Statistik, Mathematik, Informatik, Datenanalyse oder künstliche Intel- ligenz und Robotik gute Chancen, einen lukrativen Job zu bekommen, weil sie branchenübergreifend ihre Fähigkeiten einsetzen können. Bei all dem Potenzial und den positiven Auswirkungen, die aus der Big-Data- Diskussion abgeleitet werden können, bleiben dennoch zentrale Fragen unbe- antwortet: Welchen Einfluss werden die modernen Technologien und Analyse- methoden künftig auf den Alltag haben? Viele Branchen befinden sich bereits in schmerzhaften Anpassungsprozessen, welche weiteren Branchen sind betrof- fen und mit welchen Digitalisierungs-Strategien können sie drohenden Wettbe- werbsnachteilen entgegenwirken? Wie werden die Akteure und die Bürger künf- tig mit der Schieflage in der Datenhoheit umgehen? Welche Rolle spielt der Wirtschaftsstandort Deutschland in einer zunehmend digitalisierten, global ver- netzten Welt? Als wissensintensive und rohstoffarme Volkswirtschaft hat Deutschland optimale Voraussetzungen, im Bereich moderner Internettechnolo- gien, vor allem im Bereich der IT-Sicherheit, künftig eine internationale Vorreiter- rolle einzunehmen. Kommerziell und informationstechnologisch mag die Big-Data-Debatte bereits eine Grundlage haben. Jetzt geht es darum, die zentralen grundrechtlichen und auf Freiheit basierenden Datenschutzaspekte sowie die eventuell drohenden wettbewerbsverzerrenden Effekte durch die digitalen Ökosysteme zu diskutie- ren. Letzteres spielt vor allem deshalb eine Rolle, weil die bereinigenden Markt- konsolidierungen in der digitalen Welt der großen Internetkonzerne sehr viel schneller vonstatten gehen als z.B. in der Automobilbranche. Entscheidungsträ- ger aus den Bereichen Wirtschaft, Wissenschaft, Politik oder Bürgerrechtsinitia- tive sind jetzt aufgefordert, die künftig notwendigen regulativen Rahmenbedin- gungen aktiv mitzugestalten. Insbesondere bei der Fragestellung, wie die da- tenschutzrechtliche Zweckbindung und die bereits praktizierten Big-Data- Methoden in Einklang gebracht werden können. Das Internet der Dinge wird kommen, humanoide Roboter werden früher oder später in vielen Haushalten für mehr Effizienz und Unterstützung sorgen. Die Menschen werden in Zukunft Dialoge mit ihren Computern führen (künstliche Intelligenz), um ihren Alltag zu optimieren. Die spannende Frage dabei ist nicht, wann das alles eintreffen wird, sondern wie die (künftigen) Generationen mit den modernen Technologien umgehen werden, welche Rahmenbedingungen sie vereinbaren werden, welche Grenzen definiert werden und ob die Menschen darauf vertrauen können, dass ihre Rechte durchsetzbar sind. Die unterschiedlichen Hoffnungen und vielgepriesenen Potenziale, aber auch die durchaus berechtigten Ängste machen deutlich, dass die Entwicklungen und Einsatzmöglichkeiten im Bereich Big Data facettenreich sind. Am Ende lassen sich viele unterschiedliche, kommerzielle, ehrbare, aber auch kriminelle oder fragwürdige Ziele mit Big Data verfolgen. Jedem positiven Beispiel lassen sich im selben Atemzug auch besorgniserregende, jedoch durchaus realistische Szenarien zuordnen. Mit den notwendigen (idealerweise international geltenden) Rahmenbeding- ungen soll eine Balance geschaffen werden, welche die Chancen der Entwick- lung von Big Data beflügeln, ohne die Risiken zu stark in den Mittelpunkt zu stellen. Dieser Balanceakt wird kein einfacher sein, sollte aber möglichst jetzt in diesem frühen Entwicklungsstadium auf internationaler Ebene angegangen Viele Fragen bleiben unbeantwortet Die digitale Welt braucht Regeln Die vielen un terschiedlichen Intere s- sen müssen jetzt diskutiert werden Gefahr des „Loss of trust“ Big Data – die ungezähmte Macht 37 | 4. März 2014 Aktuelle Themen werden. Für viele künftige Probleme und Fragen im Bereich Big Data wird es keine perfekten Lösungen oder endgültigen Antworten geben. Die Herausforde- rungen liegen mitunter darin, einen Weg zu finden, moderne Technologien und Methoden nutzenstiftend in den Alltag der Menschen zu integrieren, ohne dass — Freiheitsrechte und demokratische Leitlinien verletzt werden, — Diskriminierungen oder Manipulationen stattfinden oder — die Angst der Menschen steigt, sich auf digitalen Kanälen aufzuhalten, weil unterschiedliche Akteure massenhaft private Daten ausspähen. Es liegt an uns, als wertvolle und kreative Ideenlieferanten hinter jeder (r)evolutionären Technologie bzw. Innovation, die Zügel fest in der Hand zu behalten, um einen adäquaten Kurs vorzugeben. Möge die Macht mit uns sein. Thomas F. Dapp (+49 69 910-31752, thomas-frank.dapp@db.com) Veronika Heine Literaturverzeichnis Bahr, F. et al. (2012). Schönes neues Internet? Chancen und Risiken für Inno- vation in digitalen Ökosystemen. Policy Brief. Stiftung Neue Verantwortung. Berlin. Beck, S., Grzegorzek, M. et al. (2013). Mit Robotern gegen den Pflegenotstand. Policy Brief 04/13. Stiftung neue Verantwortung. Berlin. Big Data – Vorsprung durch Wissen. Innovationspotenzialanalyse (2012). Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS. Sankt Augustin bei Bonn. Boyd, D., Crawford, K. (2013). Big Data als kulturelles, technologisches und wissenschaftliches Phänomen. Sechs Provokationen. In Geiselberger, H., Moorstedt, T. (2013). Big Data. Das neue Versprechen der Allwissenheit. eBook Suhrkamp Verlag Berlin. Brown, B. et al. (2011). Big data: the next frontier for innovation, competition, and productivity. McKinsey Global Institute. Dapp, T. (2012). Der vermessene Mensch. Biometrische Erkennungsverfahren und mobile Internetdienste. Aktuelle Themen. Deutsche Bank Research. Frankfurt am Main. Dapp, T. (2013). Die Zukunft des (mobilen) Zahlungsverkehrs: Banken im Wett- bewerb mit neuen Internet-Dienstleistern. Aktuelle Themen. Deutsche Bank Research. Frankfurt am Main. Dapp, T. und Heymann, E. (2013). Dienstleistungen 2013. Heterogener Sektor verzeichnet nur geringe Dynamik. Aktuelle Themen. Deutsche Bank Research. Frankfurt am Main. Geiselberger, H., Moorstedt, T., Hrsg. (2013). Big Data. Das neue Versprechen der Allwissenheit (2013). eBook Suhrkamp Verlag Berlin. Ginsberg, Jeremy et al. (2009). Detecting influenza epidemics using search engine query data. Google Inc. Centers for Disease Control and Prevention in Nature Vol. 457. Hayek, F. A. von (2004). Der Weg zur Knechtschaft. 4. Auflage. Mohr Siebeck Verlag. Tübingen. Heuer, S. (2013). Kleine Daten, große Wirkung. Big Data einfach auf den Punkt gebracht. DigitalKompakt LfM #06. Landesanstalt für Medien Nordrhein- Westfalen (LfM). Düsseldorf. Big Data – die ungezähmte Macht 38 | 4. März 2014 Aktuelle Themen Kranzberg, M. (1986). Technology and history: Kranzberg´s laws. In Technology and Culture. 27/2. S. 544-560. Manig, M. und Giere, J. (2012). Quo Vadis Big Data – Herausforderungen – Erfahrungen – Lösungsansätze. TNS Infratest GmbH. München. Mayer-Schönberger, V., Cukier, K. (2013). Big Data. Die Revolution, die unser Leben verändern wird. Redline Verlag. München. Morozov, E. (2013). Big Data. Warum man das Silicon Valley hassen darf. Frankfurter Allgemeine. Feuilleton vom 10.11.2013. Schaar, P. (2013). Big Brother und Big Data – Was heißt eigentlich Datenschutz auf Amerikanisch? Rede anlässlich der 41. Römerberggespräche am 26. Oktober 2013. Frankfurt am Main. Schroeck, M. et al. (2012). Analytics: Big Data in der Praxis. Wie innovative Unternehmen ihre Datenbestände effektiv nutzen. IBM Institute for Business Value in Zusammenarbeit mit der Saïd Business School, Universität Oxford. Weichert, T. (2013). Big Data – eine Herausforderung für den Datenschutz. In Geiselberger, H., Moorstedt, T. (2013). Big Data. Das neue Versprechen der Allwissenheit. eBook Suhrkamp Verlag Berlin. Weichert, T. (2013). Big Data und Datenschutz. Unabhängiges Landeszentrum für Datenschutz Schleswig-Holstein. Weiterführende Literatur Becker, K., Stalder, F. (2010). Deep Search. Politik des Suchens jenseits von Google. Bundeszentrale für politische Bildung. www.bpb.de . Bonn. Bloching, B. et al. (2012). Data Unser. Wie Kundendaten die Wirtschaft revoluti- onieren. Redline Verlag. München. Kurz, C., Rieger, F. (2012). Die Datenfresser. Wie Internetfirmen und Staat sich unsere persönlichen Daten einverleiben und wie wir die Kontrolle darüber zurückerlangen. Fischer Verlag GmbH. Frankfurt am Main. Schmidt, J., Weichert, T. (2012). Datenschutz. Grundlagen, Entwicklungen und Kontroversen. Bundeszentrale für politische Bildung. Bonn. Shapiro, C. und Varian, H. (1999). Information Rules. A Strategic Guide to the Network Economy. Havard Business Review Press, Boston Massachusetts. Fokusthema D eutschland Unsere Publikationen finden Sie unentgeltlich auf unserer Internetseite www.dbresearch.de Dort können Sie sich auch als regelmäßiger Empfänger unserer Publikationen per E - Mail eintragen. Für die Print - Version wenden Sie sich bitte an: Deutsche Bank Research Marketing 60262 Frankfurt am Main Fax: +49 69 910 - 31877 E - Mail: marketing.dbr@db.com Schneller via E - Mail: marketing.dbr@db.com  Ausblick Deutschland: 2% Wachstum in 2015 trotz belastender Beschäftigungspolitik (Aktuelle Themen – Konjunktur) ................................ . 28. Februar 2014  Macht Hollande den Schröder – und wird es funktionieren? (Standpunkt Deutschland) ................................ .......... 24. Febru ar 2014  Industrie 4.0: Upgrade des Industriestandorts Deutschland steht bevor (Aktuelle Themen – Branchen) ................................ ..... 4. Februar 2014  Ausblick Deutschland: Wei ter im Aufwind (Aktuelle Themen – Konjunktur) ................................ ... 27. Januar 2014  Große Koalition – kleinmütige Politik (Standpunkt Deutschland) ................................ ...... 16. Dezember 2013  Deutsche Leistungsbilanzüberschüsse – Kritik nicht stichhaltig (Standpunkt Deutschland) ................................ ...... 12. Dezember 2013  Ausblick: Deutschland: Aufbruch in die Vergangenheit (Aktuelle Themen – Konjunktur) ............................. 29. November 2013  Ausblick Deutschland: Trotz Wachstum in der Kritik (Research Briefing – Konjunktur) ............................ 19. November 2013  Mindestlohn von EUR 8,50: Eine falsche Weichenstell ung (Standpunkt Deutschland) ................................ ........ 4. November 2013  Ausblick Deutschland: Von Übertreibungen und Ängsten (Aktuelle Themen – Konjunktur) ................................ . 31. Oktober 2013   Strukturelle Verbesserungen stützen Sonderstellung (Aktuelle Themen – Konjunktur ) ................................ .......... 1. Jul i 2013  Deutsche Sonderstellung – Gefahr für den Euro? ( Research Briefing – Konjunktur ) ................................ ...... 14. Juni 2013  Die schöne neue Welt der Geldpolitik (Aktuelle Themen) ................................ ............................... 4. Juni 2013  T arifrunde 2013: Kräftiges reales Plus ( Research Briefing – Konjunktur ) ................................ ....... 16. Mai 2013  BIP - Prognose: Leichter Anstieg in Q1, Verlangsamung in Q2 (Aktuelle Themen) ................................ ............................. 30. April 2013  Wieder die Insel der Glückseligen? ( Research Briefing – Konjunktur ) ................................ ..... 12. März 2013 © Copyright 2014. Deutsche Bank AG, Deutsche Bank Research, 60262 Frankfurt am Main, Deutschland. Alle Rechte vorbehalten. Bei Zitaten wird um Quellenangabe „Deutsche Bank Research“ gebeten. Die vorstehenden Angaben stellen keine Anlage-, Rechts- oder Steuerberatung dar. Alle Meinungsaussagen geben die aktuelle Einschätzung des Verfassers wieder, die nicht notwendigerweise der Meinung der Deutsche Bank AG oder ihrer assoziierten Unternehmen entspricht. Alle Meinungen können ohne vorherige Ankündigung geändert werden. Die Meinungen können von Einschätzungen abweichen, die in anderen von der Deutsche Bank veröffentlichten Dokumenten, einschließlich Research-Veröffentlichungen, vertreten werden. Die vorstehenden Angaben werden nur zu Informations- zwecken und ohne vertragliche oder sonstige Verpflichtung zur Verfügung gestellt. Für die Richtigkeit, Vollständigkeit oder Angemessenheit der vorste- henden Angaben oder Einschätzungen wird keine Gewähr übernommen. In Deutschland wird dieser Bericht von Deutsche Bank AG Frankfurt genehmigt und/oder verbreitet, die über eine Erlaubnis der Bundesanstalt für Fi- nanzdienstleistungsaufsicht verfügt. Im Vereinigten Königreich wird dieser Bericht durch Deutsche Bank AG London, Mitglied der London Stock Ex- change, genehmigt und/oder verbreitet, die in Bezug auf Anlagegeschäfte im Vereinigten Königreich der Aufsicht der Financial Services Authority unter- liegt. In Hongkong wird dieser Bericht durch Deutsche Bank AG, Hong Kong Branch, in Korea durch Deutsche Securities Korea Co. und in Singapur durch Deutsche Bank AG, Singapore Branch, verbreitet. In Japan wird dieser Bericht durch Deutsche Securities Limited, Tokyo Branch, genehmigt und/oder verbreitet. In Australien sollten Privatkunden eine Kopie der betreffenden Produktinformation (Product Disclosure Statement oder PDS) zu jeglichem in diesem Bericht erwähnten Finanzinstrument beziehen und dieses PDS berücksichtigen, bevor sie eine Anlageentscheidung treffen. Druck: HST Offsetdruck Schadt & Tetzlaff GbR, Dieburg Print: ISSN 1430 - 7421 / Internet: ISSN 1435 - 0734 / E - Mail: ISSN 1616 - 5640