Was ist Big Data?
Inhaltsverzeichnis
Der aus dem englischen Sprachgebiet stammende Ausdruck Big Data steht in dichtem Bezug mit dem umfangreichen Verfahren der Datafizierung und benennt Datenmengen, welche zum Beispiel zu stark, zu kompliziert, zu vergänglich oder zu schwächlich konstruiert sind, um sie mit händischen und gängigen Techniken der Datenverarbeitung zu analysieren.
Oft als Sammelbezeichnung für digitale Techniken benutzt wird Big Data. Sie werden in praktischer Sicht für eine neue Epoche sprunghafter Verständigung und Weiterverarbeitung und in gesellschaftlicher Sicht für einen sozialen Umschwung schuldig gesprochen.
Dabei unterliegt der Terminus als Parole einer andauernden Veränderung. so wird damit beiläufig ebenfalls häufig das Gebilde der Techniken geschildert, die zum Sammeln und Deuten dieser Datenmassen benutzt werden.
Welche Bedeutung besitzt der Begriff Big Data?
Das Big bezieht in der Begriffsbestimmung von Big Data sich auf die vier Ausmaße.
- volume,
- velocity,
- variety sowie
- veracity.
Diese Begriffsbestimmung wird erweitert um die zwei V value und validity, welche für einen unternehmerischen Wertzuwachs und die Sicherstellung der Datenbeschaffenheit stehen.
Welche weitere Bedeutungen hat der Begriff?
Die Bearbeitung von riesigen, komplizierten und sich rasch ändernden Datenmassen bezeichnet Big Data vorrangig. Der Ausdruck bezeichnet als Buzzword in den Medien aber andere Sinngehalte:
- Zunehmende Überwachung der Leute durch Nachrichtendienste zudem in westlichen Nationalstaaten bspw. durch Vorratsdatenspeicherung
- Verwundung von Persönlichkeitsrechten von Kundschaften durch Firmen
- Zunehmende Intransparenz der Vorratsdatenspeicherung durch Delokalisierung
- Begehren der Branche aus den verfügbaren Datenansammlungen einen Wettbewerbsvorteil möglicherweise zu erhalten
- Automatisierung von Herstellungsprozessen
- Intransparente Automatisierung von Entscheidungsprozessen in Softwareanwendung
- Einsatz neuartiger Techniken statt Standardprogramme
- Erarbeitung von selbstständigen Programmlösungen statt der Verwendung von off-the-shelf Softwareanwendung durch Fremdbetriebe
- Auf Angaben über die Internetbenutzung und Handygebrauch beruhende Werbeanzeige
- Organisierung von Kooperation im Zusammenhang von People Analytics Vorhaben, sogar wenn in diesem Projekt zum Teil weder enorme noch komplizierte Datenmassen anfallen
Woher stamm die die Daten?
Aus unterschiedlichsten Informationsquellenkönnen die gesammelten Datenmaterialien dabei kommen:
- Aufnahmen unterschiedlichster Überwachungssystematiken
- die Verwendung von Kundenzahlkarten oder Bankzahlkarten beziehungsweise Bezahlkarten,
- jegliche elektronische Verständigung, dabei ebenso die individuell geprägte, persönlich verschiedenartige Weise und Machart der Nutzung zum Beispiel eines Handys,
- kommerzielle beziehungsweise persönliche Benutzung elektronischer Gerätschaften oder Anlagen wie Fitnessarmbänder beziehungsweise Gesundheitsarmbänder beziehungsweise Wearables wie Activity Tracker oder Smartwatches, Ambient Assisted Living oder weltweiter Navigationsgeräte wie GPS, Handys, Rechner und so mehr,
- die Verwendung von Social-Media-Informationen und -Interaktionen,
- Kraftfahrzeuge,
- vernetzte Technologie in Behausungen,
- von Verwaltungen und Firmen erhobene und gesammelte Datenansammlungen.
Big Data umfasst außerdem Gebiete, die als intim beziehungsweise privat gelten. Der Bedarf des Industriezweigs und mancher Instanzen, tunlichst einfachen Zugang auf diese Angaben zu erzielen, sie stärker untersuchen zu können und die gewonnenen Einsichten zu verwenden, gerät dabei unausweichlich in Widerstreit mit geschützten Persönlichkeitsanrechten der Einzelnen.
Einzig durch eine Anonymisierung der Datenmaterialien zu erzielen ist eine Lösung. Anbieter gesellschaftlicher Netze und von Suchmaschinen sind klassische Nutzer. In vielen Gebieten ist die Auswertung, Erhebung und Bearbeitung von riesigen Datenmassen heutzutage üblich.
Geschäftsprozess-Verbesserungen in allen Funktionsfeldern von Firmen, vor allem aber im Gebiet der Technologieweiterentwicklung und Informationstechnologie sowie der Absatzwirtschaft hervorbringen kann Big Data. Zur öffentlichen Sicherheitsleistung dient die Datenerhebung und Ausnutzung der Datenmassen dabei generell oder der Ausführung von Unternehmenszielsetzungen.
Weiterentwickelt und einträglich verwendet werden sollen die erfassten Angaben, vor allem riesige Industrien, Firmen und Anwendungsgebiete der Volkswirtschaft, Marktuntersuchung, Veräußerungssteuerung und Servicelenkung, Medikament, Leitung und Geheimdienste haben bislang die dementsprechenden digitale Methodiken für sich benutzt. Um zukunftsweisende und eventuell gewinnbringende Fortentwicklungen zu bemerken und in Voraussagen umzumünzen dient die Datenerhebung der Angaben dabei üblicherweise für konzernorientierte Geschäftsideen sowie Trenderforschung in den gesellschaftlichen Medien und Werbeprüfungen.
Was ist Wachstum bei Big Data?
Exponentiell wächst die Anzahl von Datenansammlungen üblicherweise. Das weltweite erzeugte Datenaufkommen verdoppelt, Ausrechnungen aus der Zeit um genau 2011 zufolge, sich alle 2 Jahre. Vor allem gedrängt durch die vermehrte maschinelle Produktion von Datenansammlungen zum Beispiel über Verbindungsprotokolle von Telekommunikationsanbindungen und Webzugriffen, automatische Erhebungen von RFID-Lesern, Fotokameras, Mikrophonen und anderweitigen Fühlern wird diese Weiterentwicklung.
Sowie im Energiebereich und im Gesundheitssystem fallen Big Data ebenso in der Finanzwirtschaft an. Auch enorme Datenmassen fallen in der Forschung an, zum Beispiel in der Geologie, Erbforschung, Klimatologie und Atomforschung. Big Data als eine Tendenz im Jahr 2012 genannt hat der IT-Branchenverband Bitkom. Der verschwenderische Kostenaufwand für einen Speicher auf Bestand verbietet bei enormen Datengebäudekomplexen sich. So speichert man rein die Metainformationen oder die Anayse wird direkt oder etwas verzögert bei der Erhebung der Daten gestartet.
Die richtigen Konzernunternehmen, beispielsweise Suchmaschinen, und bestimmte staatliche Einrichtungen, beispielsweise Nachrichtendienste haben Zugriff zu einem passenden Datenaufkommen.
Was für Beispiele gibt es bei Big Data?
Neue Erleuchtungen können in der Erforschung durch Verbindung bedeutender Datenmassen und statistische Verwertungen erhalten werden, speziell in Fachdisziplinen, in denen bislang viele Angaben derzeit noch manuell verwertet wurden. In der Kriminalistik und Terrorabwehr erhoffen staatliche Stellenangebote sich stärkere Resultate, Wege zur Erwerbung von Konkurrenzverhältnisvorteilen, zur Schaffung von Ersparnispotentialen und zur Bildung frischer Geschäftsbereiche erhoffen Firmen sich zum Beispiel von der Untersuchung von Big Data.
Im folgenden einige Musterbeispiele für erwartete Nutzen.
- Errichtung elastischer Billingsystematiken in dem Fernmeldewesen
- Auffinden von Fachpersonal durch datengestützte Webuntersuchungen
- Bessere, zügigere Marktuntersuchung
- Bonitätsprüfung
- Informationszugriff und -analyse raumzeitlicher Rastergrößen in Forschung und Industriezweig, zum Beispiel nach dem Open-Geospatial-Consortium-Standard
- Direktvermarktung: gerade, individuelle Rede von zum Beispiel Abnehmern oder zum Beispiel Wählerschaften zur Einflussnahme von Kaufentscheidungen beziehungsweise Wahlentscheiden oder mit der Zielsetzung anderweitiger Meinungseinflussnahme oder Verhaltensweisebeeinflussung
- Aufspüren von Regelwidrigkeiten bei Finanzgeschäften
- Einleitung und Verbesserung einer schlauen Energieverbrauchsbedienung
- Ermitteln von Verknüpfungen in der ärztlichen Diagnostik
- Aufstellung von Bewegungsprofilen, Ankaufprofilen, Persönlichkeitsprofilbildern
- Echtzeit-Crossselling und Upselling im E-Commerce und vor Ort Verkauf
- Fabrikanlagesteuerung, Fertigungsplanung und voraussehende Wartungsaktionen im Zusammenhang von Industrie 4.0
- Geheimdienstliches Abfertigen von Bewegungsprofilen mit Programmen wie Boundless Informant
- IT Operations Analytics: Das Gebrauchen der Big Data-Prozesse auf IT-Systeme, um wirksames und einfallsreiches IT-Management zu unternehmen.
- Verwertung von riesigen Datenmassen in der Agrikultur
- Risikowertung und Adaptierung von Versicherungsprämien in Abhängigkeitsverhältnis vom Verhaltensmusterung
- Voraussage von Seuchen
- Besserungen der Arbeitsbedingungen für Belegschaften, beispielsweise die Reduktion von Burnout Ratenbeträgen, durch datenbasierte Change Vorhaben
- Bearbeitung von Angaben aus Meteorologiesatelliten und anderen naturwissenschaftlich eingesetzten Messfühlern
- Zeitnahe Begutachtung von Webtabellen und Adaptierung von Onlinewerbeaktionen
Bei vielen Applikationen aus der Absatzwirtschaft handelt häufig es sich reichlich mehr um Small-Data-Analytics. Die eigentliche Auswertung von Kundenangaben allerdings noch nicht zwangsläufig Big Data.
Wie findet die Verarbeitung von Big Data statt?
So enorme Datenmassen zu bearbeiten ist den klassischen relationalen Datenbanken sowie Statistikprogrammen und Visualisierungsprogrammen häufig nicht gegeben. Neue Sorten von Datenspeicher- und Analyse-Systemen kommen für Big Data daher zur Verwendung. Diese können simultan auf bis zu Hunderten oder Tausenden von Hauptprozessoren beziehungsweise Serveranwendungen arbeiten wie beispielsweise in intellektuellen Systematiken.
Nachfolgende Challenges gibt dabei es unter anderem:
- Bearbeitung vieler Daten
- Bearbeitung vieler Spalten innerhalb einer Eintragung
- Schnelle Einfuhr riesiger Datenmassen
- Sofortige Aufruf importierter Datenansammlungen
- Kurze Responsezeiten ebenfalls bei komplizierten Anfrage
- Option zur Weiterverarbeitung vieler zeitgleicher Anfragen
- Untersuchung unterschiedlicher Informationsarten
Noch am Anfang steht die Entwicklung von Anwendungen für die Bearbeitung von Big Data. Der MapReduce-Ansatz ist bekannt. Er kommt bei Open-Source-Software sowie bei einigen gewerblichen Erzeugnissen zum Verwendung.
Welche Anwendungsfälle für Big Data gibt es?
Politische Wahlen
Bei der Präsidentenwahl in den USA 2016 sowie bei der Volksabstimmung in Großbritannien über die Entlassung aus der Europäischen Union im selben Jahr hatten die unerwarteten Sieger immer die Firma Cambridge Analytica beschäftigt, die sich mit der Erfassung, Verwertung, Verwendung und Einteilung sowie mit dem Absatz primär im Netz gewonnener subjektiver Angaben beschäftigt und Ansätze der Psychometrik anwendet, einem Abkömmling der Seelenkunde.
Social scoring
Zu der Beurteilung zum Beispiel der Bonität, des Wohlseins oder des Konsumverhaltens und Einkaufsverhaltens von Konsumenten herangezogen, außerdem zu der Analyse passender Vorhersagen werden gesammelte Angaben. In China baut auf ihnen das Social scoring-System auf, mit dem auch das soziale Verhalten der Einwohner kontrolliert und bewertet wird und verbessert werden soll.
Bildungswesen
Für das Bildungswesen eröffnet der Gebrauch von Big Data neue Chancen. Zur Verbesserung von Lernformungen und Bildungsprogrammen eingesetzt werden kann die Technologie. Mit einem fundamentalen Umschwung des Ausbildungssektors durch den Gebrauch von Big Data rechnen Fachmänner wie Viktor Mayer-Schönberger und Kenneth Cukier.
Forschung
Erheblich verlässlichere Resultate können durch die Progresse in der Datenverarbeitung anhand enormer Datenunzahl erreicht werden. Exempel sind eine Untersuchung mit ca. 16.000 Jugendlichen, in der Verknüpfungen zwischen Dickleibigkeit und Zuckerkrankheit geprüft wurden, und eine Fall-Kontroll-Studie zur Wirkung von Fluglärm, bei der die Krankenkassendaten von mindestens einer Million Klienten durchgearbeitet wurden.
Microtargeting
Verlautbaren, dass die Benutzung sogenannter Microtargeting-Techniken maßgeblich zum Wahlgewinn von Donald Trump mitgewirkt haben soll, ließ das Unternehmen Cambridge Analytica nach der US-Präsidentschaftswahl 2016. Man habe so durch psychometrischer Untersuchungen von enormen Daten unentschlossene beziehungsweise einfacher zu überzeugende Wählerschaften erkennen und danach zielgerichtet via Facebook mit auf sie zugeschnittenen Stimmenwerbungen und Contents analysieren können.
Forschungstätigkeiten des Psychoanalytikers Michal Kosinski waren dem Gebrauch betreffender Methoden im US-Wahlkampf vorangegangen. Kosinski verknüpfte darin Big-Data-Auswertungen mit psychischen Verhaltensweiseanalysen und Kosinski konnte nachweisen, dass sich anhand der Facebook-Likes von Benutzern deren Persönlichkeitsmerkmale, die sexuelle Ausrichtung, Drogenkonsum sowie die spirituelle und politische Haltung voraussagen lassen.
Kritik
Die US-amerikanische Wirtschaftswissenschafterin Shoshana Zuboff prägte in Verbindung mit der Ansammlung von menschenbezogenen Angaben durch Internetfirmen wie Google und Facebook die Bezeichnung Überwachungskapitalismus und sieht darin eine Abwandlung des Wirtschaftskapitalismus, der das heimische menschliche Erlebnis für offen erhältlichen Rohstoff für die kapitalistische Herstellung und den Handel hält und der die Durchbrüche der Digitalen Revolution zur geheimer Bewachung, Ansammlung, Beeinflussung und Voraussage humanoider Verhaltensweise nutzt.
Die Zerstörung der solche Datenmonopole bildenden Unternehmen und Sperren befürwortet Zuboff, um die Schaffung von Datenkonzentrierungen abzubrechen. Ihr Taschenbuch „Das Zeitalter des Überwachungskapitalismus“ erschien 2018 in deutscher Ausführung.
Wie Forschungsfolgen verschiedener Wissenschafter wiederspiegeln, lassen sich aus den von Benutzern zweigeteilten Contents im Netz teilweise stark sensitive Angaben herausziehen, die nicht intendiert wurden, getrennt zu werden. Rechtsstaatliche Reglementierungen der Informationsspeicherung und -sammlung gewinnen zur Sicherung des digitalen Privatlebens daher ständig mehr an Bedeutsamkeit. Wie das Sozialkredit-System in China zeigt, wird Big Data ebenfalls auf Staatsniveau teilweise benutzt, um Informierungen über Einzelpersonen zusammenzutragen.
Datenschutz
Der Datenwissenschafter Andreas Dewes hat in einer Studie nachgewiesen, dass anonymisierte Angaben von Internetnutzern, die von Unternehmen erhoben und veräußert wurden, erneut entziffert und Menschen beigeordnet werden können.
Kolleginnen des Deutschen Bundestags und von Länderparlamenten sowie beträchtlichere Menschen der allgemeinen Lebensführung wie Richter, Polizisten oder andere Vertreter waren aus den von Dewes im Zusammenhang seiner Ermittlung von Werbeunternehmen gekauften, vermeintlich namenlosen Datenmaterialien von cirka drei Millionen Deutschen.
Unter anderem die Gefährdung einer graduellen Entsolidarisierung in der Versicherungsgesellschaft wird mit Zusammenhang auf die Versicherungsbeitragsadaption mittels Big Data betont.
Weshalb ist die Regulierung unzureichend?
Eine bestimmende Fragestellung ist, wem die von Privatmenschen gesammelten Datenansammlungen gehören, wer die Nutzungshoheit über sie hat und wer ihre Verwendung überwacht. In welchem Umfang die europäische Datenschutz-Grundverordnung, die seit 25. Mai 2018 anzuwenden ist, ausreicht, wird in der Bevölkerung erörtert.
Chancen des informationellen Autoritätsmissbrauchs durch Manöver, Diskrimination und informationelle wirtschaftliche Ausbeuterei – verknüpft mit dem Verstoß der Fundamentalrechte der Leute eröffnet Big Data. Hiervor warnte der schleswig-holsteinische Datenschützer Thilo Weichert 2013.
Vor eventuellen Techniken sublimer Trickserei auf Grundlage von Big Data warnte Dirk Helbing, Hochschulprofessor für Computational Social Science an der ETH Zurich im Januar 2018. Niemals in der Menschheitsgeschichte habe es so gutartige Voraussetzungen für eine diktatorische Herrschsucht gehabt wie heutzutage, warnt der Technikfolgenabschätzer Armin Grunwald, Chef des Institut für Technikfolgenabschätzung und Systemanalyse in Karlsruhe.
Um die Vorzüge von Big Data für das Allgemeinwohl verwenden zu können setzt sich der Gesellschaftlichforscher Nils Zurawski für eine solidarische Vorratsdatenspeicherung ein.
Gibt es eine mangelhafte Basis für die Betrachtungen?
Beanstandung gibt es vor allem daran, dass die Datensammlung und -auswertung grundsätzlich exklusiv nach geschickten Gesichtspunkten erfolgt und zum Beispiel der praktisch simpelste Pfad ausgewählt wird, die Angaben zu generieren.
Häufig ignoriert werden statistische Prinzipien wie das einer bestimmenden Probe. Die Sozialwissenschaftlerin Danah Boyd kritisierte so:
- Qualitativ erfolgreichere Angaben müssten größere Datenmassen nicht sein
- Ebenso bedeutend seien nicht alle Datenmaterialien
- Zwei verschiedene Fragestellungen seien Was und Warum
- Sorgfalt sei bei Auslegungen verlangt
- Es sei nicht moralisch akzeptierbar, lediglich weil es erhältlich ist.
Ein Wissenschaftler bestimmte zum Beispiel, dass Leute maximal 150 Bekanntschaften pflegen, was nachfolgend als technische Beschränkung in gesellschaftlichen Netzen eingebracht wurde – in der falschen Vorstellung, als Gefährten bezeichnete Freundschaften würden echte Bekanntschaften spiegeln. Eine reine Kommunikationsbereitwilligkeit signalisiert der Terminus eines Kumpels bei Facebook, jedoch würde jeder gewiss nicht alle seine Facebook-Freunde in einem Gespräch als Gefährte betiteln-.
Ob Big Data die Beendigung aller Hypothesen bedeutet, setzt eine andere despektierliche Herangehensweise sich mit der Fragestellung auseinander. Chris Anderson, Chefredaktor beim Zeitschrift Wired beschrieb 2008 die Glaubwürdigkeitsproblematik jeder theoretischen Vermutung und jedes Models bei zeitgleicher Echtzeituntersuchung lebendiger und nicht lebendiger Systematiken. Zusammenhänge werden bedeutender als kausale Erklärungsandeutungen, die sich häufig erst verspätet bekräftigen oder fälschen lassen.
Big Data als Hype und als schwammiges Wort ?
Der Ausdruck Big Data wird mitunter ebenfalls benutzt, wenn Angaben weder riesig noch kompliziert sind oder sich nicht rasch ändern oder mit konventionellen Methoden problemfrei bearbeitet werden können. Die vermehrte Vermischung des Terminus führt nach Ansicht einiger Betrachter dazu, dass er zunehmend ein aussageloser Marketinggedanke werde und vielen Schätzungen zufolge innerhalb der folgenden Jahre eine starke Entwertung erfahre.