ÜberblickDownload Whitepaper Big Data - Verlässlichkeit – das fehlende Puzzlestück

Der Begriff „Big Data" ist in den letzten Jahren in den allgemeinen Sprachgebrauch übergegangen. Erklärt wird er mit den „3 Vs" volume, variety und velocity: großes Datenvolumen (volume) aus einer Vielzahl an Quellen (variety), welches das Unternehmen mit hoher Geschwindigkeit (velocity) erreicht. Es gibt aber zudem noch ein viertes V, das ebenso zentral ist, wenn Big Data gewinnbringend genutzt werden sollen: Verlässlichkeit (veracity), das heißt: Kann man den Daten vertrauen?Big Data - Die 3 Vs Woher wissen wir, woher die Daten stammen? Inwieweit wurden sie seitdem verändert? Stammen die Daten überhaupt aus einer direkten Quelle oder kommen sie bereits aus zweiter Hand?

Betreiber von Big-Data-Technologieplattformen konzentrieren sich bislang verständlicherweise auf die ersten drei Vs und bieten Tools an, mit Hilfe derer man besser mit dem Volumen, der Vielfalt und der Geschwindigkeit der Daten umgehen kann. Oftmals werden Daten und Datenquellen dabei jedoch nicht auf ihren Wahrheitsgehalt geprüft. Vielmehr verlassen sich diese Anbieter darauf, dass die Endbenutzer die Plattform mit Daten füttern und die Hardware für die Analytik hosten. Wie bereits in einem früheren Whitepaper von LexisNexis „Investitionen in Big-Data-Technologie nutzen", diskutiert, wurden externe Aggregatoren bis vor Kurzem als Quellen von Big Data übersehen. Mit steigender Wertschätzung von und Bewusstsein für durch Dritte aggregierte Daten stellt sich immer weniger die Frage „Sollte ich Daten von Dritten nutzen?" als vielmehr die Frage „Vertraue ich den Daten von Dritten, die ich in meine Ergebnisse einfließen lasse?" Als ein externer Aggregator von Tausenden Quellen in den Bereichen Nachrichten, Wirtschaft und Recht schließt LexisNexis eine Lücke, die Big-Data-Plattformanbieter bei der Verlässlichkeit offen lassen. Die Daten von LexisNexis sind geprüft, unverändert und aktuell.

Verlässlichkeit definiert

Organisationen sammeln und verarbeiten Big Data aus einem einzigen Grund: Sie wollen fundierte, erfolgskritische Entscheidungen treffen. Somit ist Verlässlichkeit – definiert als „Übereinstimmung mit der Wahrheit bzw. den Tatsachen" – unbedingt erforderlich. Wie genau können Sie aber sicherstellen, dass die Daten, mit denen Sie arbeiten, der Wahrheit entsprechen? Es gibt drei Schlüsselelemente der Zuverlässigkeit von Daten:

  • Die Daten können zu ihrer Quelle zurückverfolgt werden. Heutzutage ist das Internet für fast alle die erste Anlaufstelle für Informationen. Warum auch nicht? Es ist schnell, einfach und bequem. Aber dass die Informationen verfügbar sind, bedeutet noch nicht, dass sie auch richtig sind. Sie müssen wissen, woher die Daten stammen, um entscheiden zu können, ob es sich um eine zuverlässige Quelle handelt. Externe Aggregatoren wie LexisNexis können Sie auf die ursprüngliche Datenquelle verweisen und bieten Zugriff auf den gesamten Datenkontext, einschließlich der entsprechenden auf die Daten angewandten Metadaten. So können Sie die Vertrauenswürdigkeit der Quelle bewerten.
  • Die Daten wurden nicht verändert. Ein großer Teil der kostenlosen oder übernommenen Informationen, der im Internet zu finden ist, wurde gekürzt oder redaktionell aufgearbeitet und man kann lediglich Vermutungen über fehlende Teile anstellen. Ein fehlender Gesamtüberblick bedeutet, dass auf die Daten kein Verlass ist – Kontextinformationen sind entscheidend für Verlässlichkeit. Auch hier bekommen Sie von einem externen Aggregator genau die Informationen, die ursprünglich gegeben wurden, und zwar absolut vollständig. LexisNexis verwendet ein Smart Indexing-Schema und Metadaten, um die Suchfunktion zu verbessern. Die Daten selbst werden weder verändert noch kommentiert, vielmehr werden die Daten genau so präsentiert wie in der Originalquelle.
  • Die Daten sind aktuell. Um Entscheidungen zu treffen, sind absolut aktuelle Informationen vonnöten – Informationen, die zum Zeitpunkt der Analyse wahrheitsgemäß und gültig sind. Jede Woche ist eine enorme Zahl von neuen oder geplanten Vorschriften, gesetzgeberischen Entscheidungen und Gesetzen zu beachten. Für eine wohlinformierte Analyse sind die neuesten Informationen unerlässlich; nicht nur die Gesetzesänderungen selbst, sondern auch Hintergrundinformationen über die Verabschiedung. LexisNexis aggregiert Daten aus mehr als 26.000 internationale Nachrichten- und Unternehmensquellen, wobei wir auf viele davon exklusiven Zugriff haben, mehr als 800 Nachrichtenagenturen und über 8.000 Zeitschriften, Fachzeitschriften und Newslettern.

Verlässlichkeit von Daten in der Praxis

Die Bedeutung von Verlässlichkeit für Big Data kann nicht genug betont werden. Die folgenden Beispiele verdeutlichen, wie zentral die Fähigkeit zur Datenüberprüfung wirklich ist – für Unternehmen ebenso wie für Regierungsstellen.

  • Um Kosten zu kontrollieren und Betrugsfälle zu reduzieren, müssen Unternehmen und Institutionen sicherstellen, dass die von ihnen beauftragten Unternehmen gültige Gesetze befolgen. Nun stellen Sie sich vor, einer Ihrer Lieferanten ist in einen Rechtsstreit verwickelt oder wird übernommen und ändert daraufhin kritische Teile seiner Lieferkette. Plötzlich könnte für Sie das Risiko bestehen, betrügerisch produzierte Waren oder Dienstleistungen zu erwerben, ohne es zu wissen. Mit aktuellen, überprüfbaren Daten zu ihren Lieferanten können sich Unternehmen vor Risiken wie Betrug und Preistreiberei schützen.
  • Technologieplattformen können die Auftragnehmer und Lieferanten eines Unternehmens überprüfen – auch Unterlieferanten, die sich ganz oder teilweise in ausländischem Eigentum befinden. Mit nachvollziehbaren und aktuellen Unternehmensdaten in den Tools zur Überprüfung von Lieferanten können zuverlässigere Ergebnisse bezüglich des Erfolgsrisikos eines Lieferanten erzielt werden.
  • Um unternehmerisch bestehen zu können, war schon immer ein gewisser Wettbewerbsvorteil vonnöten, aber das schwierige wirtschaftliche Umfeld der vergangenen Jahre hat diese Notwendigkeit noch verschärft. Für ein Unternehmen, das ein neues Produkt auf den Markt bringt, ist Timing alles – ein Tag oder eine Woche können den Unterschied zwischen Erfolg und glorreichem Scheitern bedeuten. Die Fähigkeit, die Handlungen der Wettbewerber mit stimmigen und aktuellen Daten zu analysieren und vorherzusagen, erlaubt es einem Unternehmen, bei Markteinführungen proaktiv vorzugehen. Das Wissen, dass Investoren eine Messe oder ein Meeting besuchen werden, bei der/dem einer Ihrer Wettbewerber zu den prominentesten Ausstellern gehört, weist beispielsweise auf eine wichtige Ankündigung hin. Ihrem Unternehmen gibt dieses Wissen die Chance, kurzfristig noch vor der Messe strategisch zu handeln, um die Auswirkungen der Ankündigung Ihres Wettbewerbers abzufangen. Ein weiteres Beispiel für den Wert gültiger Daten ist eine Analyse historischer Informationen darüber, wie ein Wettbewerber in der Vergangenheit Produkteinführungen angegangen hat. Auch dadurch bekommen Sie die Chance, als Erster zu handeln und sich einen Marktvorteil zu verschaffen.
  • Ob es nun um Streitfälle, Wettbewerbsbeobachtung, eine öffentliche Untersuchung zur Einhaltung von Gesetzen oder eine Länderanalyse geht – Sie müssen sich stets sicher sein können, dass Sie keine entscheidenden übersehen – dies gilt auch für Patentdaten. Aktuelle Informationen zum rechtlichen Status und das Sammeln von Zitierungen und Entgegenhaltungen sind unerlässlich für strategische Entscheidungen zum Schutz geistigen Eigentums oder um Wettbewerber und Übernahmeziele zu verstehen.

Zusammenfassung

Big Data wird üblicherweise definiert als große Datenvolumen (volume) aus einer Vielzahl von Quellen (variety), welche die Organisation mit einer hohen Geschwindigkeit (velocity) erreichen. Es gibt jedoch noch einen weiteren Aspekt, der ebenso wichtig ist: Verlässlichkeit (veracity). Während das Versprechen der ersten drei Vs darin besteht, umfassende Analyseprozesse zu ermöglichen, erlaubt Verlässlichkeit eine tatsächliche Entscheidungsfindung auf Grundlage überprüfbarer Daten.

Das Internet ist zwar eine schnelle und bequeme Quelle von Big Data, oft finden sich aber lediglich Abstracts, irreführende Überschriften ohne belegbare Fakten oder Inhalte ohne Verweise und Quellenangaben. Der sich daraus ergebende Mangel an Verlässlichkeit erfordert einen größeren menschlichen Analyseaufwand. Dadurch entstehen nicht nur Kosten für die professionelle Auswertung und weitere Untersuchung der Daten, sondern es ergibt sich auch ein Fehlerpotenzial.

Externe Aggregatoren, die Inhalte lizensieren, die die Quelle der Inhalte angeben, den vollständigen Text der Inhalte archivieren und den Inhalt nicht verändern, sind ideale Quellen von Big Data. LexisNexis erfüllt all diese Kriterien. Die besonderen Stärken des Unternehmens liegen in den Bereichen Vielfalt und Verlässlichkeit. Mit über 26.000 nationalen und internationalen gesicherten Quellen ist LexisNexis eine einzelne, verlässliche Quelle aggregierter Nachrichten, Wirtschaftsinformationen und Rechtsinformationen. Diese sind stets aktuell, rückverfolgbar und unverändert – so wird Authentizität der Daten gewährleistet, die die Grundlage für erfolgskritische Entscheidungen bilden.


Dieses Dokument dient ausschließlich Informationszwecken. Die Angaben zu Funktion und Eigenschaften der vorgestellten Produkte von LexisNexis sind ohne Gewähr. LexisNexis gibt keine Garantie für die Vollständigkeit und Richtigkeit dieses Dokuments. Soweit von Dritten erstellt, geben die Ansichten nicht notwendigerweise die Ansichten von LexisNexis wieder.

Stand: 02/2015

Nehmen Sie Kontakt mit uns auf
Wir melden uns schnellstmöglich bei Ihnen zurück!
  • Sie sind bereits Kunde und benötigen Unterstützung
  • Sie interessieren sich für ein Produkt und benötigen weitere Informationen
  • Sie möchten einen Termin für eine individuelle und unverbindliche Online-Demo vereinbaren

Wir freuen uns auf Ihre Kontaktaufnahme!