Data Warehouse oder Data Lake
20 Mai

Data Warehouse oder Data Lake

Data Lakes und Data Warehouses sind Schlagwörter, die man hört, wenn es um die Datenaufbewahrung im Kontext mit Big Data geht. Tatsächlich bezeichnen sie auch zwei unterschiedliche Ansätze. Der “See” ist beim Data Lake tatsächlich ein stimmiger Begriff: Ein großes Becken gefüllt mit Rohdaten die unstrukturiert und noch ohne bestimmte Verwendung dort aufbewahrt werden. Ein Data Warehouse dagegen hält geordnet strukturierte, gefilterte Daten auf Vorrat. Zu welchem Zweck sollt man welchen Ansatz verwenden?

Ein Ort sie alle zu finden

Unternehmen erhalten riesige Datenmengen, auf unterschiedlichsten Wegen und verschiedenen Quellen. Sie gehen oft über das hinaus, was herkömmliche relationale Datenbanken bewältigen können. Man benötigt dazu zusätzliche Systeme und Tools zur Verwaltung.

So entstehen neue Erkenntnisse, werden Trends sichtbar um Entscheidungen ab vom Bauchgefühl leichter zu machen.


Alle diese Daten-Speicher haben eine Aufgabe: Sie beherbergen Daten für Geschäftsberichte und Analysen. Aber sie unterscheiden sich in ihrem Zweck, ihrer Struktur, den Datentypen, Herkunft und wer Zugriff auf sie hat.
Oft kommen die Daten in diese Speicher zunächst aus Systemen, die Daten generieren – CRM, ERP, HR, Finanzanwendungen und andere ähnliche Anwendungen. Die aus diesen Systemen erstellten Datensätze werden gemäß der dort hinterlegten Regeln teils angewendet oder/und erzeugt. Danach landen sie in einem zentralen Speicher. Dort können sie dann mit Analysewerkzeugen ausgewertet und in verschiedenen Kontexten interpretiert werden. So entstehen neue Erkenntnisse, werden Trends sichtbar um Entscheidungen ab vom Bauchgefühl leichter zu machen. Viele Unternehmen nutzen sowohl einen Data Lake als auch ein Data Warehouse, um das Spektrum ihrer Datenspeicheranforderungen abzudecken.

Was ist ein Data Lake?

Ein Data Lake ist ein riesiges Repository, das Rohdaten in ihrem ursprünglichen Format speichert. Dass ein Data Lake dabei ganz unterschiedlichen Strukturen speichern kann, ist ein wesentliches Merkmal und Vorteil. Dabei wird jedes gespeicherte Datenelement mit einem eindeutigen Bezeichner und Metadaten versehen. So kann es bei Bedarf wiedergefunden und zugeordnet werden. Einen vordefinierten Zweck haben dabei die einzelnen Datensätze meistens nicht. Es sammelt man Daten mehr nach einem Vorratsprinzip: Was man hat, hat man.

Es sammelt man Daten mehr nach einem Vorratsprinzip: Was man hat, hat man.



Dabei kommt einiges zusammen, was viele Anwender in Cloud zu den großen Datenspeichern auswandern lässt.
Data Lakes werden typischerweise von Data Scientists und Ingenieuren genutzt, die es vorziehen, Daten in ihrer Rohform zu untersuchen, um neue, einzigartige Geschäftseinblicke zu gewinnen.
Sie bedienen dabei Disziplinen wie Predictive Analytics, Machine Learning, Data Visualisierung, BI, Big Data Analytics.

Die Speicherkosten sind in einem Data Lake im Vergleich zu einem Data Warehouse relativ günstig. Data Lakes sind auch weniger zeitaufwendig zu verwalten, was die Betriebskosten reduziert.

Was ist ein Data Warehouse?

Ein Data Warehouse ist ein Speicher für Daten, die Geschäftsanwendungen für einen vorgegebenen Zweck gesammelt oder/und generieren. Solche Anwendungen wenden ein vordefiniertes Schema zur Ablage der Daten an. Die Daten muss man dabei bereinigen und organisieren, bevor sie im Data Warehouse eingelagert werden.

Da die in einem Data Warehouse gespeicherten Daten bereits strukturiert sind, eignen sich diese besser für High-Level-Analysen


Da die in einem Data Warehouse gespeicherten Daten bereits strukturiert sind, eignen sich diese besser für High-Level-Analysen. BI-Tools können leicht mit den verarbeiteten Daten aus einem Data Warehouse umgehen. Das macht es Nicht-Datenexperten leichter diese Daten sinnvoll zu nutzen.

Die Daten aus einem Data Warehouse können zur Unterstützung historischer Analysen und Berichte verwendet werden, um die Entscheidungsfindung in allen Geschäftsbereichen eines Unternehmens zu unterstützen.

Auf Daten aus einem Data Warehouse greifen in der Regel Manager und Fachanwender zu, die Einblicke in geschäftliche KPIs gewinnen wollen. Die Daten sind bereits so strukturiert, dass sie Antworten auf vorher festgelegte Fragen für die Analyse liefern. Sie erzeugen dabei in der Regel Datenvisualisierung, BI-Analysen, Datenanalytiken.

Data Warehouses kosten mehr als Data Lakes und erfordern auch mehr Zeit für die Verwaltung, was zu zusätzlichen Betriebskosten führt.

Sie haben Fragen oder Anliegen? Sie wollen uns Ihre speziellen Anforderungen mitteilen?

    Ihr Name (Pflichtfeld)

    Ihre E-Mail-Adresse (Pflichtfeld)

    Betreff

    Ihre Nachricht

    Ich habe die Datenschutzerklärung zur Kenntnis genommen und bin damit einverstanden, dass die von mir angegebenen Daten elektronisch erhoben und gespeichert werden. Sämtliche Daten werden gemäß Datenschutzerklärung nur streng zweckgebunden zur Bearbeitung und Beantwortung Ihrer Anfrage benutzt.

    anlagenbau

    MariProject 6.6 für Unternehmen im Anlagenbau

    Die Integration von MariProject in die ERP-Lösung SAP Business One ermöglicht es, Abläufe in projektorientiert arbeitenden, mittelständischen Anlagenbau-Unternehmen durchgängig zu ...
    Weiterlesen …
    anlagenbau

    ERP für den Anlagenbau – komplex und Projekt-getrieben

    Ein ERP für den Anlagenbau hat die Aufgabe die Produktion meist komplexer Anlagen zu begleiten und zu steuern. Dabei wird ...
    Weiterlesen …
    Update

    MARIProject neuer Major Release 6.1

    Für MariProject die SAP Business One Branchensoftware für Dienstleister, IT-Unternehmen und Anlagenbauer gibt es das neue Major Release 6.1.000. Folgende ...
    Weiterlesen …

    Maschinen- und Anlagenbau: erste Schritte in die Industrie 4.0

    Weil die Industrie 4.0 der Praxis im Maschinen- und Anlagenbau noch fern scheint, schieben Unternehmen das Thema gerne auf - ...
    Weiterlesen …
    Update

    MARIProject, Version 6.0 ist da

    Lange war es angekündigt. Die neue Version 6.0 von MARIProject jetzt erhältlich. Das neue Major Release wartet mit einem stark ...
    Weiterlesen …
    Maschinen und Anlagenbau

    Warum Kundenservice im Anlagenbau heute über Erfolg entscheidet

    Lange war die Qualität der Maschinen das Aushängeschild für viele Einzelfertiger. Jetzt ist ein wichtiger Faktor dazu gekommen: Der Kundenservice ...
    Weiterlesen …
    Auftrags- und Einzelfertiger

    Einzel- und Auftragsfertiger brauchen andere ERP Lösungen

    Die Produktion mit der Losgröße 1 trifft man in vielen unterschiedlichen Branchen an. Anlagenbauer, Werkzeugbauer, Sondermaschinenbau, Bau von Sonderfahrzeugen, Werften ...
    Weiterlesen …

    Field Service – Mehr als Außendienst und Wartung

    Für viele Unternehmen besteht eine der wichtigsten Chancen sich vom Mitbewerber abzuheben darin mit der Qualität ihres Service zu überzeugen ...
    Weiterlesen …
    Update

    Update 5.6 : Neue Version von MariProject

    Eine neue Version von MariProject ist veröffentlicht worden. Dabei sind wie immer kleiner und größere Verbesserungen der Software für kaufmännisches ...
    Weiterlesen …
    Kalkulation

    Mit MariProject zur integrierten Projektkalkulation

    Die Projektkalkulation für Kundenangebote ist für den Vertrieb eines Unternehmens oft eine große Herausforderung. Dies gilt quer über alle „Projekt-getriebenen“ ...
    Weiterlesen …
    Data Lake Vs Warehouse

    Data Warehouse oder Data Lake

    Data Lakes und Data Warehouses sind Schlagwörter, die man hört, wenn es um die Datenaufbewahrung im Kontext mit Big Data ...
    Weiterlesen …
    BI auf dem Weg

    Business Intelligence – auf dem Weg?

    Unternehmen investieren seit Jahren in moderne ERP-Systeme. Sie konzentrieren oft sehr auf Kernthemen wie Finanzen oder Steuerung von Produktion und ...
    Weiterlesen …
    BIG DATA für KMU

    Big Data – Relevant für den Mittelstand?

    Big Data hat für kleine und mittlere Unternehmen keine Relevanz. Eins solche Einschätzung ist öfters zu hören und zu lesen ...
    Weiterlesen …
    DATA Sience

    Datenanalyse für KMU

    Eine kritische Analyse "Datenanalyse für KMU" oder "Data Science" müsste eigentlich für mittelständische Unternehmen eines der Top-Themen sein. Denn es ...
    Weiterlesen …
    Business Intelligence

    Mehr Kennzahlen Transparenz im ERP System

    Viele Unternehmen erhoffen sich durch die Einführung einer ERP-Software mehr Transparenz im Bereich ihrer Kennzahlen. Übersichtlicher wird es allerdings nur, ...
    Weiterlesen …

    Kostenloses Ebook zu MS Power Bi

    Microsoft Power Bi ist ein Business Intelligence Tool, mit dem sich unterschiedliche Datenquellen andocken. Die Daten kann das Bi Tool ...
    Weiterlesen …
    Power Bi Kurs

    Monatlicher Update zu MS Power Bi

    Das monatliche Update von Microsoft Power Bi wurde veröffentlicht. Besonders interessant ist eine Funktion mit denen Nutzer auf neue Art ...
    Weiterlesen …

    Update für das Datenanalyse Tool: MS Power BI

    Mit schöner Regelmäßigkeit erweitert Microsoft die Funktionalität von MS Power BI. Eine neue Version bietet wieder eine Reihe neuer Features ...
    Weiterlesen …

    Neue Reports / Power Bi für SAP Business One

    Power Bi ist ein Werkzeug das es erlaubt auf einfachste Art und Weise Daten zu analysieren und visualisieren. Versino hat ...
    Weiterlesen …
    smartshop mit SAP Business One

    Smartshop Analytics Prototyp für SAP Business One

    Ein Youtube Video der SAP zeigt einen Prototyp einer SAP Business One Installation die mit den SAP HANA Analytics neue ...
    Weiterlesen …

    Hinterlassen Sie einen Kommentar

    Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *
    Folgende HTML Tags sind nutzbar: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>