Der Data Analytics Podcast

Follow Der Data Analytics Podcast
Share on
Copy link to clipboard

- Jeden Tag neue Podcastfolgen - Es geht um meine Journey im Daten-Analyse-Bereich. Begib Dich mit mir auf die Reise hin zu einem Experten in Sachen Daten-Analyse und gehe den Unternehmensdatenschätzen auf den Grund. Was steckt eigentlich in Big Data un

Der Analytics Podcaster


    • Feb 11, 2023 LATEST EPISODE
    • infrequent NEW EPISODES
    • 5m AVG DURATION
    • 585 EPISODES


    Search for episodes from Der Data Analytics Podcast with a specific topic:

    Latest episodes from Der Data Analytics Podcast

    Data Vault Tabellentypen - Hubs, Links, Satelliten

    Play Episode Listen Later Feb 11, 2023 4:01


    Eine Modellierubgsmethode, um Daten im Data Warehouse zu strukturieren, ist das Data Vault Konzept. Was sind nun aber die Haupttabellentypen?

    Gründe für die Normalisierung in Datenbanken

    Play Episode Listen Later Feb 9, 2023 4:14


    Normalisierung wird in Datenbanken angewendet, um Duplikate und Datenredundanz zu vermeiden, die Integrität und Konsistenz der Daten zu gewährleisten und die Performance der Datenbank zu verbessern.

    NoSQL Datenbanken vs Relationale Datenbanken

    Play Episode Listen Later Feb 8, 2023 2:17


    Relationale Datenbanken nutzen eine tabellarische Struktur, während NoSQL-Datenbanken eine flexible nicht-relationale Struktur verwenden.

    Normalisierung in Datenbanken

    Play Episode Listen Later Feb 7, 2023 8:10


    Redundanzen und Abhängigkeiten vermeiden.

    Primärschlüssel und Fremdschlüssel in Datenbanken

    Play Episode Listen Later Feb 6, 2023 4:54


    Ein Primärschlüssel ist ein eindeutiger Wert, der verwendet wird, um einen Datensatz in einer Tabelle zu identifizieren. Ein Fremdschlüssel hingegen ist ein Primärschlüssel einer anderen Tabelle, der in einer anderen Tabelle verwendet wird, um eine Beziehung zwischen den Tabellen herzustellen.

    Materialized Views vs Views / SQL Datenbanken und Performance-Verbesserung

    Play Episode Listen Later Feb 5, 2023 6:51


    Eine Materialized View speichert das Ergebnis einer Abfrage und stellt es als eine separate Tabelle bereit, während eine View lediglich eine virtuelle Tabelle darstellt, die auf das Ergebnis einer Abfrage verweist. Materialized Views bieten eine bessere Performance, da das Ergebnis einer Abfrage bereits gespeichert ist, während Views jedes Mal neu berechnet werden müssen, wenn sie abgefragt werden.

    SQL Basics

    Play Episode Listen Later Feb 4, 2023 4:13


    Einige kurze Sätze zum Thema SQL und relationale Datenbanken.

    Scrum im Data Engineering

    Play Episode Listen Later Feb 3, 2023 7:09


    Scrum ist ein agiles Projektmanagement-Framework, das einen iterativen Ansatz und eine enge Zusammenarbeit und Kommunikation zwischen Teammitgliedern bei der Produktentwicklung fördert. Es verwendet regelmäßige Überprüfungen, Anpassungen und kurze Iterationen (Sprints), um eine hohe Kundenzufriedenheit zu erreichen.

    Einfache SQL Interview Frage

    Play Episode Listen Later Feb 3, 2023 4:21


    Frage: Wie kann man in SQL die häufigsten Werte in einer Spalte finden?

    Data Vault - Daten Modellierung - flexibel und skalierbar

    Play Episode Listen Later Feb 2, 2023 8:38


    Schneller Überblick über das Data Vault Konzept. Mit Beispiel für die Hub, Link und Sateliten Tabellen.

    Dimensional Modeling vs Entity Relationship Modeling

    Play Episode Listen Later Feb 1, 2023 4:15


    Die eine Modellierungsvariante ist eher für Data Warehouses und die andere für OLTP Systeme.

    ACID Konzept in Datenbankmanagement-Systemen

    Play Episode Listen Later Feb 1, 2023 3:58


    ACID ist ein Konzept für Datenbankmanagement-Systeme, das Atomarität, Konsistenz, Isolation und Dauerhaftigkeit garantiert, um die Integrität und Zuverlässigkeit von Transaktionen in einer Datenbank zu gewährleisten.

    Datenmodellierung kurzer Einblick und verschiedene Modelle

    Play Episode Listen Later Jan 30, 2023 4:37


    Datawarehouse-Modellierung kurzer Einblick. https://larsmuellensiefen.substack.com/

    ER- Diagramm - OLTP Datenbank-Modellieren

    Play Episode Listen Later Jan 30, 2023 6:04


    Datenbankmodellierung mit ER Diagramm. https://larsmuellensiefen.substack.com/

    datenbank diagramm oltp modellieren
    FinOps => Cloud Finanzverwaltung und -optimierung

    Play Episode Listen Later Jan 29, 2023 7:17


    FinOps ist ein Ansatz zur Finanzverwaltung und -optimierung in Unternehmen, die Cloud-Computing-Dienste nutzen. Es beinhaltet die Verwaltung von Kosten, Compliance, Risiken und Governance in Bezug auf Cloud-Dienste, sowie Überwachung und Optimierung der Nutzung von Ressourcen, um sicherzustellen, dass sie effizient und kosteneffektiv genutzt werden... - https://larsmuellensiefen.substack.com/

    Data Fabric, was ist das?

    Play Episode Listen Later Jan 29, 2023 5:41


    Ein Data Fabric ist ein Konzept der Datenarchitektur, das es ermöglicht, Daten auf flexible und skalierbare Weise zu organisieren und zu verwalten, über mehrere Systeme und Standorte hinweg und ermöglicht eine einheitliche und integrierte Datenverwaltung. https://larsmuellensiefen.substack.com/

    KI Systeme - Einsatz in der Praxis ChatGPT o. ä. als Data Engineer

    Play Episode Listen Later Jan 28, 2023 4:31


    Ersetzten ChatGPT und ähnliche KI basierte Werkzeuge bereits einen Data Engineer?

    KI als Werkzeug

    Play Episode Listen Later Jan 26, 2023 5:45


    Insgesamt ist KI ein leistungsfähiges Werkzeug, das die Effizienz und Genauigkeit von Aufgaben der Datenverarbeitung erheblich verbessern kann und Unternehmen ermöglicht, tiefere Einblicke zu gewinnen und aufgrund ihrer Daten informierte Entscheidungen zu treffen.

    KI in der Datenverarbeitung

    Play Episode Listen Later Jan 25, 2023 6:53


    Insgesamt kann KI viele Aufgaben der Datenverarbeitung automatisieren und neue Möglichkeiten bieten, aber die menschliche Expertise und das Verständnis des Data Engineer für die spezifische Geschäftsdomäne kann entscheidend sein, um effektive Datensysteme zu entwerfen und umzusetzen.

    Star Schema vs Snowflake Schema Daten Modellierung im Data Warehouse

    Play Episode Listen Later Jan 24, 2023 4:36


    Star Schema und Snowflake Schema sind beides Techniken, die in Data Warehouses verwendet werden, um Daten zu organisieren und zu strukturieren, damit sie leicht abgefragt und analysiert werden können.

    Python-Packages und Librarys für Data Engineering

    Play Episode Listen Later Jan 23, 2023 5:37


    https://larsmuellensiefen.substack.com/ - Data Engineering ist ein wichtiger Bestandteil des Prozesses der Datenverarbeitung, der sich mit der Gewinnung, Vorbereitung, Verarbeitung und Verwaltung von Daten beschäftigt. Es gibt viele Python-Pakete, die für die Unterstützung von Data-Aufgaben entwickelt wurden und die es ermöglichen, Daten effektiv zu verarbeiten und zu analysieren. Einige dieser wichtigen Pakete sind Pandas, NumPy, Scikit-learn, TensorFlow, PySpark, Airflow, Dask und SQLAlchemy.

    Rust Programmiersprache

    Play Episode Listen Later Jan 22, 2023 5:47


    https://larsmuellensiefen.substack.com/ - Rust ist eine moderne Programmiersprache. Sie zielt darauf ab, sicher, schnell und stabil zu sein.

    Python Modules vs Packages

    Play Episode Listen Later Jan 21, 2023 4:06


    Zusammenfassend ist ein Paket eine Sammlung von Modulen, die in einer Verzeichnisstruktur organisiert sind, während ein Modul eine einzelne Datei mit Python-Definitionen und Anweisungen ist.

    Hyperscaler - wofür steht dieser Begriff im Kentext der "Cloud"?

    Play Episode Listen Later Jan 21, 2023 4:20


    Der Begriff "Hyperscaler" beschreibt Unternehmen, wie AWS, M. Azure und GCP... die extreme Skalierbarkeit und Flexibilität der Cloud-Computing-Infrastrukturen ermöglichen. Sie haben die Fähigkeit, ihre Ressourcen schnell und in großem Umfang bereitzustellen, um die Anforderungen von Unternehmen und Entwicklern zu erfüllen.

    Pandas vs SQL eine kurze Gegenüberstellung

    Play Episode Listen Later Jan 20, 2023 3:20


    Beide Systeme eignen sich für die Arbeit mit Daten. Pandas ist ein Python Package und SQL ist eine Datenbankanfragesprache. https://larsmuellensiefen.substack.com/

    5 Python Beispielpackages für Data Engineers

    Play Episode Listen Later Jan 19, 2023 8:12


    https://larsmuellensiefen.substack.com/ - Es ist eine der meistgenutzten Sprachen in der Branche und bietet eine Vielzahl von leistungsstarken Tools und Bibliotheken, um Daten effizient zu sammeln, zu transformieren und zu analysieren. Mit Pandas und NumPy kann man mühelos große Datenmengen manipulieren und analysieren. Kurz gesagt, Python ist ein unverzichtbares Werkzeug für jeden Data Engineer.

    Container vs Virtual Machines

    Play Episode Listen Later Jan 18, 2023 9:10


    https://larsmuellensiefen.substack.com/ - Ein Container ist eine Art von Software, die es ermöglicht, Anwendungen und ihre Abhängigkeiten zusammenzufassen und in einer einzigen, tragbaren und ausführbaren Einheit bereitzustellen. Im Gegensatz dazu ist eine virtuelle Maschine eine Software-Emulation eines physischen Computers, die es ermöglicht, mehrere Betriebssysteme und Anwendungen auf einem einzigen physischen Computer auszuführen.

    Tables vs Views in relationalen Datenbanken

    Play Episode Listen Later Jan 18, 2023 6:21


    https://larsmuellensiefen.substack.com/ - Tables und Views sind beide wichtige Bestandteile einer relationalen Datenbank, aber sie haben einige wichtige Unterschiede. Eine Tabelle ist das grundlegendste Objekt und wird verwendet, um Daten in einer Datenbank zu speichern. Sie werden mithilfe von SQL definiert und haben eine Reihe von Spalten und einen Datentyp für jede Spalte. Tabellen speichern die Daten physisch und können abgefragt, aktualisiert und verändert werden. Views hingegen sind virtuelle Tabellen, die auf dem Ergebnis einer SELECT-Anweisung basieren.

    Self Service - ohne Daten-Experten oder IT-Abteilungen mit Daten Wert stiften...

    Play Episode Listen Later Jan 17, 2023 4:15


    https://larsmuellensiefen.substack.com/ - Self-Service im Data-Bereich ermöglicht es Benutzern, Daten selbstständig zu erfassen, zu analysieren und zu visualisieren, ohne dass sie dazu auf die Unterstützung von Experten oder IT-Abteilungen angewiesen sind. Dies erfordert keine umfangreichen technischen Kenntnisse und erleichtert die Verarbeitung und Auswertung von Daten.

    Die Demokratisierung von Daten - Buzzword erklärt

    Play Episode Listen Later Jan 17, 2023 5:35


    https://larsmuellensiefen.substack.com/ - Die Demokratisierung von Daten im Data-Bereich bezieht sich auf die Verbreitung von Tools und Technologien, die es den Benutzern ermöglichen, Daten einfach zu erfassen, zu analysieren und zu visualisieren, ohne dass sie über umfangreiche technische Kenntnisse verfügen müssen.

    Python als Data Engineer

    Play Episode Listen Later Jan 16, 2023 5:46


    https://larsmuellensiefen.substack.com/ - Python ist eine sehr beliebte Wahl für Aufgaben im Bereich des Data Engineering, da es eine große Anzahl von Bibliotheken und Frameworks bietet, die speziell für diesen Zweck entwickelt wurden. https://larsmuellensiefen.substack.com/

    CTEs vs Temporäre Tabellen in SQL

    Play Episode Listen Later Jan 16, 2023 6:09


    https://larsmuellensiefen.substack.com/ - CTEs werden innerhalb einer Abfrage definiert und sind nur für die Dauer dieser Abfrage verfügbar, während temporäre Tabellen über mehrere Abfragen hinweg verwendet werden können und dauerhaft (bis zum Ende der Session) gespeichert sind. https://larsmuellensiefen.substack.com/

    dauer tempor tabellen abfrage abfragen ctes
    Newsletter fun #NEW

    Play Episode Listen Later Jan 15, 2023 1:58


    https://larsmuellensiefen.substack.com/ Lass uns gemeinsam unser Data-Game auf das nächste Level heben... durch direkten Austausch, das Teilen von diversen Wissensquellen und die neuesten Branchenentwicklungen: https://larsmuellensiefen.substack.com/

    Git als Nr1 Versionsverwaltungssystem

    Play Episode Listen Later Jan 14, 2023 4:39


    Git ist ein Werkzeug, das Entwicklern dabei hilft, ihren Code zu verwalten und zu verfolgen. Es ermöglicht es ihnen, Änderungen an ihrem Code aufzunehmen, zu verfolgen und zu verwalten, was es erleichtert, zusammenzuarbeiten und Fehler zu beheben.

    Microservices als Architekturstil für die Entwicklung von Anwendungen - kleinere,unabhängige Dienste

    Play Episode Listen Later Jan 14, 2023 7:32


    Microservices ist ein Architekturstil für die Entwicklung von Anwendungen, bei dem eine große Anwendung in kleinere, unabhängige Dienste aufgeteilt wird, die jeweils eine spezifische Funktion ausführen.

    Data Mesh - was ist das und wie wird es eingesetzt?

    Play Episode Listen Later Jan 14, 2023 3:57


    Beim Data Mesh geht darum, die Verantwortung für die Verwaltung und Nutzung von Daten innerhalb eines Unternehmens auf mehrere Teams aufzuteilen und zu verteilen, anstatt dass ein zentrales Team für die Verwaltung aller Daten verantwortlich ist.

    ELT Prozess kurz und knapp - (Extract, Load, Transform) + Abgrenzung zum ETL Prozess

    Play Episode Listen Later Jan 13, 2023 6:50


    ELT (Extract, Load, Transform) ist ein Prozess, bei dem Daten direkt aus ihrer Quelle extrahiert, in das Ziel-Datenlager geladen werden und dort transformiert werden. Dies im Gegensatz zu dem klassischen ETL-Prozess (Extract, Transform, Load), bei dem die Datenintegration in eine Zwischenablage durchgeführt wird, bevor sie in das Ziel-Datenlager geladen werden. ELT ermöglicht eine schnellere Verarbeitung und höhere Skalierbarkeit, jedoch erfordert es auch leistungsfähige Ziel-Datenlager und eine gründliche Vorbereitung und Überwachung.

    Deskriptive, Diagnostische, Prädiktive und Präskriptive Datenanalyse

    Play Episode Listen Later Jan 12, 2023 8:34


    Datenanalyse kann in vier verschiedene Kategorien unterteilt werden: Deskriptive, Diagnostische, Prädiktive und Präskriptive. Deskriptive Datenanalyse beschreibt und ordnet die vorhandenen Daten, um ein besseres Verständnis dafür zu erlangen. Diese Art von Analyse kann verwendet werden, um Verteilungen, Häufigkeiten und Muster in den Daten zu identifizieren. Diagnostische Datenanalyse untersucht die Daten, um mögliche Probleme oder Anomalien zu erkennen. Prädiktive Datenanalyse verwendet historische Daten, um zukünftige Ereignisse vorherzusagen. Präskriptive Datenanalyse verwendet Daten und Analyseergebnisse, um Empfehlungen und Entscheidungen für die Zukunft zu treffen. Jede dieser Arten von Datenanalyse kann verwendet werden, um unterschiedliche Probleme und Herausforderungen zu lösen, je nachdem, welche Art von Daten und welche Art von Erkenntnissen benötigt werden.

    Data Vault Datenmodell im Schnelldurchlauf beschrieben...

    Play Episode Listen Later Jan 11, 2023 2:38


    Data Vault ist ein Ansatz zur Modellierung von Daten in einem Unternehmensdatenwarehouse, der sich auf Flexibilität und Skalierbarkeit konzentriert. Es nutzt drei Arten von Tabellen, um Daten zu organisieren: Hubs, Links und Satelliten.

    SQL Aggregat Funktionen

    Play Episode Listen Later Jan 10, 2023 3:52


    Wie summiere ich Daten in einer Spalte auf? Durch Verwendung von SQL Aggregat-Funktionen.

    daten funktionen spalte aggregat durch verwendung
    PostgreSQL - open-source relationales Datenbankmanagementsystem (RDBMS)

    Play Episode Listen Later Jan 9, 2023 4:20


    PostgreSQL ist ein open-source relationales Datenbankmanagementsystem (RDBMS), das für seine Robustheit, Leistung und Flexibilität bekannt ist. Es wird häufig in Unternehmensumgebungen eingesetzt und unterstützt eine Vielzahl von Funktionen, darunter ACID-Transaktionen, vollständige Datenintegrität und Unterstützung für eine Vielzahl von Programmiersprachen.

    Trennung von Compute und Storage - bedeutet, dass Rechenleistung und Datenspeicher getrennt sind

    Play Episode Listen Later Jan 9, 2023 6:05


    Die Trennung von Compute und Storage bezieht sich darauf, dass Rechenleistung und Datenspeicher getrennt sind und individuell skaliert werden können. Dies bedeutet, dass Benutzer die Menge an Ressourcen, die für die Berechnung von Abfragen verwendet werden, unabhängig von der Menge an gespeicherten Daten anpassen können. Dies hat den Vorteil, dass Benutzer die Ressourcen, die sie für ihre Anwendungen benötigen, besser optimieren und die Kosten für ihre Anwendungen besser verstehen und kontrollieren können.

    SQL JOINS - Daten aus verschiedenen Tabellen zusammenzuführen und analysieren

    Play Episode Listen Later Jan 8, 2023 4:05


    In SQL können JOINs verwendet werden, um Daten aus verschiedenen Tabellen zusammenzuführen und zu analysieren. Es gibt verschiedene Arten von JOINs, die je nachdem, wie die Tabellen miteinander verbunden werden sollen, verwendet werden können. Ein INNER JOIN gibt nur die Zeilen zurück, die in beiden Tabellen vorhanden sind. Ein LEFT JOIN gibt alle Zeilen aus der linken Tabelle und die zugehörigen Zeilen aus der rechten Tabelle zurück (falls vorhanden), während ein RIGHT JOIN alle Zeilen aus der rechten Tabelle und die zugehörigen Zeilen aus der linken Tabelle zurückgibt. Es gibt auch FULL OUTER JOINs, die alle Zeilen aus beiden Tabellen zurückgeben, auch wenn sie in keiner der beiden Tabellen einen Treffer haben.

    SQL Basics - SQL kann verwendet werden, um Daten zu erstellen, zu ändern und zu löschen & Abzufragen

    Play Episode Listen Later Jan 8, 2023 3:30


    SQL kann verwendet werden, um Daten zu erstellen, zu ändern und zu löschen, sowie um Abfragen zu erstellen, die Informationen aus einer oder mehreren Datenbanktabellen abrufen. Es bietet auch eine Reihe von Funktionen zum Verarbeiten und Analyse von Daten, wie zum Beispiel Aggregatfunktionen und JOINs.

    NoSQL-Datenbanken #Short

    Play Episode Listen Later Jan 8, 2023 1:40


    NoSQL-Datenbanken sind eine Klasse von Datenbanken, die nicht das relationale Modell verwenden, das in den meisten traditionellen Datenbanken verwendet wird. Stattdessen verwenden sie alternative Datenmodelle, wie zum Beispiel Key-Value-Speicher, Dokumenten-Datenbanken oder Graph-Datenbanken.

    Relationale Datenbanken vs Objektorientierte Datenbanken - kurze Gegenüberstellung mit Beispiel

    Play Episode Listen Later Jan 7, 2023 4:34


    In objektorientierten Datenbanken (OODBs) werden Daten als Objekte gespeichert und verwaltet, die Eigenschaften und Verhaltensweisen besitzen. In relationalen Datenbanken (RDBs) werden Daten in Tabellen gespeichert und miteinander verknüpft.

    dbt Einrichtung und Einsatz in der Praxis

    Play Episode Listen Later Jan 6, 2023 3:59


    DBT (Data Build Tool) ist ein Open-Source-Framework, das Entwicklern hilft, Daten in einem Unternehmen zu transformieren und zu verwalten. Mit DBT können Entwickler SQL-Abfragen schreiben, um Daten zu transformieren und in Zieldatenbanken zu schreiben. DBT bietet auch Funktionen zum Testen von Modellen, zum Verwalten von Abhängigkeiten zwischen Modellen und zum Dokumentieren von Prozessen.

    5 coole? Eigenschaften von "dbt"

    Play Episode Listen Later Jan 5, 2023 3:24


    Open-Source-Software dbt: Mit dbt können Daten durch eine Reihe von Test- und Transformationsschritte geleitet werden, um sie für Analysezwecke vorzubereiten. Das Werkzeug bietet eine Reihe von Funktionen, die es Datenanalytikern ermöglichen, ihre Arbeitsabläufe zu optimieren und zu automatisieren, wodurch sie Zeit und Mühe sparen können.

    Common table expression (CTE) als allgemeiner Tabellenausdruck

    Play Episode Listen Later Jan 4, 2023 4:10


    CTEs als allgemeiner Tabellenausdruck ist eine benannte Unterabfrage - Beispiel: WITH cte AS ( SELECT * FROM mytable WHERE col1 = 'value_x' ) SELECT * FROM cte WHERE col2 = 'value_y';

    10 Programmiersprachen im Schnelldurchlauf

    Play Episode Listen Later Jan 3, 2023 3:39


    Es gibt viele Programmiersprachen, jede mit ihren eigenen Merkmalen und Zwecken. Einige beliebte Programmiersprachen sind: C, C++, Java, Python... Rust.

    SQL Window-Functions

    Play Episode Listen Later Jan 2, 2023 3:28


    SQL Fensterfunktionen sind Funktionen, die über eine Gruppe von Zeilen laufen und für jede Zeile eines Ergebnissatzes einen Wert zurückgeben. Sie werden häufig verwendet, um aggregierte Werte wie SUM oder AVG zu berechnen, während man trotzdem die Einzelzeilen behält, die zu dieser Aggregation beigetragen haben. Die Fensterfunktionen verfügen über eine OVER-Klausel, die es ermöglicht, das Fenster der Zeilen festzulegen, über die die Funktion laufen soll.

    Claim Der Data Analytics Podcast

    In order to claim this podcast we'll send an email to with a verification link. Simply click the link and you will be able to edit tags, request a refresh, and other features to take control of your podcast page!

    Claim Cancel