Der Data Analytics Podcast

Share on

- Jeden Tag neue Podcastfolgen - Es geht um meine Journey im Daten-Analyse-Bereich. Begib Dich mit mir auf die Reise hin zu einem Experten in Sachen Daten-Analyse und gehe den Unternehmensdatenschätzen auf den Grund. Was steckt eigentlich in Big Data un

Der Analytics Podcaster

Feb 11, 2023 LATEST EPISODE
infrequent NEW EPISODES
5m AVG DURATION
585 EPISODES

Search for episodes from Der Data Analytics Podcast with a specific topic:

Latest episodes from Der Data Analytics Podcast

Data Vault Tabellentypen - Hubs, Links, Satelliten

Play Episode Listen Later Feb 11, 2023 4:01

Eine Modellierubgsmethode, um Daten im Data Warehouse zu strukturieren, ist das Data Vault Konzept. Was sind nun aber die Haupttabellentypen?

data vault daten hubs satelliten data warehouses

Gründe für die Normalisierung in Datenbanken

Play Episode Listen Later Feb 9, 2023 4:14

Normalisierung wird in Datenbanken angewendet, um Duplikate und Datenredundanz zu vermeiden, die Integrität und Konsistenz der Daten zu gewährleisten und die Performance der Datenbank zu verbessern.

performance daten integrit datenbank konsistenz datenbanken normalisierung

NoSQL Datenbanken vs Relationale Datenbanken

Play Episode Listen Later Feb 8, 2023 2:17

Relationale Datenbanken nutzen eine tabellarische Struktur, während NoSQL-Datenbanken eine flexible nicht-relationale Struktur verwenden.

struktur nosql datenbanken

Normalisierung in Datenbanken

Play Episode Listen Later Feb 7, 2023 8:10

Redundanzen und Abhängigkeiten vermeiden.

abh datenbanken normalisierung redundanzen

Primärschlüssel und Fremdschlüssel in Datenbanken

Play Episode Listen Later Feb 6, 2023 4:54

Ein Primärschlüssel ist ein eindeutiger Wert, der verwendet wird, um einen Datensatz in einer Tabelle zu identifizieren. Ein Fremdschlüssel hingegen ist ein Primärschlüssel einer anderen Tabelle, der in einer anderen Tabelle verwendet wird, um eine Beziehung zwischen den Tabellen herzustellen.

beziehung wert prim tabelle tabellen datenbanken datensatz

Materialized Views vs Views / SQL Datenbanken und Performance-Verbesserung

Play Episode Listen Later Feb 5, 2023 6:51

Eine Materialized View speichert das Ergebnis einer Abfrage und stellt es als eine separate Tabelle bereit, während eine View lediglich eine virtuelle Tabelle darstellt, die auf das Ergebnis einer Abfrage verweist. Materialized Views bieten eine bessere Performance, da das Ergebnis einer Abfrage bereits gespeichert ist, während Views jedes Mal neu berechnet werden müssen, wenn sie abgefragt werden.

performance views ergebnis verbesserung tabelle datenbanken abfrage materialized

SQL Basics

Play Episode Listen Later Feb 4, 2023 4:13

Einige kurze Sätze zum Thema SQL und relationale Datenbanken.

basics einige datenbanken

Scrum im Data Engineering

Play Episode Listen Later Feb 3, 2023 7:09

Scrum ist ein agiles Projektmanagement-Framework, das einen iterativen Ansatz und eine enge Zusammenarbeit und Kommunikation zwischen Teammitgliedern bei der Produktentwicklung fördert. Es verwendet regelmäßige Überprüfungen, Anpassungen und kurze Iterationen (Sprints), um eine hohe Kundenzufriedenheit zu erreichen.

kommunikation zusammenarbeit ansatz scrum anpassungen produktentwicklung data engineering teammitgliedern

Einfache SQL Interview Frage

Play Episode Listen Later Feb 3, 2023 4:21

Frage: Wie kann man in SQL die häufigsten Werte in einer Spalte finden?

werte frage wie sql einfache spalte

Data Vault - Daten Modellierung - flexibel und skalierbar

Play Episode Listen Later Feb 2, 2023 8:38

Schneller Überblick über das Data Vault Konzept. Mit Beispiel für die Hub, Link und Sateliten Tabellen.

data vault daten hub schneller flexibel modellierung

Dimensional Modeling vs Entity Relationship Modeling

Play Episode Listen Later Feb 1, 2023 4:15

Die eine Modellierungsvariante ist eher für Data Warehouses und die andere für OLTP Systeme.

relationships modeling entity dimensional data warehouses

ACID Konzept in Datenbankmanagement-Systemen

Play Episode Listen Later Feb 1, 2023 3:58

ACID ist ein Konzept für Datenbankmanagement-Systeme, das Atomarität, Konsistenz, Isolation und Dauerhaftigkeit garantiert, um die Integrität und Zuverlässigkeit von Transaktionen in einer Datenbank zu gewährleisten.

isolation konzept acid systemen integrit zuverl datenbank transaktionen konsistenz dauerhaftigkeit

Datenmodellierung kurzer Einblick und verschiedene Modelle

Play Episode Listen Later Jan 30, 2023 4:37

Datawarehouse-Modellierung kurzer Einblick. https://larsmuellensiefen.substack.com/

einblick modelle verschiedene kurzer datenmodellierung

ER- Diagramm - OLTP Datenbank-Modellieren

Play Episode Listen Later Jan 30, 2023 6:04

Datenbankmodellierung mit ER Diagramm. https://larsmuellensiefen.substack.com/

datenbank diagramm oltp modellieren

FinOps => Cloud Finanzverwaltung und -optimierung

Play Episode Listen Later Jan 29, 2023 7:17

FinOps ist ein Ansatz zur Finanzverwaltung und -optimierung in Unternehmen, die Cloud-Computing-Dienste nutzen. Es beinhaltet die Verwaltung von Kosten, Compliance, Risiken und Governance in Bezug auf Cloud-Dienste, sowie Überwachung und Optimierung der Nutzung von Ressourcen, um sicherzustellen, dass sie effizient und kosteneffektiv genutzt werden... - https://larsmuellensiefen.substack.com/

cloud unternehmen compliance governance bezug kosten ansatz risiken ressourcen nutzung verwaltung optimierung finanzverwaltung cloud dienste

Data Fabric, was ist das?

Play Episode Listen Later Jan 29, 2023 5:41

Ein Data Fabric ist ein Konzept der Datenarchitektur, das es ermöglicht, Daten auf flexible und skalierbare Weise zu organisieren und zu verwalten, über mehrere Systeme und Standorte hinweg und ermöglicht eine einheitliche und integrierte Datenverwaltung. https://larsmuellensiefen.substack.com/

weise konzept daten systeme standorte data fabric

KI Systeme - Einsatz in der Praxis ChatGPT o. ä. als Data Engineer

Play Episode Listen Later Jan 28, 2023 4:31

Ersetzten ChatGPT und ähnliche KI basierte Werkzeuge bereits einen Data Engineer?

praxis einsatz werkzeuge data engineers ki systeme

KI als Werkzeug

Play Episode Listen Later Jan 26, 2023 5:45

Insgesamt ist KI ein leistungsfähiges Werkzeug, das die Effizienz und Genauigkeit von Aufgaben der Datenverarbeitung erheblich verbessern kann und Unternehmen ermöglicht, tiefere Einblicke zu gewinnen und aufgrund ihrer Daten informierte Entscheidungen zu treffen.

unternehmen entscheidungen einblicke aufgaben daten werkzeug insgesamt effizienz genauigkeit datenverarbeitung

KI in der Datenverarbeitung

Play Episode Listen Later Jan 25, 2023 6:53

Insgesamt kann KI viele Aufgaben der Datenverarbeitung automatisieren und neue Möglichkeiten bieten, aber die menschliche Expertise und das Verständnis des Data Engineer für die spezifische Geschäftsdomäne kann entscheidend sein, um effektive Datensysteme zu entwerfen und umzusetzen.

gesch expertise verst aufgaben insgesamt data engineers datenverarbeitung

Star Schema vs Snowflake Schema Daten Modellierung im Data Warehouse

Play Episode Listen Later Jan 24, 2023 4:36

Star Schema und Snowflake Schema sind beides Techniken, die in Data Warehouses verwendet werden, um Daten zu organisieren und zu strukturieren, damit sie leicht abgefragt und analysiert werden können.

daten snowflakes techniken schema data warehouses modellierung

Python-Packages und Librarys für Data Engineering

Play Episode Listen Later Jan 23, 2023 5:37

https://larsmuellensiefen.substack.com/ - Data Engineering ist ein wichtiger Bestandteil des Prozesses der Datenverarbeitung, der sich mit der Gewinnung, Vorbereitung, Verarbeitung und Verwaltung von Daten beschäftigt. Es gibt viele Python-Pakete, die für die Unterstützung von Data-Aufgaben entwickelt wurden und die es ermöglichen, Daten effektiv zu verarbeiten und zu analysieren. Einige dieser wichtigen Pakete sind Pandas, NumPy, Scikit-learn, TensorFlow, PySpark, Airflow, Dask und SQLAlchemy.

daten vorbereitung python bestandteil einige packages pandas verwaltung das k verarbeitung pakete prozesses tensorflow data engineering gewinnung airflow datenverarbeitung numpy scikit sqlalchemy

Rust Programmiersprache

Play Episode Listen Later Jan 22, 2023 5:47

https://larsmuellensiefen.substack.com/ - Rust ist eine moderne Programmiersprache. Sie zielt darauf ab, sicher, schnell und stabil zu sein.

rust programmiersprache

Python Modules vs Packages

Play Episode Listen Later Jan 21, 2023 4:06

Zusammenfassend ist ein Paket eine Sammlung von Modulen, die in einer Verzeichnisstruktur organisiert sind, während ein Modul eine einzelne Datei mit Python-Definitionen und Anweisungen ist.

python packages paket sammlung modules anweisungen modul datei modulen zusammenfassend

Hyperscaler - wofür steht dieser Begriff im Kentext der "Cloud"?

Play Episode Listen Later Jan 21, 2023 4:20

Der Begriff "Hyperscaler" beschreibt Unternehmen, wie AWS, M. Azure und GCP... die extreme Skalierbarkeit und Flexibilität der Cloud-Computing-Infrastrukturen ermöglichen. Sie haben die Fähigkeit, ihre Ressourcen schnell und in großem Umfang bereitzustellen, um die Anforderungen von Unternehmen und Entwicklern zu erfüllen.

cloud unternehmen aws steht ressourcen azure anforderungen flexibilit umfang wof r gcp entwicklern skalierbarkeit dieser begriff

Pandas vs SQL eine kurze Gegenüberstellung

Play Episode Listen Later Jan 20, 2023 3:20

Beide Systeme eignen sich für die Arbeit mit Daten. Pandas ist ein Python Package und SQL ist eine Datenbankanfragesprache. https://larsmuellensiefen.substack.com/

arbeit gegen daten pandas sql kurze

5 Python Beispielpackages für Data Engineers

Play Episode Listen Later Jan 19, 2023 8:12

https://larsmuellensiefen.substack.com/ - Es ist eine der meistgenutzten Sprachen in der Branche und bietet eine Vielzahl von leistungsstarken Tools und Bibliotheken, um Daten effizient zu sammeln, zu transformieren und zu analysieren. Mit Pandas und NumPy kann man mühelos große Datenmengen manipulieren und analysieren. Kurz gesagt, Python ist ein unverzichtbares Werkzeug für jeden Data Engineer.

tools kurz daten python branche sprachen vielzahl werkzeug bibliotheken data engineers datenmengen numpy

Container vs Virtual Machines

Play Episode Listen Later Jan 18, 2023 9:10

https://larsmuellensiefen.substack.com/ - Ein Container ist eine Art von Software, die es ermöglicht, Anwendungen und ihre Abhängigkeiten zusammenzufassen und in einer einzigen, tragbaren und ausführbaren Einheit bereitzustellen. Im Gegensatz dazu ist eine virtuelle Maschine eine Software-Emulation eines physischen Computers, die es ermöglicht, mehrere Betriebssysteme und Anwendungen auf einem einzigen physischen Computer auszuführen.

art software computers container abh einheit maschine anwendungen im gegensatz virtual machines betriebssysteme

Tables vs Views in relationalen Datenbanken

Play Episode Listen Later Jan 18, 2023 6:21

https://larsmuellensiefen.substack.com/ - Tables und Views sind beide wichtige Bestandteile einer relationalen Datenbank, aber sie haben einige wichtige Unterschiede. Eine Tabelle ist das grundlegendste Objekt und wird verwendet, um Daten in einer Datenbank zu speichern. Sie werden mithilfe von SQL definiert und haben eine Reihe von Spalten und einen Datentyp für jede Spalte. Tabellen speichern die Daten physisch und können abgefragt, aktualisiert und verändert werden. Views hingegen sind virtuelle Tabellen, die auf dem Ergebnis einer SELECT-Anweisung basieren.

views reihe unterschiede daten tables ergebnis sql objekt bestandteile datenbank tabellen datenbanken spalten spalte

Self Service - ohne Daten-Experten oder IT-Abteilungen mit Daten Wert stiften...

Play Episode Listen Later Jan 17, 2023 4:15

https://larsmuellensiefen.substack.com/ - Self-Service im Data-Bereich ermöglicht es Benutzern, Daten selbstständig zu erfassen, zu analysieren und zu visualisieren, ohne dass sie dazu auf die Unterstützung von Experten oder IT-Abteilungen angewiesen sind. Dies erfordert keine umfangreichen technischen Kenntnisse und erleichtert die Verarbeitung und Auswertung von Daten.

wert experten daten auswertung verarbeitung kenntnisse self service abteilungen stiften benutzern it abteilungen

Die Demokratisierung von Daten - Buzzword erklärt

Play Episode Listen Later Jan 17, 2023 5:35

https://larsmuellensiefen.substack.com/ - Die Demokratisierung von Daten im Data-Bereich bezieht sich auf die Verbreitung von Tools und Technologien, die es den Benutzern ermöglichen, Daten einfach zu erfassen, zu analysieren und zu visualisieren, ohne dass sie über umfangreiche technische Kenntnisse verfügen müssen.

tools erkl daten buzzwords technologien verbreitung kenntnisse demokratisierung benutzern

Python als Data Engineer

Play Episode Listen Later Jan 16, 2023 5:46

https://larsmuellensiefen.substack.com/ - Python ist eine sehr beliebte Wahl für Aufgaben im Bereich des Data Engineering, da es eine große Anzahl von Bibliotheken und Frameworks bietet, die speziell für diesen Zweck entwickelt wurden. https://larsmuellensiefen.substack.com/

wahl bereich aufgaben python zweck frameworks anzahl bibliotheken data engineers data engineering

CTEs vs Temporäre Tabellen in SQL

Play Episode Listen Later Jan 16, 2023 6:09

https://larsmuellensiefen.substack.com/ - CTEs werden innerhalb einer Abfrage definiert und sind nur für die Dauer dieser Abfrage verfügbar, während temporäre Tabellen über mehrere Abfragen hinweg verwendet werden können und dauerhaft (bis zum Ende der Session) gespeichert sind. https://larsmuellensiefen.substack.com/

dauer tempor tabellen abfrage abfragen ctes

Newsletter fun #NEW

Play Episode Listen Later Jan 15, 2023 1:58

https://larsmuellensiefen.substack.com/ Lass uns gemeinsam unser Data-Game auf das nächste Level heben... durch direkten Austausch, das Teilen von diversen Wissensquellen und die neuesten Branchenentwicklungen: https://larsmuellensiefen.substack.com/

newsletter lass austausch teilen

Git als Nr1 Versionsverwaltungssystem

Play Episode Listen Later Jan 14, 2023 4:39

Git ist ein Werkzeug, das Entwicklern dabei hilft, ihren Code zu verwalten und zu verfolgen. Es ermöglicht es ihnen, Änderungen an ihrem Code aufzunehmen, zu verfolgen und zu verwalten, was es erleichtert, zusammenzuarbeiten und Fehler zu beheben.

code fehler werkzeug git entwicklern

Microservices als Architekturstil für die Entwicklung von Anwendungen - kleinere,unabhängige Dienste

Play Episode Listen Later Jan 14, 2023 7:32

Microservices ist ein Architekturstil für die Entwicklung von Anwendungen, bei dem eine große Anwendung in kleinere, unabhängige Dienste aufgeteilt wird, die jeweils eine spezifische Funktion ausführen.

entwicklung funktion unabh anwendung dienste anwendungen die entwicklung microservices kleinere

Data Mesh - was ist das und wie wird es eingesetzt?

Play Episode Listen Later Jan 14, 2023 3:57

Beim Data Mesh geht darum, die Verantwortung für die Verwaltung und Nutzung von Daten innerhalb eines Unternehmens auf mehrere Teams aufzuteilen und zu verteilen, anstatt dass ein zentrales Team für die Verwaltung aller Daten verantwortlich ist.

data team verantwortung daten unternehmens nutzung mesh verwaltung

ELT Prozess kurz und knapp - (Extract, Load, Transform) + Abgrenzung zum ETL Prozess

Play Episode Listen Later Jan 13, 2023 6:50

ELT (Extract, Load, Transform) ist ein Prozess, bei dem Daten direkt aus ihrer Quelle extrahiert, in das Ziel-Datenlager geladen werden und dort transformiert werden. Dies im Gegensatz zu dem klassischen ETL-Prozess (Extract, Transform, Load), bei dem die Datenintegration in eine Zwischenablage durchgeführt wird, bevor sie in das Ziel-Datenlager geladen werden. ELT ermöglicht eine schnellere Verarbeitung und höhere Skalierbarkeit, jedoch erfordert es auch leistungsfähige Ziel-Datenlager und eine gründliche Vorbereitung und Überwachung.

transform quelle load kurz prozess daten vorbereitung knapp gegensatz extract abgrenzung verarbeitung elt skalierbarkeit zwischenablage

Deskriptive, Diagnostische, Prädiktive und Präskriptive Datenanalyse

Play Episode Listen Later Jan 12, 2023 8:34

Datenanalyse kann in vier verschiedene Kategorien unterteilt werden: Deskriptive, Diagnostische, Prädiktive und Präskriptive. Deskriptive Datenanalyse beschreibt und ordnet die vorhandenen Daten, um ein besseres Verständnis dafür zu erlangen. Diese Art von Analyse kann verwendet werden, um Verteilungen, Häufigkeiten und Muster in den Daten zu identifizieren. Diagnostische Datenanalyse untersucht die Daten, um mögliche Probleme oder Anomalien zu erkennen. Prädiktive Datenanalyse verwendet historische Daten, um zukünftige Ereignisse vorherzusagen. Präskriptive Datenanalyse verwendet Daten und Analyseergebnisse, um Empfehlungen und Entscheidungen für die Zukunft zu treffen. Jede dieser Arten von Datenanalyse kann verwendet werden, um unterschiedliche Probleme und Herausforderungen zu lösen, je nachdem, welche Art von Daten und welche Art von Erkenntnissen benötigt werden.

art pr zukunft probleme herausforderungen entscheidungen verst analyse daten ereignisse arten empfehlungen muster jede erkenntnissen kategorien diese art datenanalyse anomalien verteilungen analyseergebnisse

Data Vault Datenmodell im Schnelldurchlauf beschrieben...

Play Episode Listen Later Jan 11, 2023 2:38

Data Vault ist ein Ansatz zur Modellierung von Daten in einem Unternehmensdatenwarehouse, der sich auf Flexibilität und Skalierbarkeit konzentriert. Es nutzt drei Arten von Tabellen, um Daten zu organisieren: Hubs, Links und Satelliten.

data vault daten arten ansatz flexibilit hubs satelliten schnelldurchlauf tabellen skalierbarkeit modellierung beschrieben datenmodell

SQL Aggregat Funktionen

Play Episode Listen Later Jan 10, 2023 3:52

Wie summiere ich Daten in einer Spalte auf? Durch Verwendung von SQL Aggregat-Funktionen.

daten funktionen spalte aggregat durch verwendung

PostgreSQL - open-source relationales Datenbankmanagementsystem (RDBMS)

Play Episode Listen Later Jan 9, 2023 4:20

PostgreSQL ist ein open-source relationales Datenbankmanagementsystem (RDBMS), das für seine Robustheit, Leistung und Flexibilität bekannt ist. Es wird häufig in Unternehmensumgebungen eingesetzt und unterstützt eine Vielzahl von Funktionen, darunter ACID-Transaktionen, vollständige Datenintegrität und Unterstützung für eine Vielzahl von Programmiersprachen.

open source leistung vielzahl funktionen flexibilit postgresql robustheit rdbms

Trennung von Compute und Storage - bedeutet, dass Rechenleistung und Datenspeicher getrennt sind

Play Episode Listen Later Jan 9, 2023 6:05

Die Trennung von Compute und Storage bezieht sich darauf, dass Rechenleistung und Datenspeicher getrennt sind und individuell skaliert werden können. Dies bedeutet, dass Benutzer die Menge an Ressourcen, die für die Berechnung von Abfragen verwendet werden, unabhängig von der Menge an gespeicherten Daten anpassen können. Dies hat den Vorteil, dass Benutzer die Ressourcen, die sie für ihre Anwendungen benötigen, besser optimieren und die Kosten für ihre Anwendungen besser verstehen und kontrollieren können.

dass menge storage kosten daten vorteil ressourcen bedeutet trennung anwendungen compute berechnung getrennt benutzer die trennung rechenleistung datenspeicher abfragen

SQL JOINS - Daten aus verschiedenen Tabellen zusammenzuführen und analysieren

Play Episode Listen Later Jan 8, 2023 4:05

In SQL können JOINs verwendet werden, um Daten aus verschiedenen Tabellen zusammenzuführen und zu analysieren. Es gibt verschiedene Arten von JOINs, die je nachdem, wie die Tabellen miteinander verbunden werden sollen, verwendet werden können. Ein INNER JOIN gibt nur die Zeilen zurück, die in beiden Tabellen vorhanden sind. Ein LEFT JOIN gibt alle Zeilen aus der linken Tabelle und die zugehörigen Zeilen aus der rechten Tabelle zurück (falls vorhanden), während ein RIGHT JOIN alle Zeilen aus der rechten Tabelle und die zugehörigen Zeilen aus der linken Tabelle zurückgibt. Es gibt auch FULL OUTER JOINs, die alle Zeilen aus beiden Tabellen zurückgeben, auch wenn sie in keiner der beiden Tabellen einen Treffer haben.

daten hren arten zeilen tabelle treffer verschiedenen tabellen analysieren right join

SQL Basics - SQL kann verwendet werden, um Daten zu erstellen, zu ändern und zu löschen & Abzufragen

Play Episode Listen Later Jan 8, 2023 3:30

SQL kann verwendet werden, um Daten zu erstellen, zu ändern und zu löschen, sowie um Abfragen zu erstellen, die Informationen aus einer oder mehreren Datenbanktabellen abrufen. Es bietet auch eine Reihe von Funktionen zum Verarbeiten und Analyse von Daten, wie zum Beispiel Aggregatfunktionen und JOINs.

basics kann analyse reihe daten funktionen sql erstellen verarbeiten verwendet abfragen

NoSQL-Datenbanken #Short

Play Episode Listen Later Jan 8, 2023 1:40

NoSQL-Datenbanken sind eine Klasse von Datenbanken, die nicht das relationale Modell verwenden, das in den meisten traditionellen Datenbanken verwendet wird. Stattdessen verwenden sie alternative Datenmodelle, wie zum Beispiel Key-Value-Speicher, Dokumenten-Datenbanken oder Graph-Datenbanken.

modell klasse stattdessen nosql datenbanken

Relationale Datenbanken vs Objektorientierte Datenbanken - kurze Gegenüberstellung mit Beispiel

Play Episode Listen Later Jan 7, 2023 4:34

In objektorientierten Datenbanken (OODBs) werden Daten als Objekte gespeichert und verwaltet, die Eigenschaften und Verhaltensweisen besitzen. In relationalen Datenbanken (RDBs) werden Daten in Tabellen gespeichert und miteinander verknüpft.

beispiel gegen daten eigenschaften verhaltensweisen kurze objekte tabellen datenbanken

dbt Einrichtung und Einsatz in der Praxis

Play Episode Listen Later Jan 6, 2023 3:59

DBT (Data Build Tool) ist ein Open-Source-Framework, das Entwicklern hilft, Daten in einem Unternehmen zu transformieren und zu verwalten. Mit DBT können Entwickler SQL-Abfragen schreiben, um Daten zu transformieren und in Zieldatenbanken zu schreiben. DBT bietet auch Funktionen zum Testen von Modellen, zum Verwalten von Abhängigkeiten zwischen Modellen und zum Dokumentieren von Prozessen.

unternehmen praxis einsatz daten abh funktionen prozessen testen dbt einrichtung modellen entwicklern verwalten dokumentieren

5 coole? Eigenschaften von "dbt"

Play Episode Listen Later Jan 5, 2023 3:24

Open-Source-Software dbt: Mit dbt können Daten durch eine Reihe von Test- und Transformationsschritte geleitet werden, um sie für Analysezwecke vorzubereiten. Das Werkzeug bietet eine Reihe von Funktionen, die es Datenanalytikern ermöglichen, ihre Arbeitsabläufe zu optimieren und zu automatisieren, wodurch sie Zeit und Mühe sparen können.

mit reihe daten eigenschaften funktionen open source software coole arbeitsabl das werkzeug

Common table expression (CTE) als allgemeiner Tabellenausdruck

Play Episode Listen Later Jan 4, 2023 4:10

CTEs als allgemeiner Tabellenausdruck ist eine benannte Unterabfrage - Beispiel: WITH cte AS ( SELECT * FROM mytable WHERE col1 = 'value_x' ) SELECT * FROM cte WHERE col2 = 'value_y';

table expression ctes

10 Programmiersprachen im Schnelldurchlauf

Play Episode Listen Later Jan 3, 2023 3:39

Es gibt viele Programmiersprachen, jede mit ihren eigenen Merkmalen und Zwecken. Einige beliebte Programmiersprachen sind: C, C++, Java, Python... Rust.

rust python java einige schnelldurchlauf merkmalen zwecken

SQL Window-Functions

Play Episode Listen Later Jan 2, 2023 3:28

SQL Fensterfunktionen sind Funktionen, die über eine Gruppe von Zeilen laufen und für jede Zeile eines Ergebnissatzes einen Wert zurückgeben. Sie werden häufig verwendet, um aggregierte Werte wie SUM oder AVG zu berechnen, während man trotzdem die Einzelzeilen behält, die zu dieser Aggregation beigetragen haben. Die Fensterfunktionen verfügen über eine OVER-Klausel, die es ermöglicht, das Fenster der Zeilen festzulegen, über die die Funktion laufen soll.

window wert werte gruppe funktion fenster functions sum funktionen zeilen avg aggregation zeile

Claim Der Data Analytics Podcast

In order to claim this podcast we'll send an email to with a verification link. Simply click the link and you will be able to edit tags, request a refresh, and other features to take control of your podcast page!

Claim Cancel