Dataflows
Daten mithilfe von Joins verknüpfen
Beim Manipulieren von Spalten haben wir dir bereits gezeigt, wie du eine neue Spalte hinzuzufügst und sie durch einen Look Up auf eine andere Datenquelle füllst. Um allerdings zwei oder sogar mehrere tabellenartige Datenbestände miteinander zu verknüpfen, empfehlen wir Joins – eine Technik die du vielleicht aus dem Bereich der relationalen Datenbanken, wie SQL oder Oracle kennst.
Beginne zunächst damit, einen Dataflow anzulegen. Klicke anschließend im Dataflow auf [Schritt hinzufügen] und wähle dann [joinen]. Im Dialog kannst du nun die Datenquelle auswählen, die mit dem Dataflow verbunden werden soll (2). Über [+] fügst du die Schlüsselattribute (3) hinzu – das sind die Attribute, die in beiden Tabellen vorhanden sind und beim Joinen als Identifikatoren gelten. Welcher Join Typ (4) für deinen Anwendungsfall passend ist, zeigen wir dir im nachfolgenden Artikel.
Inner Join
Das Ergebnis eines Inner Joins enthält genau die Zeilen, bei denen es eine Entsprechung in beiden Tabellen gibt. Wenn es in der linken oder rechten Tabelle Zeilen gibt, die keine Entsprechung in der jeweils anderen Tabelle haben, gehen diese Zeilen dabei verloren.
Full Join
Beim full Join gehen keine Zeilen verloren. Wenn es in der linken oder rechten Tabelle Zeilen ohne Entsprechung gibt, werden diese zeilen im Ergebnis leer angeführt.
Left Join
Beim Left Join bleiben die Zeilen der linken Tabelle vollständig erhalten. Die Zeilen der rechten Tabelle finden nur dann ihren Weg in das Ergebnis, wenn sie eine Entsprechung auf der linken Seite haben.
Right Join
Beim Right Join bleiben die Zeilen der rechten Tabelle vollständig erhalten. Die Zeilen der linken Tabelle finden nur dann ihren Weg in das Ergebnis, wenn sie eine Entsprechung auf der rechten Seite haben.
Hinweis
Du kannst übrigens nicht nur Datenquellen, sondern natürlich auch andere Dataflows auf diese Weise miteinander verbinden.