Dataflows
Deine ersten Schritte mit Dataflows
Datenquellen oder Data Sources kommunizieren mit Quellsystemen aller Art und liefern die Daten meist in Form einer Tabelle. Um diese Daten anzuzeigen, greift man entweder mit den Controls darauf zu oder benutzt zunächst ein Script, um sie aufzubereiten. Wie du Daten per Skript weiterverarbeitest oder wie man Tabellendaten manipuliert, erfährst du in den beiden Artikeln. In diesem Artikel zeigen wir dir, wie du verschiedene Daten mithilfe von Dataflows nachbearbeitest, auch ohne tiefgehende Skripting Kenntnisse. Mit Dataflows lassen sich zum Beispiel:
- Spalten umbenennen und unnötige Spalten löschen.
- Datentypen anpassen.
- Neue Spalten hinzufügen und sie mit Inhalten nach einer bestimmten Logik befüllen.
- Mehrere Datenquellen, auch aus unterschiedlichen Vorsystemen, mithilfe von Joins verknüpfen und zu einer einzelnen Tabelle verbinden.
Dataflows ermöglichen es ausgehend von einer einzelnen Tabelle schrittweise den Datenbestand anzupassen, bis das Ergebnis deinen Wünschen entspricht. Die einzelnen Schritte kannst du im Peakboard Designer für jeden Dataflow einsehen, ändern und ergänzen. So lässt sich leicht kontrollieren, ob die Sequenz auch den gewünschten Effekt hat und das Ergebnis erscheint.
Einen neuen Dataflow anlegen
Klicke im Explorer auf […] neben [Dataflows] oder neben deiner [Datenquelle] um einen neuen Dataflow anzulegen.
Wähle nun deine Basis-Tabelle aus (1) und bestätige diese mit [OK] (2). Selbst wenn am Ende mehrere Tabellen an der Datentransformation beteiligt sind, startet der Dataflow immer mit genau einer Tabelle. Im Textfeld (3) kannst du einen eindeutigen Namen zur leichteren Identifikation des Dataflows vergeben.
Jetzt sind alle Vorbereitungen getroffen. Über [Add Step] (4) können nun weitere Transformationsschritte auf die Tabelle angewendet werden. Im rechten Bereich des Dialogs sind alle bereits angewendeten Schritte aufgelistet. Sie können nachträglich natürlich verändert oder gelöscht werden. Klicke auf einen der Schritte und lass dir im Dialogbereich links des Zustands der Daten NACH diesem Schritt anzeigen. Der Datenbestand in diesem Beispiel ist, wie du im Screenshot unten sehen kannst, noch in seinem Ausgangszustand.
Zuletzt kann noch eingestellt werden, ob der Dataflow zusammen mit seiner Quelle aktualisiert werden soll oder einem eigenen Intervall folgt (5).