Zertifizierter Praxislehrgang "Data Scientist"

Lehrgang 2020

Prüfungs-ZertifikatSeminarunterlagenTeilnahmebescheinigungMittagessen inkl. PausenverpflegungZertifikatskursRabattregelungTermin wählen

Beschreibung

Die Themen Data Science und Data Analytics spielen heutzutage eine zunehmend wichtigere Rolle und werden in der zielgerichteten Datenanalyse auch in der Finanzbranche immer bedeutender.
Dieser Lehrgang beleuchtet diese Aspekte auch in einem betriebswirtschaftlichen Zusammenhang und fokussiert in den Modulen die Datenanalyse.

Der Lehrgang richtet sich an Mitarbeiter in Banken und Sparkassen, die eher von der Fachseite kommen als dass sie bereits erfahrene Data Scientists sind, im engeren Sinne an Mitarbeiter aus steuernden Einheiten und Stabsstellen. Die Teilnehmer sind am Ende des Lehrgangs in der Lage, in Grundzügen die verschiedenen Elemente eines Data Science Projektes zu verstehen und mithilfe der vorgestellten und verwendeten Software durchführen zu können. Dabei liegt der Fokus auf Vorgehensweisen und Methoden, die sich in besonderer Weise für eine Anwendung in einer Bank oder Sparkasse eignen. Insgesamt sollen die Teilnehmer dazu befähigt werden, in ihrem Unternehmen als „Bridge People“ zu fungieren, also als diejenigen, die Advanced Analytics Methoden aus dem Data Science Umfeld in das eigentliche Geschäft hineintragen und dort Nutzen bringend verankern.

Zu Beginn werden die Grundlagen erlernt, welche nötig sind, um die zu analysierenden Daten „in den Griff“ zu bekommen: Datenvorverarbeitung mithilfe eines ETL-Tools, Wissen zu Datenbanken sowie zur deskriptiven Datenanalyse. Mithilfe von Anwendungsbeispielen in R werden die Grundlagen der Statistik erörtert und in einem weiteren Schritt auch Deep Learning Methoden. Der Lehrgang wird abgerundet durch Verfahren zur Visualisierung und Kommunikation der Ergebnisse. Abschließend werden den Teilnehmern konkrete Anwendungsbeispiele aus der Bankpraxis vorgestellt und das Vorgehen bei deren Entwicklung und Implementierung erörtert. Die Bearbeitung einer Fallstudie als Abschlussarbeit bildet den Abschluss dieses Lehrgangs.

Dieser Lehrgang ist aufgeteilt in Webinare, welche online stattfinden, und Präsenzseminare, welche in Bonn stattfinden. Durch diesen Lernmix kommen die Teilnehmer zu einem abwechslungreichen und nachhaltigen Lernerfolg. Dadurch, dass die Webinare in den frühen Abendstunden stattfinden, wird keine kostbare Arbeitszeit investiert und die Teilnehmer sparen außerdem fällige Reisekosten ein. Die Webinare werden zusätzlich aufgezeichnet und den Teilnehmern zur Nacharbeitung zur Verfügung gestellt.
Die Teilnehmer treffen sich ebenfalls regelmäßig in Präsenzveranstaltungen, welche in Bonn bei der VÖB-Service GmbH stattfinden, um neues Wissen zu gewinnen und den Austausch untereinander zu fördern. 

Inhalte

Modul 1: Datenvorbereitung ETL-Tool
Seminar

Im ersten Modul wird zunächst die inhaltliche und auch technische Basis für die Datenvorverarbeitung geschaffen. Es wird ein kleines kostenloses Datenbank-System (h2) vorgestellt und die Handhabung auf dem eigenen PC angeleitet. Weiter wird das OpenSource ETL-Werkzeug „Pentaho Data Integration“ (akt. Vers. 8.2, von Hitachi Vantara) vorgestellt und eingerichtet. Im zweiten Teil (SQL) wird eine fachliche Problemstellung (Daten sollen ausgewertet werden) in ein relationales Datenbankmodell umgewandelt und auf diesem mit SQL erste Abfragen erstellt.
Was ist ein Primary Key? Was sind Beziehungen, welche grundsätzlichen Typen gibt es  und was ist in dem Zusammenhang dann ein Foreign-Key?
Im dritten Teil  wird das im ersten Teil erstellte Datenmodell mit Hilfe des ETL-Werkzeugs mit Daten (z. B. aus Textdateien o. Ä.) beliefert.
Was heißt ETL? Was ist ein „LookUp“-Step? Was ist „transformieren“ oder „mappen“ etc.? 
Datum: 02.03.2020 / 09:00-17:00 Uhr in Bonn
Referent: Markus Burbaum


Modul 2: Grundkurs R
Seminar

Dieses Modul ist geprägt durch eine Vielzahl an Anwendungsbeispielen und Übungen. Zielsetzung ist, dass der Teilnehmer die Grundlagen von R kennenlernt. Der erste Teil dient dazu der „Denkweise“ von R näherzukommen. Es werden Fragen behandelt wie: Was ist R? Was kann R? Mit welchen Datentypen kann R arbeiten? Warum ist es wichtig Vektoren verstanden zu haben, um mit R arbeiten zu können? Was sind Pakete?
Im zweiten Teil werden die Schnittstellen von R beleuchtet. Also wie können Daten nach R geladen werden? Und wie kann mit Daten / Tabellen weitergearbeitet werden? Schließlich im letzten Teil wird erläutert, wie Routinen und Verfahren in R angewandt werden. Außerdem wird auf die Frage eingegangen, wie ich das Verfahren meiner Wahl in R anwenden kann.
Datum: 03.03.2020 / 09:00-17:00 Uhr in Bonn
Referent: Christian Förster


Modul 3: Datenvisualisierung
Webinare

Das Modul besteht aus zwei grundsätzlichen Blöcken: Der Theorie zur Datenvisualisierung und deren praktische Anwendung. Der erste Teil widmet sich der Praxis guter und eindeutiger Darstellung quantitativer Daten. Nach einem kurzen Exkurs in die Theorie der Datenvisualisierung wird anhand von Positiv- und Negativ-Beispielen demonstriert, Daten klar darzustellen und typische Fallstricke zu vermeiden. Im zweiten Teil wird die praktische Umsetzung der Datenvisualisierung mithilfe von Tableau gezeigt. Es wird u. a. auf folgende Punkte eingegangen:

  • Überblick über die Hauptelemente und Bausteine der Visualisierungssoftware
  • Anbindung von Daten aus unterschiedlichen Datenquellen
  • Generierung von grafischen Darstellungen und Reports

Datum: 12.+13.03.2020 / jew. 17:00-19:00 Uhr online
Referenten: Timo Engels / Denis Khaskin


Modul 4: Grundlagen der Statistik in R
Seminar

Auch dieses Modul ist geprägt durch eine Vielzahl an Anwendungsbeispielen und Übungen. Zielsetzung hierbei ist, dass der Teilnehmer grundlegende statistische Verfahren in R anwenden und die Ergebnisse interpretieren kann. Das Modul wird als eine eintägige Präsenzschulung angeboten und behandelt abwechselnd die statistische Theorie und die Anwendung in R. Unter die betrachteten Grundlagen fallen multivariate und statistische Testverfahren, wie Hypothesentests (u. a. T-Test, F-Test, Chi²-Test), Korrelations- und Regressionsanalyse, Klassifikationsverfahren (Clusteranalyse) und eine kurze Einführung in Neuronale Netze. Da viele statistische Modelle hinsichtlich ihrer Güte beurteilt werden, werden in diesem Kontext Gini-Koeffizient, CAP- und ROC-Kurve betrachtet. Außerdem wird auf die Frage eingegangen, welche Ergebnisse glaubwürdig sind. Hierbei muss der Frage nachgegangen werden, ob die Inputdaten qualitativ ausreichend sind oder ob das Modell Schwachstellen aufweist, die in der Interpretation der Ergebnisse zu berücksichtigen sind. Neben der Auffrischung der Verfahren und Rechnung in R sollen ausgewählte Verfahren händisch nachgerechnet und nachvollzogen werden.
Datum: 02.04.2020 / 09:00-17:00 Uhr in Bonn
Referent: Christian Förster


Modul 5: Aufbaukurs Statistik und Deep Learning
Webinare + Seminar

Im ersten Teil wird anhand von Webinaren ein Überblick über das Universum der Advanced Analytics Methoden gegeben. Zu ausgewählten Methoden, etwa Neuronale Netze und logistische Regression, stellen wir die theoretischen Konzepte in größerer Tiefe vor. Im zweiten Teil, welcher durch ein Seminar vermittelt wird, werden verschiedene Beispiele in R durchgespielt. Die Anwendung der verschiedenen Methoden in R wird anhand realistischer Anwendungsfälle, die durch Übungen der Teilnehmer an kleineren Beispieldatengrundlagen vertieft werden, demonstriert.
Datum: 19.+20.03.2020 / jew. 17:00-19:00 Uhr online
              26.+27.03.2020 / jew. 17:00-19:00 Uhr online
              03.04.2020 / 09:00-17:00 Uhr in Bonn
Referenten: Daniela Weidner / Dr. Rainer Klingeler


Modul 6: Daten visualisieren mit R / Shiny
Webinare

Datenvisualisierung in R

  • Zunächst wird schrittweise erklärt, wie Abbildungen in R ohne zusätzliche Pakete (Base Package) erstellt werden. Dabei werden diverse Diagrammarten vorgestellt, welche durch wenige Zeilen Code erstellt werden können.
  • Anschließend wird die Leistungsfähigkeit von R im Bereich der Datenvisualisierung anhand diverser Zusatzpakete (z. B. ggplot) demonstriert und Anregungen bezüglich der Gestaltung der entsprechenden Abbildungen gegeben (z. B. farbliche Gestaltung im Corporate Design).

Einführung in R Shiny

  • Das R Paket Shiny wird vorgestellt und der Aufbau bzw. die Funktionsweise einer Shiny Web App (Interaktion zwischen User Interface und Server) näher erläutert.
  • Gestaltung des User Interfaces
  • Struktureller Aufbau einer Shiny-App über mehrere Skripte (ui.r / app.r / globals.r)
  • Einbindung reaktiver Funktionen, die auf Dateninput reagieren
  • Erstellung interaktiver Abbildungen über das Zusatzpaket „plotly“
  • Erstellung eines interaktiven Shiny-Dashboards anhand von Beispieldaten

Datum: 23.+24.04.2020 / jew. 17:00-19:00 Uhr online
Referent: Jan Peters


Modul 7: Beispiele für Anwendungsfälle
Webinare

Es werden vier Anwendungsfälle für Data Analytics Lösungen vorgestellt: Process Mining, Vertriebssteuerung, Ratingverfahren und Text Mining. Die Lösungen werden im jeweiligen fachlichen Kontext erläutert. Neben den konkret eingesetzten Methoden und Vorgehensweisen zur Erarbeitung der Modelle wird dargelegt, wie die gewonnenen Informationen und Prognosen in den jeweiligen Steuerungskreis implementiert werden und welche Abhängigkeiten es zwischen Informationsbedürfnis der jeweiligen Stabsstellen einerseits und Modelloutput andererseits gibt.
Datum: 27.+28.+29.+30.04.2020 / jew. 17:00-19:00 Uhr online
Referenten: Timo Engels, Dr. Rainer Klingeler, Jan Peters, Daniela Weidner


Modul 8: Organisation und Didaktik
Webinare

Die Institute stehen vor der Aufgabe, ihre Organisationseinheiten so aufzustellen, dass eine Transformation von Data Analytics Anwendungsfällen aus dem Pilotstatus heraus in die Produktion bestmöglich gelingt. Was häufig fehlt, sind „Übersetzer“-Fähigkeiten und eine effektive Zusammenarbeit zwischen den verschiedenen Rollen, die das entscheidende Bindeglied zwischen Business und Analytics darstellen. Das umfasst auch die Fähigkeit, nicht datenaffinen Menschen die Ergebnisse einer Datenanalyse zu kommunizieren. Es werden Vor- und Nachteile unterschiedlicher Organisationskonzepte erörtert. Weiter werden Leitlinien diskutiert, die für eine sachgerechte Präsentation von Daten sinnvoll sind.
Datum: 06.+07.05.2020 / jew. 17:00-19:00 Uhr online
Referent: Dr. Rainer Klingeler


Modul 9: Abschluss / Fallstudie
Webinar + Seminar 

Die einzelnen in den vorherigen Modulen kennengelernten Schritte einer Data Science Lösung werden anhand einer beispielhaften Datengrundlage durchgeführt. Die Teilnehmer entwerfen eine eigene Umsetzung zur gegebenen Fragestellung, bewerten diese und kommunizieren die Erkenntnisse in einem geeigneten Format. Im ersten Teil des Moduls werden die Datengrundlage und die zu erreichenden Ziele definiert. In der anschließenden, ca. zwei Wochen dauernden Phase haben die Teilnehmer Gelegenheit, ihre Arbeitsergebnisse anzufertigen und geeignet zu dokumentieren. Zum Abschluss haben die Teilnehmer Gelegenheit, ihre Arbeitsergebnisse zu präsentieren und durch das Plenum kritisch würdigen zu lassen.
Datum: 08.05.2020 / 17:00-19:00 Uhr online
              29.05.2020 / 09:00-13:00 Uhr in Bonn
Referenten: Daniela Weidner, Dr. Rainer Klingeler

Teilnehmerkreis

Sie profitieren als Mitarbeiter/in von Banken und Sparkassen, insbesondere aus steuernden Einheiten und Stabsstellen.

Termine & Orte

02.03.2020, 09:00 - 29.05.2020, 13:00
Bonn
Seminarnummer 2062462-K01

Bonus

Ab 2. Teilnehmer oder ab 2. Buchung eines Teilnehmers im gleichen Jahr 10 % Rabatt!

Ihr Ansprechpartner
Philip Schmengler

Philip Schmengler

+49 228 8192-282

Referenten
Bemerkung

Für die Teilnahme müssen alle Teilnehmer zwingend einen Laptop / ein Notebook mitbringen!

Gebühr
5.900,00 EUR (umsatzsteuerfrei gemäß §4 Nr. 22a UStG)