Tvorba efektivních ETL procesů pomocí SAS Data Integration Studio

Kontakt na dodavatele získáte po registraci

Tento kurz je pořádán dodavatelem, který nevyužívá placenou prezentaci na portálu eu-dat.cz.
Kontaktní údaje na dodavatele získáte po registraci. Nebo použijte poptávkový formulář.
  • Kurz na míru

  • ID akce:
    558216

Popis kurzu na míru Tvorba efektivních ETL procesů pomocí SAS Data Integration Studio

V tomto kurzu účastníci získají klíčové znalosti o výkonnosti a možnostech procesů pro načítání dat (ETL procesů) a způsobech jejich ladění a zefektivnění v systému SAS 9 a v aplikaci SAS Data Integration Studio. V kurzu jsou probrány principy ETL procesů a s pomocí názorných příkladů jsou detailně rozebrána témata související s efektivitou při načítání dat.


Před přihlášením by účastníci měli:

  • znát základy programování v SAS (v rozsahu školení PRG1)
  • ovládat práci s aplikací SAS Data Integration Studio (v rozsahu školení DIS)
  • výhodou je znalost makro jazyka SAS (školení MAC1)

Přínos pro účastníka

V kurzu se naučíte:

  • analyzovat a odlaďovat ETL procesy
  • jednoduše a rychle zvýšit výkonnost načítání
  • nakonfigurovat systémové prostředí
  • využívat pokročilé techniky pro zvýšení výkonu

Obsah kurzu


Monitorování výkonnosti ETL procesů

  • úvod do SAS Intelligence Platform
  • základní koncepce aplikace SAS Data Integration Studio
  • měření výkonnosti

Základní techniky pro zvýšení výkonnosti ETL procesů

  • práce s mezivýstupy
  • pohledy (views) versus fyzické tabulky v ETL procesech
  • otázka kvality dat
  • transformace a nepotřebné sloupce
  • kontrola stavu načítání a návratových kódů

Práce s daty

  • klíče
  • indexy
  • datové funkce
  • počítání řádků
  • techniky plnění

Třídění a spojování

  • přehled úloh náročných na zpracování
  • zefektivnění procesu třídění
  • optimalizace výkonu při spojování (joins)

Dimenzionální modely

  • co je star schema
  • definice dat nepodléhajících častým změnám (Slowly Changing Dimensions)
  • vytvoření dimenzí
  • vytvoření faktových tabulek

Práce s relačními databázemi

  • optimalizace zpracování dat z relačních databází

Optimalizace prostředí

  • úvod
  • optimalizace hardwaru a paměti
  • sledování výkonu