Kurzy a certifikace Data Science

Vše

Datová analýza s využitím programovacího jazyka Python

11.500 CZK

Cena (bez DPH)

Days2
15. 1.16. 1. 2025
virtual
CZ
3. 3. 4. 3. 2025
virtual
CZ

Python je interpretovaný vysokoúrovňový programovací jazyk, který v současnosti patří mezi nejoblíbenější programovací jazyky vůbec. Jedná se o takzvaný multiparadigmatický jazyk, který podporuje různá programátorská paradigmata včetně objektového, imperativního, procedurálního nebo funkcionálního. I když Python bývá označován za skriptovací jazyk, jeho možnosti jsou ve skutečnosti daleko širší. V současnosti se masivně používá i pro numerické výpočty, analýzu dat, statistické výpočty, práci s grafy atd. Tento kurz je zaměřen na nástroje, které lze v Pythonu použít pro datovou analýzu.

Možnosti financování 

Cena za účastníka 2.505 Kč vč. DPH s podporou v programu JSEM V KURZU v rámci Národního plánu obnovy (registrace zde).
Cena za účastníka 13.915 Kč vč. DPH bez podpory (tj. 11.500 Kč bez DPH).

Cílová skupina

  • Uživatelé, kteří potřebují provádět datovou analýzu, od získávání dat z různých zdrojů přes jejich zpracování a analýzu až po tvorbu reportů.

Cíl kurzu

  • Seznámit účastníky kurzu s technologiemi, které se používají pro sběr dat a pro datové analýzy. Výklad bude zaměřen na programovací jazyk Python a s ním související technologie: IPython, Jupyter Notebook, NumPy a Pandas.

Osnova kurzu

Představení prostředí IPython

  • Nástroje online datové analýzy
  • Jupyter Notebook
  • Architektura
  • Instalace
  • JupyterLab
  • Export výstupů do PDF a jiných formátů

Přehled datových struktur v Pythonu

  • Proměnná
  • Pole
  • Struktura
  • Objekt
  • List
  • Tuple

Knihovna Pandas

  • Zobrazení obsahu datových rámců
  • Vykresl ení grafů a validace dat
  • Práce s datovými řadami (series)

Knihovna NumPy

  • Datové typy prvků
  • Konstruktory polí

Import dat z různých zdrojů

  • Tabulkové formáty a procesory (Excel, CSV)
  • Databáze (SQL)
  • TSV
  • JSON
  • HTML Scraping

Zpracování dat

  • Přeměna tabulkových dat
  • Přidávání chybějících hodnot
  • Sledování
  • Spojování dat

Pokročilé zpracování dat

  • Spojování datových rámců s využitím append, concat, merge a join
  • Stacking, unstacking
  • Melting

Spojování a agregace dat

  • Rozdělení dat do skupin na základě zvolených kritérií
  • Využití funkcí
  • Kombinace výsledků do datové struktury
  • Transformace
  • Filtrace

Vizualizace

  • Generování grafů
  • Bodový, sloupcový a spojnicový graf
  • Graf s KDE (Kernel density estimation)
  • Vykreslení hodnot prvků z datové řady formou grafu
  • Seskupení dat do grafů

Doplňující témata

Funkce časové řady

  • Přehled
  • Timestamps
  • Time spans
  • Timedelta
  • DateTimeIndex

Předpoklady účastníka

  • Základní znalost programování, alespoň rámcová znalost Pythonu, jazyka R či statistických a analytických funkcí v Excelu.

Další požadavky

  • Počítač s jakýmkoli operačním systémem, ideálně Linux (není podmínkou)
  • Webový prohlížeč
  • Terminál (konzole)

Poptejte kurz u nás

Kurzy
Submit
* Povinné pole

Recenze

Václav Kašpar
25. 10. 2024
Děkuji týmu DataScriptu za skvělou organizaci a podporu kurzu a lektorovi za sdílení jeho odbornosti a reakce na naše dotazy. Václav Kašpar, DATERA s.r.o.
Lukáš Pezl
25. 10. 2024
Skvělý kurz plný informací. Jsem rád za hodně teorie, díky tomu člověk opravdu pochopí proč a jak určité funkce fungují. Lukáš Pezl, Manpowergroup
Při poskytování našich služeb nám pomáhají soubory cookie. Využíváním našich služeb s jejich používáním souhlasíte.
Další informace