PyWorking

Pandas

Workshop Sobota 2. září 2017 Praha


Běžný den v práci s pandas

Cílem tohoto workshopu je vyzkoušet si, jak může vypadat běžný den datového analytika v praxi (v komerčním prostředí). Používat budeme zejména python knihovnu pandas, ale nevyhneme se ani základním dotazům v SQL, jelikož je to pořád běžnější jazyk pro práci s daty ve firmách (není nutná znalost SQL).

Workshop bude prakticky zaměřen, což znamená, že teoretické seznámení s knihovnou pandas bude velmi krátké, až minimalistické. Hlavní část workshopu bude tvořit praktická část - vypracování fiktivního úkolu v pandas. Na tomto úkolu si procvičíme důležité fuknce z pandas pro čtení, čištění, vizualizaci (pro prezentaci) a zapisování dat do nových souborů i do databází. Na tomto úkolu si ukážeme, co by měl datový analytik pro svou práci vědět a čím může svůj management překvapit.

Základní osnova kurzu

  • Krátká Teoretická část
  • Seznámení s knihovnou pandas a běžnými funkcemi
  • Výhody pandas oproti SQL

Delší praktická část - Proces analýzy dat od začátku do konce

  • Zadání, specifikace úkolu managementem
  • Návrh řešení úkolu na nečisto
  • Exploratory Data Analysis
  • Čištění dat
  • Zpracování čistých dat
  • Vizualizace čistých dat
  • Uložení výsledků a úprava skriptu pro další použití
  • Tvorba reportu pro management

Z kurzu si kromě nabytých znalostí odnesete použitelnou šablonu pro ad hoc analýzu dat v pandas a seznam tolika odkazů na relevantní pracovní pozice, kolik se přihlásí účastníků :)

Prerequesites: Notebook s nainstalovaným python 3, jupyter (ipython notebook) a pandas.

Jak nainstalovat ipython jupyter notebook: jupyter.readthedocs.io/en/latest/install.html Nebo pomocí pip install jupyter

Poznámky: Workshop bude veden v slovenštině/češtině, všechny skripty budou napsány v angličtině. Data do workshopu budou fiktivní (z oblasti banky nebo e-shopu) a svou logikou budou simulovat skutečná data z odvětví.

Materiály: https://github.com/pyvec/pyworking-materials/tree/master/170902_Pandas



Fork me on GitHub