Workshop Sobota 2. září 2017 Praha
Běžný den v práci s pandas
Cílem tohoto workshopu je vyzkoušet si, jak může vypadat běžný den datového analytika v praxi (v komerčním prostředí). Používat budeme zejména python knihovnu pandas, ale nevyhneme se ani základním dotazům v SQL, jelikož je to pořád běžnější jazyk pro práci s daty ve firmách (není nutná znalost SQL).
Workshop bude prakticky zaměřen, což znamená, že teoretické seznámení s knihovnou pandas bude velmi krátké, až minimalistické. Hlavní část workshopu bude tvořit praktická část - vypracování fiktivního úkolu v pandas. Na tomto úkolu si procvičíme důležité fuknce z pandas pro čtení, čištění, vizualizaci (pro prezentaci) a zapisování dat do nových souborů i do databází. Na tomto úkolu si ukážeme, co by měl datový analytik pro svou práci vědět a čím může svůj management překvapit.
Základní osnova kurzu
Delší praktická část - Proces analýzy dat od začátku do konce
Z kurzu si kromě nabytých znalostí odnesete použitelnou šablonu pro ad hoc analýzu dat v pandas a seznam tolika odkazů na relevantní pracovní pozice, kolik se přihlásí účastníků :)
Prerequesites: Notebook s nainstalovaným python 3, jupyter (ipython notebook) a pandas.
Jak nainstalovat ipython jupyter notebook: jupyter.readthedocs.io/en/latest/install.html
Nebo pomocí pip install jupyter
Poznámky: Workshop bude veden v slovenštině/češtině, všechny skripty budou napsány v angličtině. Data do workshopu budou fiktivní (z oblasti banky nebo e-shopu) a svou logikou budou simulovat skutečná data z odvětví.
Materiály: https://github.com/pyvec/pyworking-materials/tree/master/170902_Pandas