Data Science
Prowadzący:
Termin:
17-23.08.2024 r.
Lokalizacja:
Sielpia
Czas trwania warsztatów:
20 godzin - 25 jednostek lekcyjnych w ciągu 5 dni zajęć
Analiza i wizualizacja danych w Pythonie
Na każdym kroku życia otaczają nas dane. Liczba spalonych kalorii, oddechów na minutę, tętno, liczba znajomych na Facebooku, przeglądane przez nas strony w Internecie. Jednak same dane dużo nam nie dają. Musimy umieć wyciągnąć z nich jakieś wnioski oraz zobrazować nasze konkluzje, tak, aby każdy je rozumiał. Razem odkryjemy, jak za pośrednictwem narzędzi programistycznych zwizualizować dane tak, aby móc wyciągnąć z nich wartościowe informacje.
Do kogo kierowany jest ten warsztat?
Warsztat skierowany jest do uczniów liceum, którzy rozpoczęli już swoją przygodę z programowaniem (poznały ideę programowania oraz opanowały podstawy języka Python, tj. składnię języka, podstawowe typy danych, konstrukcję wyrażeń warunkowych i pętli) i chcą w przyszłości studiować na kierunkach związanych z analizą danych, informatyką i matematyką.
Niezbędny sprzęt i oprogramowanie
Do udziału w warsztacie wymagany jest własny laptop z systemem Windows, Linux lub MacOS z zainstalowanym oprogramowaniemPyCharm Community Edition:
(wersja dla komputerów z Windowsem) https://www.jetbrains.com/pycharm/download/?section=windows
(wersja dla komputerów Apple z systemem MacOS) https://www.jetbrains.com/pycharm/download/?section=mac
(wersja dla komputerów z systemem Linux) https://www.jetbrains.com/pycharm/download/other.html
Python (wersja 3.9.* lub nowsze) z zainstalowanymi bibliotekami Pandas, NumPy i Matplotlib.
Dodatkowe informacje o instalacji oprogramowania zostaną przesłane uczestnikom warsztatu w późniejszym terminie.
Dlaczego warto wziąć udział w tym warsztacie?
Biorąc udział w warsztacie:
- rozwiniesz swoje umiejętności programowania;
- sprawdzisz się w pracy jako Data Science Developer;
- nauczysz się analizować dane i szukać między nimi powiązań;
- od początku do końca przeanalizujesz wybraną bazę danych i zaprezentujesz wyniki swoich obserwacji;
- rozwiniesz umiejętności rozwiązywania problemów oraz prezentowania danych.
Program warsztatu
Dzień pierwszy
Ujarzmić węża, czym są te dane
Pierwszego dnia zrobimy szybką powtórkę wiadomości z programowania w języku Python. Zapoznasz się z środowiskiem, w którym będziemy pracować przez następne dni. Następnie skupimy się na danych. Dowiesz się, czym różnią się ich typy i w jaki sposób możesz je pozyskiwać.
Dzień drugi
Eksploracyjna analiza danych
Następnego dnia zaczniemy omawiać sposoby na analizowanie naszych danych. Dowiesz się, jak wyciągać z nich wartościowe informacje, wykonując proste ćwiczenia. Odkryjesz zależności między zmiennymi, będziesz też szukać anomalii w naszych zbiorach.
Dzień trzeci
Obrazowanie danych
Trzeciego dnia, po krótkim podsumowaniu dni poprzednich, przejdziemy do obrazowania naszych danych - w końcu chcemy przekazać w jak najbardziej przystępny sposób nasze dane innym. Dowiesz się, jak stworzyć zrozumiały wykres, w zależności od posiadanych danych i jak sprawiać by były jak najczytelniejsze.
Dzień czwarty
Rozpoczęcie prac nad własną infografiką
Tego dnia podzielimy się na grupy i określimy zadanie każdego członka zespołu. Nasz cel – przygotowanie infografiki na podstawie wybranych przez nas danych. Ustalimy co chcemy przekazać w infografice, na co zwrócimy uwagę odbiorcy i jakie pułapki może przed nami postawić wybrany zbiór danych.
Dzień piąty
Finalizujemy projekty
Ostatniego dnia wykorzystamy trochę czasu, aby dokończyć nasze projekty – doszlifować je od strony graficznej i technicznej. Gdy będziemy gotowi, zaprezentujemy wyniki swojej pracy całej grupie, omawiając jednocześnie wyzwania, jakie przed nami stanęły i jak sobie z nimi poradziliśmy.
Aby zrozumieć jak trudno przewidzieć kolejne 100 lat, musimy spojrzeć na trudność, jaką mieli ludzie z 1900 roku, aby przewidzieć świat do 2000 roku.
Michio Kaku