Logo Obozu Naukowego

Data Science

Prowadzący:

Termin:

17-23.08.2024 r.

Lokalizacja:

Sielpia

Czas trwania warsztatów:

20 godzin - 25 jednostek lekcyjnych w ciągu 5 dni zajęć

Analiza i wizualizacja danych w Pythonie

Na każdym kroku życia otaczają nas dane. Liczba spalonych kalorii, oddechów na minutę, tętno, liczba znajomych na Facebooku, przeglądane przez nas strony w Internecie. Jednak same dane dużo nam nie dają. Musimy umieć wyciągnąć z nich jakieś wnioski oraz zobrazować nasze konkluzje, tak, aby każdy je rozumiał. Razem odkryjemy, jak za pośrednictwem narzędzi programistycznych zwizualizować dane tak, aby móc wyciągnąć z nich wartościowe informacje.

Do kogo kierowany jest ten warsztat?

Warsztat skierowany jest do uczniów liceum, którzy rozpoczęli już swoją przygodę z programowaniem (poznały ideę programowania oraz opanowały podstawy języka Python, tj. składnię języka, podstawowe typy danych, konstrukcję wyrażeń warunkowych i pętli) i chcą w przyszłości studiować na kierunkach związanych z analizą danych, informatyką i matematyką.

Niezbędny sprzęt i oprogramowanie

Do udziału w warsztacie wymagany jest własny laptop z systemem Windows, Linux lub MacOS z zainstalowanym oprogramowaniemPyCharm Community Edition:

(wersja dla komputerów z Windowsem) https://www.jetbrains.com/pycharm/download/?section=windows

(wersja dla komputerów Apple z systemem MacOS) https://www.jetbrains.com/pycharm/download/?section=mac

(wersja dla komputerów z systemem Linux) https://www.jetbrains.com/pycharm/download/other.html

Python (wersja 3.9.* lub nowsze) z zainstalowanymi bibliotekami Pandas, NumPy i Matplotlib.

Dodatkowe informacje o instalacji oprogramowania zostaną przesłane uczestnikom warsztatu w późniejszym terminie.

Dlaczego warto wziąć udział w tym warsztacie?

Biorąc udział w warsztacie:

  • rozwiniesz swoje umiejętności programowania;
  • sprawdzisz się w pracy jako Data Science Developer;
  • nauczysz się analizować dane i szukać między nimi powiązań;
  • od początku do końca przeanalizujesz wybraną bazę danych i zaprezentujesz wyniki swoich obserwacji;
  • rozwiniesz umiejętności rozwiązywania problemów oraz prezentowania danych.

Program warsztatu

Dzień pierwszy

Ujarzmić węża, czym są te dane

Pierwszego dnia zrobimy szybką powtórkę wiadomości z programowania w języku Python. Zapoznasz się z środowiskiem, w którym będziemy pracować przez następne dni. Następnie skupimy się na danych. Dowiesz się, czym różnią się ich typy i w jaki sposób możesz je pozyskiwać.

Dzień drugi

Eksploracyjna analiza danych

Następnego dnia zaczniemy omawiać sposoby na analizowanie naszych danych. Dowiesz się, jak wyciągać z nich wartościowe informacje, wykonując proste ćwiczenia. Odkryjesz zależności między zmiennymi, będziesz też szukać anomalii w naszych zbiorach.

Dzień trzeci

Obrazowanie danych

Trzeciego dnia, po krótkim podsumowaniu dni poprzednich, przejdziemy do obrazowania naszych danych - w końcu chcemy przekazać w jak najbardziej przystępny sposób nasze dane innym. Dowiesz się, jak stworzyć zrozumiały wykres, w zależności od posiadanych danych i jak sprawiać by były jak najczytelniejsze.

Dzień czwarty

Rozpoczęcie prac nad własną infografiką

Tego dnia podzielimy się na grupy i określimy zadanie każdego członka zespołu. Nasz cel – przygotowanie infografiki na podstawie wybranych przez nas danych. Ustalimy co chcemy przekazać w infografice, na co zwrócimy uwagę odbiorcy i jakie pułapki może przed nami postawić wybrany zbiór danych.

Dzień piąty

Finalizujemy projekty

Ostatniego dnia wykorzystamy trochę czasu, aby dokończyć nasze projekty – doszlifować je od strony graficznej i technicznej. Gdy będziemy gotowi, zaprezentujemy wyniki swojej pracy całej grupie, omawiając jednocześnie wyzwania, jakie przed nami stanęły i jak sobie z nimi poradziliśmy.

Aby zrozumieć jak trudno przewidzieć kolejne 100 lat, musimy spojrzeć na trudność, jaką mieli ludzie z 1900 roku, aby przewidzieć świat do 2000 roku.

Michio Kaku