Program i efekty kształcenia Studiów Podyplomowych Analiza Danych i Data Mining (pobierz).

 

1. Analiza statystyczna danych 
2. Data mining (Eksploracja danych)
3. Metody statystyczne
4. Bazy danych i język SQL
5. Analiza portfelowa
6. Audytorskie metody analizy danych 
7. Analiza techniczna i fundamentalna 
7. Metody statystyczne w badaniach społecznych i gospodarczych
8. Arkusze kalkulacyjne i VBA

 

1. Analiza statystyczna danych - 20 godzin laboratorium (semestr zimowy).

Uczestnicy kursu zapoznają się z praktycznymi i teoretycznymi technikami analitycznymi wykorzystywanymi do analizy danych empirycznych. W trakcie kursu słuchacze zapoznają się z podstawowymi zagadnieniami estymacji, a także testowaniem hipotez. Przedstawione zostaną podstawowe metody statystyczne analizy danych: korelacje, różnice średnich, regresja liniowa dwóch i więcej zmiennych itd. Zajęcia obejmują wiedzę niezbędną do samodzielnej analizy danych. 

 

2. Data mining  (Eksploracja danych) 20 godzin laboratorium oraz 15 godzin wykładów (semestr letni).

Nasza cywilizacja, a w szczególności duże firmy muszą sobie radzić z ogromną ilością danych. Są to dane pochodzące z baz danych, hurtowni danych oraz systemu WWW i zawierają informacje m.in. o klientach i wytwarzanych produktach. Eksploracja danych jest dziedziną informatyki, której zadaniem jest odkrywanie użytecznej wiedzy z danych i obejmuje metody i algorytmy automatycznej ich analizy. Ułatwia tworzenie promocji na podstawie koszyków zakupów, tworzenie systemu rekomendacji oraz skutecznych reklam w systemie WWW. Celem przedmiotu jest wprowadzenie do metodyki CRISP-DM i podstawowych technik eksploracji danych.

 

3. Metody statystyczne - 15 godzin laboratorium oraz 13 godzin wykładów (semestr zimowy).

Celem przedmiotu jest zapoznanie słuchacza z podstawowymi ideami i metodami stosowanymi w statystyce matematycznej. Zaprezentowane zostaną twierdzenia graniczne, techniki estymacji punktowej i przedziałowej oraz testowania hipotez statystycznych. W formie laboratorium informatycznego przedstawione zostaną podstawy pakietu statystycznego R. Wykłady oraz laboratoria dotyczyły będą następujących obszarów tematycznych. Podstawowe rozkłady ciągłe i dyskretne i ich statystyki. Prawa wielkich liczb i centralne twierdzenie graniczne. Estymacja punktowa i przedziałowa. Testowanie hipotez statystycznych. Środowisko pracy i składnia pakietu statystycznego R i jego rozszerzenia. Zastosowanie pakietu R do wyznaczania podstawowych statystyk prób losowych. Estymacja i testowanie hipotez przy użyciu pakietu R. Prezentacja podstawowych modeli statystycznych 

 

4. Bazy danych i język SQL 20 godzin laboratorium oraz  15 godzin wykładów (semestr letni).

Na wstępie uczestnicy zostają zapoznani z podstawami teoretycznymi baz danych, w tym przede wszystkim relacyjnego modelu baz danych. Kolejnym obszarem tematycznym, z którym zostaną zaznajomieni uczestnicy, będą metody tworzenia schematów relacyjnych baz danych oraz sprowadzania ich do poprawnych postaci. Uczestnicy będą mogli w sposób praktyczny sprawdzić nabytą wiedzę poprzez samodzielne tworzenie schematów relacyjnych baz danych. W dalszej części zajęć, tak teoretycznych jak i praktycznych, uczestnicy zostaną zaznajomieni z dialektem języka SQL firmy Oracle. Dzięki uzyskanej wiedzy, uczestnicy posiądą przede wszystkim praktyczną umiejętność samodzielnego tworzenia skryptów w języku SQL (firmy Oracle). W końcowej części zajęć uczestnikom zostaną przedstawione wybrane podstawy języka PL/SQL firmy Oracle, który stanowi rozszerzenie programistyczne dialektu języka SQL tej firmy.

 

5. Analiza portfelowa 20 godzin laboratorium oraz 10 godzin wykładów (semestr letni).

Celem przedmiotu jest zaznajomienie studentów z podstawami wiedzy o konstrukcji i zarządzaniu portfelem aktywów. Przedstawione zostaną zagadnienia optymalizacji portfela inwestycyjnego. Uczestnicy zapoznani zostaną z teoretycznymi, a także symulacyjnymi metodami rozwiązywania problemów optymalizacyjnych, zagadnieniem dywersyfikacji oraz konstrukcji portfeli spełniających wymagane kryteria. Uczestnicy nabędą umiejętności formułowania jakościowych wyników na podstawie ilościowych danych.

 

6. Audytorskie metody analizy danych - 28 godzin laboratorium (semestr zimowy).

Uczestnicy zapoznani zostaną z teoretycznymi podstawami prowadzenia projektów analitycznych w audycie. Dzięki przygotowaniu realnych zagadnień analitycznych, uczestnicy nabędą umiejętność praktycznego zastosowania przekazanej wiedzy teoretycznej. Wykłady oraz warsztaty dotyczyły będą następujących obszarów tematycznych. Organizacja projektu analitycznego w audycie (cele, źródła danych, analiza, raportowanie). Dostęp do danych w różnych formatach. Zapewnienie poprawności danych (walidacja, integralności danych). Analiza danych (stosowanie wyrażeń, profilowanie danych, selekcja danych, sortowanie danych, łączenie tabel). Zapewnienie rozliczenia projektu analitycznego w audycie.

 

7. Analiza techniczna i fundamentalna - 20 godzin laboratorium oraz  10 godzin wykładów (semestr zimowy).

Uczestnicy zapoznają się z zastosowaniami metod ilościowych na rynkach finansowych. Poznają również sposoby prognozowania na podstawie danych i notowań z rynków finansowych. Zajęcia przybliżą techniki analizowania różnych typów wykresów np. punktowo-symbolicznych, świecowych, słupkowych. Zaprezentowane zostaną metody analizy technicznej takie jak formacje cenowe, oscylatory i inne. Omówiona zostanie również analiza fundamentalna na przykładzie metody zdyskontowanych przepływów pieniężnych oraz analizy wskaźnikowej. Dodatkowo przedstawione zostaną metody zarządzania kapitałem, a także przykłady zastosowania informatyki na rynkach finansowych. 

 

8. Metody statystyczne w badaniach społecznych i gospodarczych - 4 godziny laboratorium oraz 6 godzin wykładów (semestr letni).

Przedmiot dotyczy praktycznych zastosowań metod statystycznych w realizacji badań dotyczących zjawisk społecznych i gospodarczych. W trakcie wykładu przedstawiony zostanie proces realizacji badania statystycznego oraz omówione przykłady rzeczywistych badań i ich metodologii. Szczególna uwaga będzie poświęcona zagadnieniom wymagającym zastosowania zaawansowanych metod statystyczno-matematycznych, dotyczącym różnych etapów badania, od jego projektowania, przez gromadzenie i przetwarzanie danych, po analizę wyników (m. in. losowanie próby, imputacja danych brakujących, uogólnianie wyników). Ćwiczenia laboratoryjne stanowiące uzupełnienie wykładu, dotyczą opracowania danych pochodzących z badań reprezentacyjnych oraz statystycznej analizy wyników badań.

 

9. Arkusze kalkulacyjne i VBA - 15 godzin laboratorium (semestr zimowy).

Celem przedmiotu jest zapoznanie słuchaczy z zaawansowanymi metodami arkuszy kalkulacyjnych. W szczególności:

- analiza danych za pomocą tabel przestawnych,

- elementy programowania w języku VBA.