Předmět: Chemometrics II

« Zpět
Název předmětu Chemometrics II
Kód předmětu KALCH/C013A
Organizační forma výuky Přednáška
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Letní
Počet ECTS kreditů 5
Vyučovací jazyk Angličtina
Statut předmětu unspecified
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Dostupnost předmětu Předmět je nabízen přijíždějícím studentům
Vyučující
  • Meloun Milan, prof. RNDr. DrSc.
Obsah předmětu
1. Charakter vícerozměrných dat: Datová matice, objekty a proměnné. Typy proměnných a vícerozměrný náhodný vektor. Odhady parametrů polohy a rozptýlení vícerozměrných dat. 2. Předúprava vícerozměrných dat: Druhy transformací. Centrování a normování dat. Druhy zobrazení vícerozměrných dat. Průzkumová analýza vícerozměrných dat a vyhledávání odlehlých měření. 3. Statistické testování vícerozměrných náhodných výběrů: Odhady parametrů polohy a rozptýlení. Statistická analýza vektoru středních hodnot, statistická analýza kovariančních matic. Vybočující body. 4. Analýza kovariance: Výklad kovarianční matice. Předpoklady analýzy kovariance. Využití kovariance v analýze vícerozměrných dat. Analýza korelace, analýza korelační matice. Korelační modely pro více náhodných veličin. Párový korelační koeficient, parciální korelační koeficient, vícenásobný korelační koeficient. 5. Průzkumová analýza vícerozměrných dat: Zobrazení vícerozměrných dat, analýza profilů. Testy normality. Grafy k ověření normality. 6. Metody k odhalení struktury ve znacích a objektech. 7. Analýza hlavních komponent PCA: Podstata a matematický popis metody. Vlastnosti hlavních komponent. Geometrický význam PCA. Statistická analýza hlavních komponent. Interpretace hlavních komponent. Grafické pomůcky analýzy hlavních komponent. Diagnostika metody hlavních komponent. Určení počtu komponent směsi analýzou absorbanční matice. 8. Faktorová analýza FA: Zaměření a cíle metody. Podstata metody a postup FA. Model faktorové analýzy a odhad parametrů faktorového modelu. Odhad faktorového skóre, rotace faktorů. Formulace úlohy FA. Grafické pomůcky v FA. Postup diagnostikování FA. Nalezené řešení a dosažená těsnost proložení. Interpretace výsledků a pojmenování faktorů. Kankareho metoda určení počtu částic ve vícesložkové směsi, Wernimontova metoda klasifikace spektrofotometrů. 9. Kanonická korelační analýza CCA: Zaměření a cíle metody. Podstata metody a postup CCA. Formulace úlohy CCA. Předpoklady CCA. Postup diagnostikování CCA. Test významnosti kanonických korelací. Vysvětlení kanonických proměnných. Analýza redundance. Nalezené řešení a dosažená těsnost proložení. Interpretace výsledků. 10. Diskriminační analýza DA: Klasifikace objektů. Zaměření a cíle metody DA. Podstata metody, postup DA a zařazovací pravidla. Lineární a kvadratická diskriminační funkce. Formulace úlohy DA. Předpoklady DA. Volba znaků. Úprava prahového bodu. Průběh diagnostikování DA. Diagram teritoriální mapy. Nalezené řešení a dosažená těsnost proložení. Interpretace výsledků. 11. Logistická regrese LR: Zaměření a cíle metody. Podstata metody a postup logistické regrese. Logistický regresní model. Formulace úlohy LR. Předpoklady LR. Odhady parametrů a jejich statistická významnost. Volba proměnných a jejich interpretace. Kvalita vyhodnocení a nalezené řešení a dosažená těsnost proložení logistickým modelem. Interpretace výsledků. 12. Shluková analýza CLU: Podstata shlukové analýzy. Míry podobnosti a vzdálenosti. Vhodnost standardizace dat. Kritéria pro posouzení kvality rozkladu do shluků, vzdálenost a podobnost objektů. Hierarchická posloupnost rozkladů. Dendrogramy hierarchického shlukování. Fuzzy shlukování. Shlukování metodou nejbližších středů-medoidů. Postup obecné analýzy shluků. Těsnost proložení ve výstavbě shluků. 13. Mapování objektů vícerozměrným škálováním MDS: Zaměření a cíle metody. Podstata metody a postup vícerozměrného škálování. Metrická a nemetrická metoda MDS. Formulace úlohy MDS. Předpoklady MDS. Postup MDS. Nalezené řešení a dosažená těsnost proložení. Interpretace výsledků. 14. Korespondenční analýza CA: Zaměření a cíle metody. Podstata metody a postup korespondenční analýzy. Formulace úlohy CA. Předpoklady CA. Nalezené řešení a dosažená těsnost proložení. Interpretace výsledků.

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Metody samostatných akcí, Nácvik dovedností
  • Účast na výuce - 30 hodin za semestr
  • Vypracování seminární práce - 20 hodin za semestr
  • Příprava na zkoušku - 40 hodin za semestr
  • Praktická výuka - 30 hodin za semestr
Výstupy z učení
Vícerozměrná interaktivní statistická analýza umožňuje v datové matici o více znacích (proměnných) odhalit skrytou informaci a vnitřní vazby, a tím i strukturu vlastností znaků (sloupce) a objektů (řádky). V datech je uložena informace, kterou je třeba vyextrahovat a odkrýt tak přírodou vložené tajemství. V datech bývají také skryté problémové hodnoty čili hrubé chyby, systematické chyby, odlehlé hodnoty, extrémy a je třeba rozhodnout, zda je nutné je z další analýzy odstranit nebo jako anomálie ponechat či opravit. Prvotní průzkum v datech se provádí grafickými pomůckami s cílem odkrýt zvláštní hodnoty, které významně ovlivňují hledané parametry. K odhalení souvislostí, které jsou ve vícerozměrných datech ukryty se užívají především techniky ke klasifikaci a diskriminaci dat: faktorová analýza identifikuje skupiny znaků a jejich zátěží, které vysvětlují celkové chování, zatímco shluková analýza hledá skupiny, shluky uvnitř dat a odhalí podobnosti a rozdíly mezi objekty. Na příkladech jsou probírány grafické diagnostiky průzkumové, exploratorní analýzy dat s prvotní úpravou dat, po níž následují klasifikační techniky jako metoda hlavních komponent, faktorová analýza, diskriminační analýza, kanonická korelační analýza, logistická regrese, analýza shluků, vícerozměrné škálování korespondenční analýzou a vícerozměrná analýza rozptylu. U každé techniky je kladen důraz na grafické diagnostikování v užívaném software, kdy odhalené vnitřní vztahy jsou zvláště názorné k logické interpretaci úlohy. Úlohy jsou voleny z oborů přírodních věd, zejména z biochemické a klinické praxe, dále z analytické chemie ale také ze společenských věd a i věd ekonomických. Obecně zvládnutí tohoto nástroje umožní dopracovat se k podstatě, objevit zákonitosti, které jsou laikovi jinak beznadějně skryté. Ovládnutí těchto dovedností odlišuje profesionála od ?obsluhovatele? sofistikovaných přístrojů či sběrače dat, který si s naměřenými nebo jinak získanými údaji neví v podstatě rady. Předmět je ukončen vyřešením 10 úloh v individuální semestrální práci a následnou zkouškou.
Absolvováním předmětu bude student schopen objektivně vyhodnotit vícerozměrná data, odhadnout parametry polohy, rozptýlení a tvaru, testovat správnost a shodnost, nalézt vybočující hodnoty, a vyextrahovat z dat maximální množství užitečné informace. Moderní počítačová interaktivní statistická analýza mu umožní vyšetřit statistické zvláštnosti dat průzkumovou analýzou dat. K odhalení souvislostí, které jsou ve vícerozměrných datech ukryty se užívají především techniky ke klasifikaci a diskriminaci dat: faktorová analýza identifikuje skupiny znaků a jejich zátěží, které vysvětlují celkové chování, zatímco shluková analýza hledá skupiny, shluky uvnitř dat a odhalí podobnosti a rozdíly mezi objekty. Jsou probírány grafické diagnostiky, pak následují klasifikační techniky jako metoda hlavních komponent, faktorová analýza, diskriminační analýza, kanonická korelační analýza, logistická regrese, analýza shluků, vícerozměrné škálování korespondenční analýzou a vícerozměrná analýza rozptylu.
Předpoklady
V tomto předmětu nejsou na studenta kladeny žádné zvláštní požadavky na studenta nebo předpoklady na jeho předběžné znalosti statistiky a matematiky. Student by měl ovládat pouze práci s počítačem a se základním softwarem (např. Microsoft Office), a to hlavně při práci s textem a s grafy. Výuka probíhá v elektronické učebně dle pravidla: "po hodině přednášek následuje vždy hodina řešení praktických úloh na počítači". V úlohách student počítačově diagnosticky vyšetřuje a extrahuje skrytou objektivní informaci, ukrytou v datech.

Hodnoticí metody a kritéria
Písemná zkouška, Posouzení zadané práce

Praktické ovládání interaktivní statistické analýzy prokáže student vypracováním 10 úloh ve své semestrální práci, což představuje 40% zkoušky. Teoretické znalosti metod a postupů počítačové interaktivní statistické analýzy prokáže student písemnou zkouškou, což představuje 60% zkoušky.
Doporučená literatura
  • M. Meloun, J. Militký. KOMPENDIUM STATISTICKÉHO ZPRACOVÁNÍ DAT. Academia Praha, 2002. ISBN 80-200-1008-4.
  • M. Meloun, J. Militký. KOMPENDIUM STATISTICKÉHO ZPRACOVÁNÍ DAT. Academia Praha, 2006. ISBN 80-200-1396-2.
  • M. Meloun, J. Militký, M. Hill. Počítačová analýza vícerozměrných dat v příkladech. Academia Praha, 2005. ISBN 80-200-1335-0.
  • M. Meloun, J. Militký. Sbírka úloh pro Statistické zpracování experimentálních dat. Univerzita Pardubice 1996, 1996. ISBN 80-7194-075-5.
  • M. Meloun, J. Militký. STATISTICKÁ ANALÝZA EXPERIMENTÁLNÍCH DAT v chemometrii, biometrii, ekonometrii a v dalších oborech přírodních, technických a společenských věd, . Praha, 2004. ISBN 80-200-1254-0.
  • M. Meloun, J. Militký. STATISTICKÁ ANALÝZA EXPERIMENTÁLNÍCH DAT v chemometrii, biometrii, ekonometrii a v dalších oborech přírodních, technických a společenských věd,. EAST PUBLISHING Praha, 1998. ISBN 80-7219-003-2.
  • Meloun, M.; Militký, J.; Forina, M. Chemometrics for Analytical Chemistry, Volume 1: PC-Aided Statistical Data Analysis. Ellis Horwood, Chichester, 1992. ISBN 0-13-126376-5.
  • Meloun, M.; Militký, J.; Forina, M. Chemometrics for Analytical Chemistry, Volume 2: PC-Aided Regression and Related Methods. Ellis Horwood, Chichester, 1994. ISBN 0-13-123788-7.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru Doporučený ročník Doporučený semestr