Předmět: Statistické zpracování experimentálních dat

« Zpět
Název předmětu Statistické zpracování experimentálních dat
Kód předmětu KALCH/C868
Organizační forma výuky Přednáška + Seminář
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Letní
Počet ECTS kreditů 5
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Meloun Milan, prof. RNDr. DrSc.
Obsah předmětu
1. Chyby instrumentálních měření: charakteristika přesnosti přístrojů, klasifikace chyb měření, kvantilové odhady chyb a jejich sčítání, momentové odhady chyb. 2. Zákon propagace chyb: hromadění chyb výsledků instrumentálních metod: metoda Taylorova rozvoje, metoda bodového určování, metoda simulačního určování. 3. Průzkumová (exploratorní) analýza EDA spojitých dat: metody a grafy identifikace statistických zvláštností dat: kvantilový graf, diagramy rozptýlení a krabicové grafy, graf polosum, graf symetrie, graf špičatosti, graf šikmosti, diferenční kvantilový graf, graf rozptýlení s kvantily. 4. Konstrukce a identifikace rozdělení výběru: jádrový odhad frekvenční funkce, histogram, kvantilo-kvantilový graf, rankitový a podmíněný rankitový graf. 5. Mocninná a Box-Coxova transformace: zlepšení symetrie rozdělení a stabilizace rozptylu transformací dat, selekční Hines-Hinesův graf, graf logaritmu věrohodnostní funkce, dva přístupy ke zpětné transformaci. 6. Ověření předpokladů o datech: předpoklad minimálního rozsahu, normality výběru, nezávislosti a homogenity výběru. 7. Klasická statistická analýza jednorozměrných výběrů: bodové a intervalové odhady charakteristik polohy, rozptýlení a tvaru, charakteristiky u vybraných rozdělení (normální rozdělení, rovnoměrné r., Laplaceovo r., exponenciální r., Poissonovo r.,). 8. Analýza malých výběrů: Hornův postup na bazi pivotů, pivotová polosuma, pivotové rozpětí, pivotová testační statistika. 9. Robustní analýza souborů obsahujících vybočující měření: robustní odhady parametrů polohy a rozptýlení: medián, uřezaný průměr, robustní M-odhady, neparametrické odhady rozptylů. 10. Testování statistických hypotéz: testy o paramerech jednoho souboru, testy o parameterech dvou souborů. Testy shody průměrů, testy shody rozptylu. 11. ANOVA (Analýza rozptylu): jednofaktorová a dvoufaktorová ANOVA: modely s pevnými efekty a modely s náhodnými efekty, ověření normality chyb, ověření konstantnosti rozptylu. Řešení metodou lineární regresního modelu. 12. Lineární regresní modely: formulace lineárního regresního modelu; geometrie lineárního modelu, testování homogenity úseků a směrnic; testování shody regresních přímek. Validizace nové metody. 13. Vícerozměrné lineární regresní modely: hledání nejsprávnějšího modelu, vyšetření významnosti parametrů modelu, předpoklady metody nejmenších čtverců a jejich ověření, statistické vlastnosti vícerozměrné lineární regrese. 14. Regresní diagnostika u (vícerozměrných) lineárních regresních modelů: posouzení regresního tripletu (data a model a metoda); odhalení vlivných bodů (extrémy a vybočující body), hete?roskedasticita chyb, autokorelace chyb, normalita chyb, multikolinearita. 15. Kalibrace: druhy kalibrace a kalibrační modely, přesnost kalibrace, kalibrační přímka, kalibrační křivka. Mez detekce, mez stanovení, kritická úroveň. 16. Korelace: korelační modely pro dvě náhodné veličiny a pro více náhodných veličin; korelační koeficienty: globální, párový a parciální korelační koeficient. 17. Nelineární regresní modely: formulace nelineárního regresního modelu; modely chyb měření; formulace kritéria nelineární regrese; geometrie nelineární regrese; výskyt lokálních minim, špatná podmíněnost parametrů v modelu, testování spolehlivosti určení parametrů. 18. Statistická analýza v nelineární regresi: nelinearita modelu, oblasti spolehlivosti parametrů; konfidenční intervaly parametrů, testy hypotéz o odhadech parametrů, spolehlivost odhadů parametrů. 19. Výstavba regresního modelu: regresní diagnostika: statistická analýza reziduí a odhalení vlivných bodů; spolehlivost odhadů parametrů na základě těsnosti proložení.

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Metody samostatných akcí, Nácvik dovedností
  • Účast na výuce - 30 hodin za semestr
  • Vypracování seminární práce - 20 hodin za semestr
  • Příprava na zkoušku - 40 hodin za semestr
  • Praktická výuka - 30 hodin za semestr
Výstupy z učení
Vybavit studenty statistickým aparátem na počítači k analýze experimentálních jednorozměrných dat a naučit je pracovat se softwarovými nástroji. Využití interaktivní statistické analýzy umožňuje vyšetřit statistické zvláštnosti jednorozměrných dat průzkumovou analýzou dat, ověřit předpoklady o datech výběru a provést zhodnocení kvality dat s odhalením hlubších souvislostí v datech. Výuka probíhá v elektronické učebně dle pravidla: "po hodině přednášek následuje vždy hodina praktických příkladů na počítači". Ve cvičení se v úlohách učebnice Kompendium? počítačově diagnostikuje, vyšetřuje a hledá v datech skryté, objektivní informace. Po základech metrologie, výpočtu nejistoty výsledku následuje vyhodnocení jednorozměrných dat exploratorní a konfirmatorní analýzou dat. Interaktivní počítačové zkoumání vztahů v datech je založeno na vyšetření rozličných průzkumových diagnostik. Počítačová tvorba lineárních regresních modelů patří v řadě technických oborů k základním metodám vyhodnocení experimentálních dat. Vedle formulace a geometrie regresního modelu slouží bohatá regresní diagnostika k vyšetření regresního tripletu (současná analýza bloku "data - model - metoda"), a tím i k prokázání navrženého modelu pro daná data danou metodou. V laboratoři bývá často křivkový kalibrační graf nesprávně aproximován přímkou. U dat jsou především vyšetřovány vlivné body, tj. vybočující body a extrémy a diskutován jejich vliv na parametry kalibrace i odhadovanou neznámou koncetraci. Splinové aproximace lze využít i ke stanovení bodu ekvivalence na titračních křivkách sigmoidálního tvaru. Tvorba regresních modelů je jednou z nejpoužívanějších technik matematického modelování v technické praxi. Vzhledem k neúplné znalosti modelovaného systému je nutno řešit celý komplex otázek souvisejících s tvorbou regresního modelu, odhadem jeho parametrů (numerické hledisko), stanovením jeho vlastností (statistické hledisko) a hodnocením jeho kvality.
Absolvováním předmětu je student schopen objektivně vyhodnotit jednorozměrná data, odhadnout parametry polohy, rozptýlení a tvaru, testovat správnost a shodnost, nalézt vybočující hodnoty, a vyextrahovat z dat maximální množství užitečné informace. Moderní počítačová interaktivní statistická analýza mu umožní vyšetřit statistické zvláštnosti dat průzkumovou analýzou dat, ověřit předpoklady o datech výběru, provést zhodnocení kvality dat. Do regrese patří také validace nových metod a lineární a nelineární kalibrace stanovení neznámé koncentrace. Výstavba lineárního a nelineárního regresního modelu je v interakci s počítačem na bázi regresního tripletu (kritika dat, kritika modelu a kritika metody).
Předpoklady
Nejsou žádné zvláštní požadavky na studenta nebo předpoklady na jeho předběžné znalosti statistiky a matematiky. Student by měl ovládat práci s počítačem a se základním softwarem (např. Microsoft Office), a to při práci s textem a s grafy. Výuka probíhá v elektronické učebně dle pravidla: "po hodině přednášek následuje vždy hodina řešení praktických úloh na počítači". V úlohách se počítačově diagnostikuje, vyšetřuje a extrahuje skrytá objektivní informace, ukrytá v datech.

Hodnoticí metody a kritéria
Písemná zkouška, Posouzení zadané práce

Praktické ovládání interaktivní statistické analýzy prokáže student vypracováním 10 úloh ve své semestrální práci, což představuje 40% zkoušky. Teoretické znalosti postupů počítačové interaktivní statistické analýzy prokáže student v písemné zkoušce, což představuje 60% zkoušky.
Doporučená literatura
  • M. Meloun, J. Militký. KOMPENDIUM STATISTICKÉHO ZPRACOVÁNÍ DAT. Academia Praha, 2002. ISBN 80-200-1008-4.
  • M. Meloun, J. Militký. KOMPENDIUM STATISTICKÉHO ZPRACOVÁNÍ DAT. Academia Praha, 2006. ISBN 80-200-1396-2.
  • M. Meloun, J. Militký, M. Hill. Počítačová analýza vícerozměrných dat v příkladech. Academia Praha, 2005. ISBN 80-200-1335-0.
  • M. Meloun, J. Militký. Sbírka úloh pro Statistické zpracování experimentálních dat. Univerzita Pardubice 1996, 1996. ISBN 80-7194-075-5.
  • M. Meloun, J. Militký. STATISTICKÁ ANALÝZA EXPERIMENTÁLNÍCH DAT v chemometrii, biometrii, ekonometrii a v dalších oborech přírodních, technických a společenských věd, . Praha, 2004. ISBN 80-200-1254-0.
  • M. Meloun, J. Militký. STATISTICKÁ ANALÝZA EXPERIMENTÁLNÍCH DAT v chemometrii, biometrii, ekonometrii a v dalších oborech přírodních, technických a společenských věd,. EAST PUBLISHING Praha, 1998. ISBN 80-7219-003-2.
  • Meloun, M.; Militký, J.; Forina, M. Chemometrics for Analytical Chemistry, Volume 1: PC-Aided Statistical Data Analysis. Ellis Horwood, Chichester, 1992. ISBN 0-13-126376-5.
  • Meloun, M.; Militký, J.; Forina, M. Chemometrics for Analytical Chemistry, Volume 2: PC-Aided Regression and Related Methods. Ellis Horwood, Chichester, 1994. ISBN 0-13-123788-7.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru Doporučený ročník Doporučený semestr
Fakulta chemicko-technologická Ochrana životního prostředí (2015) Ekologie a ochrana životního prostředí 1 Letní
Fakulta chemicko-technologická Ochrana životního prostředí (2016) Ekologie a ochrana životního prostředí 1 Letní
Fakulta chemicko-technologická Ochrana životního prostředí (2013) Ekologie a ochrana životního prostředí 1 Letní