FWER

A Wikipédiából, a szabad enciklopédiából

A statisztikában a FWER (Family-wise error rate) annak a valószínűsége, hogy egy vagy több hamis megállapítást teszünk, illetve az elsődfajú hiba valószínűsége többszörös hipotézisvizsgálatnál.[1]

Története[szerkesztés]

A szakkifejezést John Tukey alkotta, jelentése: hibaráta, kísérletenkénti hibaráta. Célja az volt, hogy kimutassa azt a hibahatárt, amivel a kutatások dolgozhatnak. A kutatásokban ez a többszörös hipotézisvizsgálat egyféle kontroll-szintjeként működik.

Háttere[szerkesztés]

A „család” kifejezésnek különböző statisztikai definíciói vannak:

  • Hochberg és Tamhane 1987-ben olyan következtetések gyűjteményeként definiálta, amelyeket a hibamérésnél érdemes számba venni.[2]
  • Cox 1982-ben az alábbiakat állapította meg a „családra” vonatkozóan:
    1. Az adatbányászat miatt számításba kell venni a szelekciós hatást.
    2. Ahhoz, hogy helyes döntést lehessen hozni, a következmények egy csoportjának biztosítani kell az egyidejű bekövetkeztét.

A család leginkább a lehetséges szelekciós következmények, következtetések figyelembe vételeként definiálható.

A család az analízis legkisebb item-gyűjteménye. Jelentésük bizonyos esetekben felcserélhető, attól függően, hogy az aktuális mérések eredményei mely jelentés kiemelését teszik lehetővé.

Az összetett hipotézisvizsgálat osztályozása[szerkesztés]

A lenti táblázat összefoglalja a nullhipotézisek összetett vizsgálatának lehetséges kimeneteleit. Feltesszük, hogy m darab nullhipotézissel rendelkezünk, amiket H1, H2, ..., Hm-mel jelölünk.

A statisztikai próba során elvetjük a nullhipotézist, ha a próba szignifikánsnak bizonyul. Ha a teszt nem mutat szignifikáns eredményt, a nullhipotézist megtartjuk. Az összes fajta kimenetel összegzésével a következő valószínűségi változókat kapjuk:

A nullhipotézis igaz (H0) Az ellenhipotézis igaz (HA) Összes eset
A teszt szignifikáns eredményt hoz V S R
A teszt nem hoz szignifikáns eredményt U T m - R
Összes eset m0 m - m0 m
  • H0: nullhipotézis
  • HA: ellenhipotézis
  • m: az összes tesztelt hipotézis száma
  • m0: az igaz nullhipotézisek száma, ismeretlen paraméter
  • m - m0: az igaz ellenhipotézisek száma
  • V: tévesen elfogadott ellenhipotézisek száma (elsőfajú hiba)
  • S: megfelelően elfogadott ellenhipotézisek száma
  • T: tévesen elvetett nullhipotézisek száma (másodfajú hiba)
  • U: megfelelően elvetett nullhipotézisek száma
  • R = V + S: elvetett nullhipotézisek száma

Az m darab hipotézisvizsgálatnál, ahol m0 az igaz nullhipotézisek számát jelöli, az R egy megfigyelhető random változó, az S, T, U és V változók pedig nem megfigyelhető random változók.

Definíció[szerkesztés]

A FWER annak a valószínűsége, hogy legalább egy elsőfajú hibát vétünk a családban.

ami ekvivalens azzal, hogy

Ily módon, a állítás szerint, annak a valószínűségét, hogy egy vagy több elsőfajú hibát vétünk, -szinttel szokás kontrollálni.

Az gyenge kontrollnak minősül, ha a kontroll csak a globális nullhipotézis teljesülése mellett garantált.

A FWER erősen van kontrollálva, ha az -szint bármely null- és ellenhipotézis konfigurációjának teljesülését garantálja (akár igaz, akár hamis a globális nullhipotézis).

Kontrolláló eljárások[szerkesztés]

Az alábbi kontrolláló eljárások közül néhány klasszikus eljárás, melyek a FWER erős -kontrollját biztosítják, illetve találunk néhány újabb eljárást is.

Ezen eljárások célja, hogy legalább egy hamis eredmény valószínűségét limitálják.

A Bonferroni-eljárás[szerkesztés]

AŠidák-eljárás[szerkesztés]

Tukey eljárása[szerkesztés]

Holm csökkenő eljárása (1979)[szerkesztés]

Hochberg növekvő eljárása (1988)[szerkesztés]

Dunnett-korrekció[szerkesztés]

Schaffé-metódus[szerkesztés]

Megismételt mintavételi eljárások[szerkesztés]

Alternatív megközelítések[szerkesztés]

A FWER-kontroll szigorúbb módon kezeli a tévkövetkeztetéseket (false discovery), mint az FDR (false discovery rate) eljárások. A FWER kontroll csak annak valószínűségére korlátozódik, hogy legalább egy hibás döntést hozunk, míg a FDR tágabb értelemben, a tévkövetkeztetések várt arányára korlátozódik. Ily módon a FDR eljárásoknak nagyobb ára is van: esetükben megnő az elsőfajú hiba aránya, azaz nagyobb arányban vetünk el valós nullhipotéziseket.[3]

A másik oldalról pedig a FWER kevésbé szigorú, mint a családra vonatkozó hibaarány-kontroll (per-family error rate control), ugyanis ebben az esetben a várt hibák száma a családra vonatkozóan van limitálva. Míg a FWER-kontrollt legalább egy hibás következtetés esetén használjuk, addig a családra vonatkozó hibaarány-kontrollal esetén más a helyzet. Utóbbi nem kezeli az egyidejű többszörös tévkövetkeztetéseket súlyosabb esetként, mint az egy tévkövetkeztetést.

A Bonferroni-korrekciónál gyakran úgy tartják, hogy pusztán csak a FWER-t kontrollálja, ám valójában a családra vonatkozó hibaarányra vonatkozóan is alkalmazható.

Források[szerkesztés]

  1. https://en.wikipedia.org/wiki/Family-wise_error_rate
  2. Multiple comparison procedures. Tamhane, Ajit C. 1987–01–01. ISBN 0471822221  
  3. Shaffer, J. P. (1995). "Multiple hypothesis testing". Annual Review of Psychology46: 561–584. doi:10.1146/annurev.ps.46.020195.003021