FWER

A statisztikában a FWER (Family-wise error rate) annak a valószínűsége, hogy egy vagy több hamis megállapítást teszünk, illetve az elsődfajú hiba valószínűsége többszörös hipotézisvizsgálatnál.^[1]

Története[szerkesztés]

A szakkifejezést John Tukey alkotta, jelentése: hibaráta, kísérletenkénti hibaráta. Célja az volt, hogy kimutassa azt a hibahatárt, amivel a kutatások dolgozhatnak. A kutatásokban ez a többszörös hipotézisvizsgálat egyféle kontroll-szintjeként működik.

Háttere[szerkesztés]

A „család” kifejezésnek különböző statisztikai definíciói vannak:

Hochberg és Tamhane 1987-ben olyan következtetések gyűjteményeként definiálta, amelyeket a hibamérésnél érdemes számba venni.^[2]
Cox 1982-ben az alábbiakat állapította meg a „családra” vonatkozóan:
1. Az adatbányászat miatt számításba kell venni a szelekciós hatást.
2. Ahhoz, hogy helyes döntést lehessen hozni, a következmények egy csoportjának biztosítani kell az egyidejű bekövetkeztét.

A család leginkább a lehetséges szelekciós következmények, következtetések figyelembe vételeként definiálható.

A család az analízis legkisebb item-gyűjteménye. Jelentésük bizonyos esetekben felcserélhető, attól függően, hogy az aktuális mérések eredményei mely jelentés kiemelését teszik lehetővé.

Az összetett hipotézisvizsgálat osztályozása[szerkesztés]

A lenti táblázat összefoglalja a nullhipotézisek összetett vizsgálatának lehetséges kimeneteleit. Feltesszük, hogy m darab nullhipotézissel rendelkezünk, amiket H₁, H₂, ..., H_m-mel jelölünk.

A statisztikai próba során elvetjük a nullhipotézist, ha a próba szignifikánsnak bizonyul. Ha a teszt nem mutat szignifikáns eredményt, a nullhipotézist megtartjuk. Az összes fajta kimenetel összegzésével a következő valószínűségi változókat kapjuk:

	A nullhipotézis igaz (H₀)	Az ellenhipotézis igaz (H_A)	Összes eset
A teszt szignifikáns eredményt hoz	V	S	R
A teszt nem hoz szignifikáns eredményt	U	T	m - R
Összes eset	m₀	m - m₀	m

H₀: nullhipotézis
H_A: ellenhipotézis
m: az összes tesztelt hipotézis száma
m₀: az igaz nullhipotézisek száma, ismeretlen paraméter
m - m₀: az igaz ellenhipotézisek száma
V: tévesen elfogadott ellenhipotézisek száma (elsőfajú hiba)
S: megfelelően elfogadott ellenhipotézisek száma
T: tévesen elvetett nullhipotézisek száma (másodfajú hiba)
U: megfelelően elvetett nullhipotézisek száma
R = V + S: elvetett nullhipotézisek száma

Az m darab hipotézisvizsgálatnál, ahol m₀ az igaz nullhipotézisek számát jelöli, az R egy megfigyelhető random változó, az S, T, U és V változók pedig nem megfigyelhető random változók.

Definíció[szerkesztés]

A FWER annak a valószínűsége, hogy legalább egy elsőfajú hibát vétünk a családban.

$FWER=Pr(V\geqslant ),$ ami ekvivalens azzal, hogy

$FWER=1-Pr(V=0).$

Ily módon, a $FWER\leq \alpha$ állítás szerint, annak a valószínűségét, hogy egy vagy több elsőfajú hibát vétünk, $\alpha$ -szinttel szokás kontrollálni.

Az $\alpha$ gyenge kontrollnak minősül, ha a kontroll csak a globális nullhipotézis teljesülése mellett garantált.

A FWER erősen van kontrollálva, ha az $\alpha$ -szint bármely null- és ellenhipotézis konfigurációjának teljesülését garantálja (akár igaz, akár hamis a globális nullhipotézis).

Kontrolláló eljárások[szerkesztés]

Az alábbi kontrolláló eljárások közül néhány klasszikus eljárás, melyek a FWER erős $\alpha$ -kontrollját biztosítják, illetve találunk néhány újabb eljárást is.

Ezen eljárások célja, hogy legalább egy hamis eredmény valószínűségét limitálják.

A Bonferroni-eljárás[szerkesztés]

AŠidák-eljárás[szerkesztés]

Tukey eljárása[szerkesztés]

Holm csökkenő eljárása (1979)[szerkesztés]

Hochberg növekvő eljárása (1988)[szerkesztés]

Dunnett-korrekció[szerkesztés]

Schaffé-metódus[szerkesztés]

Megismételt mintavételi eljárások[szerkesztés]

Alternatív megközelítések[szerkesztés]

A FWER-kontroll szigorúbb módon kezeli a tévkövetkeztetéseket (false discovery), mint az FDR (false discovery rate) eljárások. A FWER kontroll csak annak valószínűségére korlátozódik, hogy legalább egy hibás döntést hozunk, míg a FDR tágabb értelemben, a tévkövetkeztetések várt arányára korlátozódik. Ily módon a FDR eljárásoknak nagyobb ára is van: esetükben megnő az elsőfajú hiba aránya, azaz nagyobb arányban vetünk el valós nullhipotéziseket.^[3]

A másik oldalról pedig a FWER kevésbé szigorú, mint a családra vonatkozó hibaarány-kontroll (per-family error rate control), ugyanis ebben az esetben a várt hibák száma a családra vonatkozóan van limitálva. Míg a FWER-kontrollt legalább egy hibás következtetés esetén használjuk, addig a családra vonatkozó hibaarány-kontrollal esetén más a helyzet. Utóbbi nem kezeli az egyidejű többszörös tévkövetkeztetéseket súlyosabb esetként, mint az egy tévkövetkeztetést.

A Bonferroni-korrekciónál gyakran úgy tartják, hogy pusztán csak a FWER-t kontrollálja, ám valójában a családra vonatkozó hibaarányra vonatkozóan is alkalmazható.

Források[szerkesztés]

↑ https://en.wikipedia.org/wiki/Family-wise_error_rate
↑ Multiple comparison procedures. Tamhane, Ajit C. 1987–01–01. ISBN 0471822221
↑ Shaffer, J. P. (1995). "Multiple hypothesis testing". Annual Review of Psychology. 46: 561–584. doi:10.1146/annurev.ps.46.020195.003021

[1] ttps://en.wikipedia.org/wiki/Family-wise_error_rate

[2] Multiple comparison procedures. Tamhane, Ajit C. 1987–01–01. ISBN 0471822221

[3] Shaffer, J. P. (1995). "Multiple hypothesis testing". Annual Review of Psychology. 46: 561–584. doi:10.1146/annurev.ps.46.020195.003021

[1]

[2]

[3]