Upang buod, sa pangkalahatan kung ang distribusyon ng data ay nakahilig sa kaliwa, ang mean ay mas mababa kaysa sa median, na kadalasang mas mababa kaysa sa mode. Kung ang distribusyon ng data ay nakahilig sa kanan, ang mode ay kadalasang mas mababa kaysa sa median, na mas mababa kaysa sa mean.
Bakit hindi gaanong naaapektuhan ng baluktot na data ang median?
Bakit hindi gaanong naaapektuhan ang median ng skewed data kaysa sa mean? Gayunpaman, habang ang data ay nagiging baluktot, nawawalan ng kakayahan ang ibig sabihin nito na magbigay ng pinakamahusay na sentral na lokasyon para sa data dahil hinihila ito ng baluktot na data palayo sa karaniwang halaga.
Bakit mas mahusay ang median para sa skewed data?
Para sa mga distribusyon na may mga outlier o baluktot, ang median ang kadalasang ginustong sukat ng central tendency dahil ang median ay mas lumalaban sa mga outlier kaysa sa mean… Tandaan na ang mean ay hinihila sa direksyon ng skewness (i.e., direksyon ng buntot).
Kapag nakahilig sa kanan ang ibig sabihin ay median?
Para sa tamang skewed na pamamahagi, ang ibig sabihin ay karaniwang mas malaki kaysa sa median Pansinin din na ang buntot ng pamamahagi sa kanang bahagi (positibo) ay mas mahaba kaysa sa kaliwang bahagi. Mula sa box at whisker diagram makikita rin natin na ang median ay mas malapit sa unang quartile kaysa sa ikatlong quartile.
Paano nakakaapekto ang skewness sa data?
Mga epekto ng skewness
Kung mayroong masyadong maraming skewness sa data, maraming modelo ng istatistika ang hindi gumagana ngunit bakit. Kaya sa skewed data, ang tail region ay maaaring kumilos bilang outlier para sa statistical model at alam namin na ang mga outlier ay negatibong nakakaapekto sa performance ng modelo lalo na sa mga regression-based na modelo.