Հիպոթեզի փորձարկում

Պիթոնի օգտագործմամբ վարկածների փորձարկման պարզ և հակիրճ ձեռնարկ

Պատկերը ՝ http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Այս բլոգում ես կներկայացնեմ հիպոթեզի թեստավորման հակիրճ ձեռնարկ `օգտագործելով վիճակագրական մեթոդները Python- ում: Հիպոթեզի թեստավորումն այն գիտական ​​մեթոդի մի մասն է, որին մենք բոլորս ծանոթ ենք, մի բան, որը մենք հավանաբար սովորել ենք մեր վաղ ուսումնական տարիներին: Այնուամենայնիվ, վիճակագրության մեջ շատ փորձեր են արվում բնակչության նմուշի վրա:

«Սահմանելը, թե ինչպիսի օրինակ է մեզ դիտողությունների շարքից, առաջարկված բացատրության մասին, ընդհանուր առմամբ, պահանջում է, որ մենք եզրակացություն անենք կամ, ինչպես մենք ենք անվանում վիճակագրագետներ, Պատճառ անորոշության հետ: Անորոշության հետ կապված պատճառաբանությունը վիճակագրական եզրակացության հիմքն է և սովորաբար կատարվում է մեթոդի միջոցով, որը կոչվում է «Զրոյական հիպոթեզի նշանակության փորձարկում»: -Գազ.

Որպես այս բլոգի օրինակ ՝ ես կօգտագործեմ Kaggle- ում հայտնաբերված եվրոպական Ֆուտբոլային տվյալների հավաքածու և կանցկացնեմ հիպոթեզի փորձարկում: Տվյալների հավաքածուն կարող եք գտնել այստեղ:

Քայլ 1

Դիտարկում արեք

Առաջին քայլը երևույթները դիտարկելն է: Այս դեպքում դա կլինի. Արդյո՞ք կա պաշտպանական ագրեսիայի ազդեցություն միջին թույլատրելի նպատակների վրա:

Քայլ 2

Ուսումնասիրեք հետազոտությունը

Լավ մտածելակերպն այն է, որ խելացի աշխատանքը դժվար չէ: Լավ բան պետք է անել `տեսնու՞մ եք արդյոք ձեր դիտարկմանը վերաբերող հետազոտություններ: Եթե ​​այդպես է, դա կարող է նպաստել մեր հարցին պատասխանելուն: Արդեն գոյություն ունեցող հետազոտությունների կամ փորձերի մասին տեղյակ լինելը կօգնի մեզ ավելի լավ ձևավորել մեր փորձը, կամ գուցե նույնիսկ պատասխանել մեր հարցին և ստիպված չէ առաջին հերթին անցկացնել փորձը:

Քայլ 3

Ձևավորել զրոյական վարկած և այլընտրանքային վարկած

Այլընտրանքային վարկածը մեր կրթված գուշակությունն է, և զրոյական վարկածը պարզապես հակառակն է: Եթե ​​այլընտրանքային վարկածի համաձայն, կա երկու փոփոխականի միջև էական փոխհարաբերություն, զրոյական վարկածն ասում է, որ էական հարաբերություն չկա:

Մեր զրոյական վարկածը կլինի. Չկա վիճակագրական տարբերություն այն նպատակների հետ, որոնք թույլատրված են պաշտպանական ագրեսիայի վարկանիշ ունեցող ավելի մեծ կամ հավասար `65-ից ցածր 65 թիմերի համար:

Այլընտրանքային վարկած. Կա նպատակների վիճակագրական տարբերություն այն նպատակների հետ, որոնք թույլատրված են պաշտպանական ագրեսիայի վարկանիշ ունեցող ավելի մեծ կամ հավասար `65-ից ցածր 65-ի փոխարեն:

Քայլ 4

Որոշեք, թե արդյոք մեր վարկածը միակողմանի փորձություն է, թե երկկողմանի փորձություն:

Միանգամյա թեստ

«Եթե դուք օգտագործում եք 0.05 նշանակության մակարդակ, ապա մեկանգամյա թեստը թույլ է տալիս ձեր բոլոր ալֆաներին ստուգել վիճակագրական նշանակությունը հետաքրքրության մեկ ուղղությամբ»: Միակողմանի քննության օրինակ կարող է լինել. «Ֆուտբոլային թիմերը, որոնք ունեն ցածր ագրեսիայի վարկանիշ, 65-ից թույլ են տալիս վիճակագրորեն զգալիորեն ավելի շատ գոլ կատարել, քան 65-ից ցածր վարկանիշ ունեցող թիմերը»:

Երկկողմանի թեստ

«Եթե դուք օգտագործում եք 0.05 նշանակության մակարդակ, երկկողմանի թեստը թույլ է տալիս ձեր ալֆայի կեսը փորձարկել վիճակագրական նշանակությունը մեկ ուղղությամբ, իսկ ձեր ալֆայի կեսը` փորձարկել վիճակագրական նշանակությունը մյուս ուղղությամբ: Սա նշանակում է, որ 0,025-ը գտնվում է ձեր թեստային վիճակագրության բաշխման յուրաքանչյուր պոչում »:

Երկկողմանի թեստով դուք փորձարկում եք վիճակագրական նշանակությունը երկու ուղղություններով: Մեր դեպքում մենք փորձարկում ենք վիճակագրական նշանակությունը երկու ուղղություններով:

Քայլ 5

Սահմանել շեմի նշանակության մակարդակ (ալֆա)

(ալֆայի արժեք). սահմանային շեմն, որի դեպքում մենք զերծ ենք մնում զրոյական վարկածը մերժելուց: Ալֆա արժեքը կարող է լինել ցանկացած արժեք, որը մենք սահմանում ենք 0-ից 1-ը: Այնուամենայնիվ, գիտության մեջ ամենատարածված ալֆայի արժեքը 0.05 է: 0.05-ին դրված ալֆան նշանակում է, որ մենք լավ ենք մերժել զրոյական վարկածը, չնայած որ կա 5% կամ ավելի քիչ հավանականություն, որ արդյունքները պայմանավորված են պատահականության պատճառով:

P- արժեք. Այս տվյալները պատահականորեն հասնելու հաշվարկված հավանականությունը:

Եթե ​​մենք հաշվում ենք p- արժեք և այն հասնում է 0,03-ի, ապա կարող ենք մեկնաբանել սա ՝ ասելով. «3% հավանականություն կա, որ արդյունքները, որոնք ես տեսնում եմ, իրականում պատահականության կամ մաքուր բախտի բերումով են»:

Պատկեր ՝ Learn.co- ից

Մեր նպատակն է հաշվարկել p- ի արժեքը և համեմատել այն մեր ալֆայի հետ: Որքան ցածր է ալֆան, այնքան ավելի խիստ է թեստը:

Քայլ 6

Կատարել նմուշառում

Այստեղ մենք ունենք մեր տվյալների բազան, որը կոչվում է ֆուտբոլ: Մեր թեստի համար մեզ անհրաժեշտ են ընդամենը երկու սյուներ մեր տվյալների հավաքածուի մեջ `team_def_aggr_rating և اهداف_ թույլատրված: Մենք այն զտելու ենք այս երկու սյունակներին, այնուհետև կստեղծենք երկու ենթաբազմություն 65-ից ավելի կամ հավասար պաշտպանական ագրեսիայի վարկանիշ ունեցող թիմերի համար և 65-ից ցածր պաշտպանական ագրեսիայի վարկանիշ ունեցող թիմերի համար:

Ուղղակի մեր վարկածի քննության համար դիմելու համար.

Պաշտպանական ագրեսիայի ազդեցությունը թույլատրված միջին նպատակների վրա: Null վարկած. Չկա վիճակագրական տարբերություն այն նպատակների հետ, որոնք թույլատրված են պաշտպանական ագրեսիայի վարկանիշ ունեցող ավելի մեծ կամ հավասար `65-ից ցածր 65-ի փոխարեն: Այլընտրանքային վարկած. Այլընտրանքային վարկած. քան կամ հավասար է 65-ից ցածր թիմերի 65-ի դիմաց. երկկողմանի փորձարկման ալֆա `0.05

Այժմ մենք ունենք նմուշների երկու ցուցակ, որոնց վրա կարող ենք անցկացնել վիճակագրական թեստեր: Մինչ այդ քայլը, ես նախատեսում եմ երկու բաշխումները `տեսողական տեսք ստանալու համար:

Քայլ 7

Կատարեք երկկողմանի T- թեստ

Երկու նմուշ ունեցող T- թեստը օգտագործվում է որոշելու, թե արդյոք բնակչության երկու միջոցները հավասար են: Դրա համար մենք կօգտագործենք Python մոդուլը, որը կոչվում է statsmodels: Ես չեմ դիտարկի շատ մանրամասն տեղեկություններ statsmels- ի մասին, բայց փաստաթղթերը կարող եք տեսնել այստեղ:

Քայլ 8

Գնահատեք և եզրակացեք

Հիշեցնենք, որ մեր կողմից տեղադրված ալֆան a = 0.05 էր: Ինչպես տեսնում ենք մեր թեստի արդյունքներից, p- ի արժեքը պակաս է մեր ալֆայից: Մենք կարող ենք մերժել մեր անվայել վարկածը և 95% վստահությամբ ընդունել մեր այլընտրանքային վարկածը:

Շնորհակալություն կարդալու համար: Հիպոթեզի փորձարկման ավելի խորքային ուսումնասիրության համար կարող եք ստուգել այս խմբային նախագիծը GitHub- ում, որտեղ ես ներգրավված էի այստեղ վարկածների փորձարկման մեջ:

Ռեսուրսներ.

Վառարաններ, Մեթյու. «Վիճակագրությունը և« Գիտական ​​մեթոդը »վերցված է YourStatsGuru- ից: https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Ներածություն SAS- ին: UCLA` Վիճակագրական խորհրդատվական խումբ: https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (հասանելի է մայիս 16, 2019 թ.):

Տեխնիկական վիճակագրության ձեռնարկ: https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm