Забележка: Голяма част от съдържанието в първата половина на този модул е ​​представено в 38-минутна лекция на професор Лиза Съливан. Лекцията е достъпна по-долу, както и стенограма от лекцията. Връзка към препис на лекция за основни вероятности

ролята

Вземането на проби от индивиди от популация в проба е критично важна стъпка във всеки биостатистически анализ, тъй като правим обобщения за популацията въз основа на тази извадка. Когато избирате извадка от популация, е важно пробата да е представителна за популацията, т.е. извадката трябва да бъде подобна на популацията по отношение на ключовите характеристики. Например, проучвания показват, че разпространението на затлъстяването е обратно свързано с постигнатото образование (т.е. хората с по-високи нива на образование са по-малко склонни към затлъстяване). Следователно, ако трябва да изберем извадка от популация, за да оценим общото разпространение на затлъстяването, бихме искали образователното ниво на извадката да бъде подобно на това на общата популация, за да се избегне свръх или подценяване на разпространението на затлъстяването.

Съществуват два вида вземане на проби: вероятностно и невероятностно вземане на проби. При вероятностно вземане на проби всеки член от популацията има известна вероятност да бъде избран. При не-вероятностно вземане на проби всеки член от популацията се избира без използването на вероятност.

Вероятностно вземане на проби

Обикновено произволно вземане на проби

При просто произволно вземане на проби човек започва с идентифициране на „, НАД, НАДЯСНО, ГРАНИЦА, 1, BGCOLOR,„ # c00000 “, FGCOLOR,„ #ffffff “, WIDTH, 400, TEXTSIZE, 2, TEXTCOLOR,„ # 000000 “, CAPCOLOR, '#ffffff'); "onfocus =" return overlib ('Списък на всички елементи в популацията от интерес (напр. имена на лица, телефонни номера, домашни адреси и т.н.).', CAPTION, 'Sampling Frame', CAPTIONSIZE, 2, CGCOLOR, '# c00000', PADX, 5, 5, PADY, 5, 5, BUBBLECLOSE, STICKY, CLOSECLICK, CLOSETEXT, '', НАД, НАДЯСНО, ГРАНИЦА, 1, BGCOLOR, '# c00000', FGCOLOR, '#ffffff', WIDTH, 400, TEXTSIZE, 2, TEXTCOLOR, '# 000000', CAPCOLOR, '#ffffff'); "> рамка за вземане на проби, т.е. пълен списък или изброяване на всички елементи на популацията (напр., хора, къщи, телефонни номера и др.). На всеки от тях се присвоява уникален идентификационен номер и елементите се избират на случаен принцип, за да се определят лицата, които да бъдат включени в извадката. В резултат на това всеки елемент има еднакъв шанс за да бъдете избрани и вероятността да бъдете избрани cted може лесно да се изчисли. Тази стратегия за вземане на проби е най-полезна за малки популации, тъй като изисква пълното изброяване на популацията като първа стъпка.

Много уводни статистически учебници съдържат таблици на случайни числа, които могат да се използват за осигуряване на случаен подбор, а статистическите изчислителни пакети могат да се използват за определяне на случайни числа. Excel например има вградена функция, която може да се използва за генериране на произволни числа.

Систематично вземане на проби

Систематичното вземане на проби също започва с пълната рамка за вземане на проби и присвояване на уникални идентификационни номера. При систематичното вземане на проби обаче субектите се избират на фиксирани интервали, напр. Всеки трети или всеки пети човек е избран. Разстоянието или интервалът между селекциите се определя от съотношението между размера на популацията и размера на извадката (N/n). Например, ако размерът на популацията е N = 1000 и се иска размер на извадката n = 100, тогава интервалът на вземане на проби е 1000/100 = 10, така че всеки десети човек е избран в извадката. Процесът на подбор започва с избор на първо лице на случаен принцип от първите десет субекта в рамката за вземане на проби с помощта на таблица с произволни числа; след това е избран 10-ти обект.

Ако желаният размер на извадката е n = 175, тогава фракцията на извадката е 1000/175 = 5,7, така че закръгляме това до пет и вземаме всеки пети човек. След като първият човек е избран произволно, всеки пети човек е избран от този момент до края на списъка.

При систематично вземане на проби като това е възможно да се получат непредставителни проби, ако има системно подреждане на индивидите в популацията. Да предположим например, че популацията от интерес се състои от семейни двойки и че рамката за вземане на проби е създадена, за да изброява всеки съпруг и след това съпругата му. Избирането на всеки десети човек (или произволно четно число) ще доведе до избора на всички мъже или жени в зависимост от началната точка. Това е краен пример, но трябва да се вземат предвид всички потенциални източници на систематично пристрастие в процеса на вземане на проби.

Стратифицирано вземане на проби

При стратифицирано вземане на проби, ние разделяме популацията на групи, които не се припокриват (например мъже и жени, хора на възраст под 30 години и хора на възраст над 30 години), и след това вземаме проби във всеки слой. Целта е да се осигури адекватно представяне на субектите във всеки слой.

Вземането на проби в рамките на всеки слой може да бъде чрез обикновено произволно вземане на проби или систематично вземане на проби. Например, ако популация съдържа 70% мъже и 30% жени и искаме да осигурим еднакво представяне в извадката, можем да разслоим и извадим броя на мъжете и жените, за да осигурим еднакво представяне. Например, ако желаният размер на извадката е n = 200, тогава n = 140 мъже и n = 60 жени могат да бъдат взети проби или чрез обикновено произволно вземане на проби, или чрез систематично вземане на проби.

Вземане на проби без вероятност

Има много ситуации, в които не е възможно да се генерира рамка за вземане на проби и вероятността някой човек да бъде избран в извадката е неизвестна. Най-важното обаче е изборът на представителна извадка за популацията. В тези ситуации могат да се използват не-вероятностни проби. Някои примери за извадки без вероятност са описани по-долу.

Удобство за вземане на проби

За по-удобно вземане на проби, ние избираме лица в нашата извадка въз основа на тяхната достъпност за изследователите, вместо да избираме обекти на случаен принцип от цялата популация. В резултат степента, до която извадката е представителна за целевата популация, не е известна. Например, бихме могли да се обърнем към пациенти, търсещи медицинска помощ в определена болница в зона за чакане или прием. Удобните проби са полезни за събиране на предварителни или пилотни данни, но те трябва да се използват с повишено внимание за статистически изводи, тъй като те може да не са представителни за целевата популация.

Вземане на проби от квоти

При вземане на проби от квоти ние определяме определен брой индивиди, които да бъдат избрани в нашата извадка във всяка от няколко конкретни групи. Това е подобно на стратифицираното вземане на проби, тъй като ние разработваме групи, които не се припокриват, и вземаме проби от предварително определен брой индивиди във всяка. Да предположим например, че желаният от нас размер на извадката е n = 300 и ние искаме да гарантираме, че разпределението на възрастта на субектите в извадката е подобно на това в популацията. От данните от преброяването знаем, че приблизително 30% от населението е на възраст под 20 години; 40% са между 20 и 49; и 30% са на 50 и повече години. След това бихме взели проби n = 90 лица на възраст под 20 години, n = 120 на възраст между 20 и 49 години и n = 90, които са на възраст над 50 години.