Концепція вибірки. Тема семінару: вибірка у соціологічному дослідженні Ключові поняття
Концепція вибірки.
Лекція 4
1. Поняття вибірки. 2. Типи вибірок та способи побудови выборок.3. Визначення обсягу вибірки.
Генеральна сукупність– безліч всіх елементів, які мають деякі загальними властивостями, істотними їх характеристики. Формування вибірки ґрунтується на знанні контуру генеральної сукупності, під яким розуміється список усіх, хто цікавить дослідника споживачів. Наприклад, список усіх домовласників певного регіону чи міста, чи список усіх торгових точок, які реалізують продукти.
Залежно від обсягу генеральної сукупності та цілей дослідження можуть бути використані методи суцільногоабо вибірковогообстеження. При проведенні суцільногообстеження вивчаються усі одиниці сукупності. Даний метод може бути використаний якщо кількість елементів генеральної сукупності невелика (vip-клієнти у споживчих дослідженнях, організації у дослідженнях business-to-business).
Найбільш поширеним способом отримання даних у маркетингових дослідженнях є вибірковеспостереження. Виконання певних правил відбору одиниць у вибіркову сукупність та дотримання репрезентативності вибірки дозволяє поширювати вибіркові дані на генеральну сукупність.
При формуванні вибірки використовуються імовірнісні і неймовірні (Детерміновані) методи.
Імовірнісна вибірка (probability sampling) – вибірка, у якому кожен елемент об'єкта дослідження може потрапити із заданим ступенем ймовірності. У ймовірнісних вибірках кожен елемент генеральної сукупності відомий і має певну можливість потрапити до обстеження. Слід зазначити, що неможливо точно розрахувати ймовірності через відсутність відомостей про розмір генеральної сукупності. Тому термін «певна ймовірність» швидше пов'язані з правилами формування вибірки, ніж із знанням точних розмірів генеральної сукупності.
Детермінована вибірка (non-probability sampling) – вибірка, у яку елементи потрапляють виходячи з заздалегідь певних переваг чи суджень. У неймовірних вибіркахне виконується умова рівної ймовірності попадання кожного об'єкта генеральної сукупності у вибірку. Для цього типуВибірок не можна розрахувати помилку вибірки (похибка). Але це не означатиме, що під час дослідження будуть отримані неточні результати. Неймовірні вибірки вимагають менших тимчасових та фінансових витрат. Часто неймовірні вибірки використовуються для відносно малих генеральних сукупностей (тисячі, десятки тисяч споживачів).
Виділяються такі види детермінованих вибірок:
· Нерепрезентативні;
· навмисні;
· Квотні;
· основний масив.
Нерепрезентативні (convenience sampling) вибірки ґрунтуються на відборі найбільш доступних елементів (покупці в магазинах, перехожі на вулиці тощо). Дослідник покладається принцип принципу респондента до проектованої генеральної сукупності.
Навмисні (judgemental sampling) вибірки ґрунтуються на відборі вручну тих елементів, які, на думку дослідника, відповідають цілям дослідження. Різновидом навмисної вибірки є вибірка за принципом "снігової грудки" (snowball sampling). Вона полягає у визначенні початкових елементів, кожен з яких вказує на кілька нових і так далі. Така вибірка використовується при обстеженні об'єктів зі специфічними ознаками, що займають невисоку частку в загальній множині аналогічних об'єктів і тісно взаємодіють між собою. Навмисні вибірки мають той самий основний недолік, як і нерепрезентативна вибірка – неможливість оцінки її помилки та низький рівень репрезентативності.
Квотна вибірка - квотні вибірки (quota sampling) – детерміновані вибірки, що формуються шляхом включення у вибірку елементів у тій же пропорції за основними характеристиками, в якій вони присутні в загальній досліджуваній сукупності
один із найбільш популярних методів формування вибірки. При використанні квотного методу відбирають одну або кілька ознак, за якими контролюватиметься вибірка. Кількість одиниць у вибірці, які мають певні характеристики, має бути пропорційно кількості таких одиниць у генеральній сукупності. Вважається, що з використанні методу квот можна робити вибірку меншого обсягу, ніж за випадковому відборі, оскільки квотний відбір дає майже повний збіг вибіркової і генеральної сукупностей за заданими параметрами, тобто. дотримується властивість репрезентативності (представницькості) вибірки. Однак це твердження неможливо підтвердити за допомогою математичних методів. Найчастіше як параметри квотування використовуються соціально – демографічні ознаки (стаття, вік, освіта, рівень доходів тощо).
Метод основного масиву передбачає включення у вибірку понад 50% об'єктів генеральної сукупності. Перевага опитування з методом основного масивуполягає в тому, що вибірка має високу питому вагу в генеральній сукупності. За рахунок цього вдається усунути можливі помилки. У принципі, достатньо опитати велику частку респондентів генеральної сукупності, що мінімізує відмінність вибіркової середньої від генеральної середньої.
Імовірнісні методи.Якщо одиниці вибірки мають відомий шанс (імовірність) бути включеними у вибірку, то вибірка називається імовірнісною. Імовірнісні методи включають до свого складу:
· Простий випадковий відбір;
· Систематичний відбір;
· Кластерний відбір;
· Стратифікований відбір.
Проста випадкова (simple random sampling, SRS) - вибірка, в якій кожен елемент об'єкта дослідження з рівною ймовірністю може потрапити у вибіркову сукупність Найпростіший методформування імовірнісної вибірки. Така вибірка формується шляхом випадкового рівноймовірного відбору елементів їх повного переліку. Основним недоліком такої вибірки є необхідність володіння повним переліком елементів досліджуваної сукупності , що забезпечується у практиці маркетингових дослідженьдосить рідко. При простий випадкової вибірці відбір проводиться з усієї маси одиниць генеральної сукупності без попереднього розчленування її на будь-які групи, і кожен елемент має однакову ймовірність попадання у вибірку (Р), яку можна розрахувати як відношення розміру вибірки до розміру генеральної сукупності. Наприклад, якщо розмір сукупності дорівнює 10000 тис. чол., а розмір вибірки – 600 чол., то можливість потрапляння у вибірку конкретної людини дорівнює 6% (400/10000 * 100). Найпростіший спосіб організації випадкової вибірки – це жеребкування, чи використання таблиці випадкових чисел. При телефонному інтерв'ю комп'ютер може випадково генерувати телефонні номери, оскільки має генератор випадкових чисел.
Статистична сукупність- безліч одиниць, що мають масовість, типовість, якісну однорідність і наявність варіації.
Статистична сукупність складається з матеріально існуючих об'єктів (працівники, підприємства, країни, регіони), є об'єктом .
Одиниця сукупності- Кожна конкретна одиниця статистичної сукупності.
Одна і та ж статистична сукупність може бути однорідною за однією ознакою і неоднорідною за іншою.
Якісна однорідність- подібність всіх одиниць сукупності за якоюсь ознакою і несхожість по всіх інших.
У статистичній сукупності відмінності однієї одиниці сукупності з іншого частіше мають кількісну природу. Кількісні зміни значень ознаки різних одиницьсукупності називаються варіацією.
Варіація ознаки- Кількісне зміна ознаки (для кількісної ознаки) при переході від однієї одиниці сукупності до іншої.
Ознака- Це властивість, характерна рисаабо інша особливість одиниць, об'єктів та явищ, яка може бути спостерігається або виміряна. Ознаки поділяються на кількісні та якісні. Різноманітність та мінливість величини ознаки в окремих одиниць сукупності називається варіацією.
Атрибутивні (якісні) ознаки не піддаються числовому виразу (склад населення за статтю). Кількісні ознаки мають числове вираження (склад населення віком).
Показник- Це узагальнююча кількісно якісна характеристика будь-якої властивості одиниць або сукупності в цілому в конкретних умовах часу та місця.
Система показників- Це сукупність показників всебічно відображають явище, що вивчається.
Наприклад, вивчається зарплата:- Ознака - оплата праці
- Статистична сукупність – усі працівники
- Одиниця сукупності – кожен працівник
- Якісна однорідність - нарахована зарплата
- Варіація ознаки – ряд цифр
Генеральна сукупність та вибірка з неї
Основу становить безліч даних, отриманих у результаті виміру однієї чи кількох ознак. Реально спостерігається сукупність об'єктів, статистично представлена рядом спостережень випадкової величини, є вибіркою, А гіпотетично існуюча (що домислюється) - генеральною сукупністю. Генеральна сукупність може бути кінцевою (кількість спостережень N = const) або нескінченною ( N = ∞), а вибірка з генеральної сукупності - це завжди результат обмеженого ряду спостережень. Число спостережень, що утворюють вибірку, називається обсягом вибірки. Якщо обсяг вибірки досить великий ( n → ∞) вибірка вважається великий, інакше вона називається вибіркою обмеженого обсягу. Вибірка вважається малоїякщо при вимірюванні одновимірної випадкової величини обсяг вибірки не перевищує 30 ( n<= 30 ), а при вимірі одночасно декількох ( k) ознак у багатовимірному просторі відношення nдо kне перевищує 10 (n/k< 10) . Вибірка утворює варіаційний ряд, якщо її члени є порядковими статистиками, Т. е. вибіркові значення випадкової величини Хупорядковані за зростанням (ранжовані), значення ж ознаки називаються варіантами.
приклад. Практично одна й та сама випадково відібрана сукупність об'єктів - комерційних банків одного адміністративного округу Москви, може розглядатися як вибірка з генеральної сукупності всіх комерційних банків цього округу, і як вибірка з генеральної сукупності всіх комерційних банків Москви, а також як вибірка з комерційних банків країни та і т.д.
Основні способи організації вибірки
Достовірність статистичних висновків та змістовна інтерпретація результатів залежить від репрезентативностівибірки, тобто. повноти та адекватності уявлення властивостей генеральної сукупності, стосовно якої цю вибірку вважатимуться представницької. Вивчення статистичних властивостей сукупності можна організувати двома способами: за допомогою суцільногоі несплошного. Суцільне спостереженняпередбачає обстеження всіх одиницьвивчається сукупності, а несуцільне (вибіркове) спостереження- Тільки його частини.
Існують п'ять основних способів організації вибіркового спостереження:
1. простий випадковий відбір, при якому об'єкти випадково вилучаються з генеральної сукупності об'єктів (наприклад, за допомогою таблиці або датчика випадкових чисел), причому кожна з можливих вибірок мають рівну ймовірність. Такі вибірки називаються власне-випадковими;
2. простий відбір за допомогою регулярної процедуриздійснюється за допомогою механічної складової (наприклад, дати, дня тижня, номера квартири, літери алфавіту та ін.) та отримані таким способом вибірки називаються механічними;
3. стратифікованийВідбір полягає в тому, що генеральна сукупність обсягу підрозділяється на підсукупність або шари (страти) обсягу так що . Страти є однорідними об'єктами з погляду статистичних характеристик (наприклад, населення ділиться на страти по віковим групам чи соціальної власності; підприємства — по галузях). У цьому випадку вибірки називаються стратифікованим(інакше, розшарованими, типовими, районованими);
4. методи серійноговідбору використовуються для формування серійнихабо гніздових вибірок. Вони зручні у разі, якщо необхідно обстежити відразу " блок " чи серію об'єктів (наприклад, партію товару, продукцію певної серії чи населення при територіально-адміністративному розподілі країни). Відбір серій можна здійснити власно-випадковим чи механічним способом. При цьому проводиться суцільне обстеження певної партії товару або цілої територіальної одиниці (житлового будинку чи кварталу);
5. комбінований(ступінчастий) відбір може поєднувати в собі відразу кілька способів відбору (наприклад, стратифікований та випадковий або випадковий та механічний); така вибірка називається комбінованої.
Види відбору
за видурозрізняються індивідуальний, груповий та комбінований відбір. При індивідуальному відборіу вибіркову сукупність відбираються окремі одиниці генеральної сукупності, груповий відбір- якісно однорідні групи (серії) одиниць, а комбінований відбірпередбачає поєднання першого та другого видів.
за методомвідбору розрізняють повторну та безповторнувибірку.
Безповторнимназивається відбір, у якому що потрапила вибірку одиниця не повертається у вихідну сукупність й у подальшому виборі бере участь; при цьому чисельність одиниць генеральної сукупності Nскорочується у процесі відбору. При повторномувідборі потрапилау вибірку одиниця після реєстрації повертається у генеральну сукупність і таким чином зберігає рівну можливість поряд з іншими одиницями бути використаною у подальшій процедурі відбору; при цьому чисельність одиниць генеральної сукупності Nзалишається незмінною (метод у соціально-економічних дослідженнях застосовується рідко). Однак, за великого N (N → ∞)формули для безповторноговідбору наближаються до аналогічних для повторноговідбору та практично частіше використовуються останні ( N = const).
Основні характеристики параметрів генеральної та вибіркової сукупності
В основі статистичних висновків проведеного дослідження лежить розподіл випадкової величини (х 1, х 2, …, х n)називаються реалізаціями випадкової величини Х(n - Обсяг вибірки). Розподіл випадкової величини в генеральній сукупності має теоретичний, ідеальний характер, а її вибірковий аналог є емпіричнимрозподілом. Деякі теоретичні розподіли задані аналітично, тобто. їх параметривизначають значення функції розподілу у кожній точці простору можливих значень випадкової величини. Для вибірки функцію розподілу визначити важко, а іноді неможливо, тому параметриоцінюють за емпіричними даними, а потім їх підставляють в аналітичний вираз, що описує теоретичний розподіл. При цьому припущення (або гіпотеза) Про вид розподілу може бути як статистично вірним, так і хибним. Але в будь-якому випадку відновлений за вибіркою емпіричний розподіл лише грубо характеризує справжнє. Найважливішими параметрами розподілу є математичне очікуваннята дисперсія.
За своєю природою розподілу бувають безперервнимиі дискретними. Найбільш відомим безперервним розподілом є нормальне. Вибірковими аналогами параметрів і для нього є: середнє значення та емпірична дисперсія. Серед дискретних у соціально-економічних дослідженнях найчастіше застосовується альтернативне (дихотомічне)Розподіл. Параметр математичного очікування цього розподілу виражає відносну величину (чи частку) одиниць сукупності, які мають досліджувану ознаку (вона позначена буквою ); частка сукупності, що не має цієї ознаки, позначається буквою q (q = 1 - p). Дисперсія альтернативного розподілу також має емпіричний аналог .
Залежно від виду розподілу та способу відбору одиниць сукупності по-різному обчислюються характеристики параметрів розподілу. Основні з них для теоретичного та емпіричного розподілів наведені у табл. 1.
Часткою вибірки k nназивається відношення числа одиниць вибіркової сукупності до одиниць генеральної сукупності:
k n = n/N.
Вибіркова частка w- Це відношення одиниць, що володіють ознакою, що вивчається xдо обсягу вибірки n:
w = n n /n.
приклад.У партії товару, що містить 1000 од., при 5% вибірці частка вибірки k nв абсолютній величині складає 50 од. (n = N * 0,05); якщо ж у цій вибірці виявлено 2 браковані вироби, то вибіркова частка шлюбу wстановитиме 0,04 (w = 2/50 = 0,04 або 4%).
Так як вибіркова сукупність відмінна від генеральної, то виникають помилки вибірки.
Таблиця 1. Основні параметри генеральної та вибіркової сукупностейПомилки вибірки
При будь-якому (суцільному та вибірковому) можуть зустрітися помилки двох видів: реєстрації та репрезентативності. Помилки реєстраціїможуть мати випадковийі систематичнийхарактер. Випадковіпомилки складаються з безлічі різних неконтрольованих причин, мають ненавмисний характер і зазвичай за сукупністю врівноважують один одного (наприклад, зміни показників приладу при температурних коливаннях у приміщенні).
Систематичніпомилки тенденційні, тому що порушують правила відбору об'єктів у вибірку (наприклад, відхилення у вимірах при зміні налаштування вимірювального приладу).
приклад.Для оцінки соціального становища населення місті передбачено обстежити 25% сімей. Якщо при цьому вибір кожної четвертої квартири ґрунтується на її номері, то існує небезпека відібрати всі квартири лише одного типу (наприклад, однокімнатні), що забезпечить систематичну помилку та спотворить результати; вибір же номера квартири за жеребом кращий, оскільки помилка буде випадковою.
Помилки репрезентативностіпритаманні лише вибірковому спостереженню, їх неможливо уникнути і вони виникають унаслідок того, що вибіркова сукупність в повному обсязі відтворює генеральну. Значення показників, одержуваних за вибіркою, відрізняються від показників цих самих величин у генеральній сукупності (або одержуваних при суцільному спостереженні).
Помилка вибіркового спостереженняє різниця між значенням параметра в генеральній сукупності та її вибірковим значенням. Для середнього значення кількісної ознаки вона дорівнює: , а частки (альтернативного ознаки) — .
Помилки вибірки властиві лише вибірковим спостереженням. Чим більше ці помилки, тим більше емпіричний розподіл відрізняється від теоретичного. Параметри емпіричного розподілу і є випадковими величинами, отже, помилки вибірки також є випадковими величинами, можуть приймати різні вибірки різні значення і тому прийнято обчислювати середню помилку.
Середня помилка вибіркиє величина, що виражає середнє квадратичне відхилення вибіркової середньої від математичного очікування. Ця величина за дотримання принципу випадкового відбору залежить передусім від обсягу вибірки і зажадав від ступеня варіювання ознаки: що більше і менше варіація ознаки (отже, і значення ), тим менше величина середньої помилки вибірки . Співвідношення між дисперсіями генеральної та вибіркової сукупностей виражається формулою:
тобто. при досить великих вважатимуться, що . Середня помилка вибірки показує можливі відхилення параметра вибіркової сукупності від генерального параметра. У табл. 2 наведено вирази для обчислення середньої помилки вибірки за різних методів організації спостереження.
Таблиця 2. Середня помилка (m) вибіркових середньої та частки для різних видів вибіркиДе - середня із внутрішньогрупових вибіркових дисперсій для безперервної ознаки;
Середня із внутрішньогрупових дисперсій частки;
- Кількість відібраних серій, - Загальна кількість серій;
,
де - Середня серії;
- загальна середня по всій вибірковій сукупності для безперервної ознаки;
,
де - частка ознаки в серії;
- Загальна частка ознаки по всій вибірковій сукупності.
Однак про величину середньої помилки можна судити лише з певною ймовірністю Р (Р ≤ 1). Ляпунов О.М. довів, що розподіл вибіркових середніх , а отже, та його відхилень від генеральної середньої, за досить великому числі приблизно підпорядковується нормальному закону розподілу за умови, що генеральна сукупність має кінцевої середньої та обмеженої дисперсією.
Математично це твердження для середньої виражається у вигляді:
а для частки вираз (1) набуде вигляду:
де - є гранична помилка вибіркияка кратна величині середньої помилки вибірки , а коефіцієнт кратності - є критерій Стьюдента ("коефіцієнт довіри"), запропонований У.С. Держсетом (псевдонім "Student"); значення для різного обсягу вибірки зберігаються у спеціальній таблиці.
Значення функції Ф(t) при деяких значеннях t дорівнюють:Отже, вираз (3) може бути прочитаний так: з ймовірністю Р = 0,683 (68,3%)можна стверджувати, що різниця між вибірковою та генеральною середньою не перевищить однієї величини середньої помилки m (t = 1)з ймовірністю Р = 0,954 (95,4%)що вона не перевищить величини двох середніх помилок m (t = 2) ,з ймовірністю Р = 0,997 (99,7%)- не перевищить трьох значень m (t = 3).Таким чином, ймовірність того, що ця різниця перевищить триразову величину середньої помилки, визначає рівень помилкиі становить не більше 0,3% .
У табл. 3 наведено формули для обчислення граничної помилки вибірки.
Таблиця 3. Гранична помилка (D) вибірки для середньої та частки (р) для різних видів вибіркового спостереженняПоширення вибіркових результатів на генеральну сукупність
Кінцевою метою вибіркового спостереження є характеристика генеральної сукупності. При малих обсягах вибірки емпіричні оцінки параметрів (і) можуть суттєво відхилятися від їх справжніх значень (і). Тому виникає необхідність встановити межі, у яких для вибіркових значень параметрів ( і ) лежать справжні значення ( і ).
Довірчим інтерваломбудь-якого параметра θгенеральної сукупності називається випадкова область значень цього параметра, яка з ймовірністю близькою до 1 ( надійністю) містить справжнє значення цього параметра.
Гранична помилкавибірки Δ дозволяє визначити граничні значення характеристик генеральної сукупності та їх довірчі інтервали, які рівні:
Нижня границя довірчого інтервалуотримана шляхом віднімання граничної помилкиз вибіркового середнього (частки), а верхня – шляхом її додавання.
Довірчий інтервалдля середньої використовує граничну помилку вибірки та для заданого рівня достовірності визначається за формулою:
Це означає, що із заданою ймовірністю Ряка називається довірчим рівнем і однозначно визначається значенням t, можна стверджувати, що справжнє значення середньої лежить у межах від а справжнє значення частки - в межах від
Під час розрахунку довірчого інтервалу для трьох стандартних довірчих рівнів Р = 95%, Р = 99% та Р = 99,9%значення вибирається за . Програми в залежності від числа ступенів свободи. Якщо обсяг вибірки досить великий, то відповідні цим імовірностям значення tрівні: 1,96, 2,58 і 3,29 . Таким чином, гранична помилка вибірки дозволяє визначити граничні значення характеристик генеральної сукупності та їх довірчі інтервали:
Поширення результатів вибіркового спостереження на генеральну сукупність у соціально-економічних дослідженнях має особливості, оскільки потребує повноти представницькості її типів і груп. Основою для можливості такого розповсюдження є розрахунок відносної помилки:
де Δ % - відносна гранична помилка вибірки; , .
Існують два основні методи поширення вибіркового спостереження на генеральну сукупність: прямий перерахунок та спосіб коефіцієнтів.
Сутність прямого перерахункуполягає у множенні вибіркового середнього значення!! \ overline (x) на обсяг генеральної сукупності .
приклад. Нехай середня кількість дітей ясельного віку в місті оцінена вибірковим методом і склала людину. Якщо місті 1000 молодих сімей, кількість необхідних місць у муніципальних дитячих яслах отримують множенням цієї середньої чисельність генеральної сукупності N = 1000, тобто. становитиме 1200 місць.
Спосіб коефіцієнтівдоцільно використовувати у разі, коли вибіркове спостереження проводиться з метою уточнення даних суцільного спостереження.
При цьому використовують формулу:
де всі змінні - це чисельність сукупності:
Необхідний обсяг вибірки
Таблиця 4. Необхідний обсяг (n) вибірки для різних видів організації вибіркового спостереженняПри плануванні вибіркового спостереження із заздалегідь заданим значенням припустимої помилки вибірки необхідно правильно оцінити необхідний обсяг вибірки. Цей обсяг може бути визначений на основі припустимої помилки при вибірковому спостереженні, виходячи із заданої ймовірності, що гарантує допустиму величину рівня помилки (з урахуванням способу організації спостереження). Формули визначення необхідної чисельності вибірки n легко отримати безпосередньо з формул граничної помилки вибірки. Так, з висловлювання для граничної помилки:
безпосередньо визначається обсяг вибірки n:
Ця формула показує, що зі зменшенням граничної помилки вибірки Δ істотно збільшується необхідний обсяг вибірки, який пропорційний дисперсії та квадрату критерію Стьюдента.
Для конкретного способу організації спостереження необхідний обсяг вибірки обчислюється згідно з формулами, наведеними в таблиці. 9.4.
Практичні приклади розрахунку
Приклад 1. Обчислення середнього значення та довірчого інтервалу для безперервної кількісної ознаки.
Для оцінки швидкості розрахунку з кредиторами у банку проведено випадкову вибірку 10 платіжних документів. Їх значення виявилися рівними (у днях): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.
Необхідно з ймовірністю Р = 0,954визначити граничну помилку Δ вибіркової середньої та довірчі межі середнього часу розрахунків.
Рішення.Середнє значення обчислюється за такою формулою з табл. 9.1 для вибіркової сукупності
Дисперсія обчислюється за такою формулою з табл. 9.1.
Середня квадратична похибка дня.
Помилка середньої обчислюється за такою формулою:
тобто. середнє значення дорівнює x ± m = 12,0 ± 2,3 дні.
Достовірність середнього склала
Граничну помилку обчислимо за такою формулою з табл. 9.3 для повторного відбору, оскільки чисельність генеральної сукупності невідома, та Р = 0,954рівня достовірності.
Таким чином, середнє значення дорівнює x ± D = x ± 2m = 12,0 ± 4,6, тобто. його справжнє значення лежить у межах від 7,4 до 16,6 днів.
Використання таблиці Стьюдента. Додатки дозволяє зробити висновок, що з n = 10 — 1 = 9 ступенів свободи отримане значення достовірно з рівнем значимості a £ 0,001, тобто. отримане значення середнього вірогідно відрізняється від 0.
Приклад 2. Оцінка ймовірності (генеральної частки) нар.
При механічному вибірковому способі обстеження соціального стану 1000 сімей виявлено, що частка малозабезпечених сімей склала w = 0,3 (30%)(вибірка була 2% , тобто. n/N = 0,02). Необхідно з рівнем достовірності р = 0,997визначити показник рмалозабезпечених сімей у всьому регіоні.
Рішення.За представленими значеннями функції Ф(t)знайдемо для заданого рівня достовірності Р = 0,997значення t = 3(Див. формулу 3). Граничну помилку частки wвизначимо за формулою із табл. 9.3 для безповторного відбору (механічна вибірка завжди є безповторною):
Гранична відносна помилка вибірки в % складе:
Імовірність (генеральна частка) малозабезпечених сімей у регіоні становитиме р=w±Δw, а довірчі межі р обчислюються виходячи з подвійної нерівності:
w - Δ w ≤ p ≤ w - Δ w, тобто. справжнє значення р лежить у межах:
0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.
Таким чином, із ймовірністю 0,997 можна стверджувати, що частка малозабезпечених сімей серед усіх сімей регіону становить від 28,6% до 31,4%.
приклад 3.Обчислення середнього значення та довірчого інтервалу для дискретної ознаки, заданої інтервальним рядом.
У табл. 5. задано розподіл заявок виготовлення замовлень за термінами їх виконання предприятием.
Таблиця 5. Розподіл спостережень щодо термінів появиРішення. Середній термін виконання заявок обчислюється за такою формулою:
Середній термін складе:
= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 міс.
Та ж відповідь отримаємо, якщо використовуємо дані про р i з передостанньої колонки табл. 9.5, використовуючи формулу:
Зауважимо, що середина інтервалу для останньої градації знаходиться шляхом її штучного доповнення шириною інтервалу попередньої градації, що дорівнює 60 - 36 = 24 міс.
Дисперсія обчислюється за формулою
де х i- Середина інтервального ряду.
Отже!!\sigma = \frac (20 2 + 14 2 + 1 + 25 2 + 49 2) (4), а середня квадратична похибка .
Помилка середньої обчислюється за такою формулою міс., тобто. середнє значення дорівнює!! \ overline (x) ± m = 23,1 ± 13,4.
Граничну помилку обчислимо за такою формулою з табл. 9.3 для повторного відбору, оскільки чисельність генеральної сукупності невідома, для 0,954 рівня достовірності:
Таким чином, середнє значення дорівнює:
тобто. його справжнє значення лежить у межах від 0 до 50 місяців.
приклад 4.Для визначення швидкості розрахунків із кредиторами N = 500 підприємств корпорації у комерційному банку необхідно провести вибіркове дослідження методом випадкового безповторного відбору. Визначити необхідний обсяг вибірки n, щоб із ймовірністю Р = 0,954 помилка середнього значення вибірки не перевищувала 3-х днів, якщо пробні оцінки показали, що середнє відхилення квадратне s склало 10 днів.
Рішення. Для визначення кількості необхідних досліджень n скористаємося формулою для відбору безповторного з табл. 9.4:
У ній значення t визначається з рівня достовірності Р = 0,954. Воно дорівнює 2. Середнє квадратичне значення s = 10, обсяг генеральної сукупності N = 500, а гранична помилка середнього значення Δ x = 3. Підставляючи ці значення формулу, отримаємо:
тобто. вибірку достатньо скласти із 41 підприємства, щоб оцінити необхідний параметр — швидкість розрахунків із кредиторами.
Майже до кожної аудиторської перевірки застосовується вибірка.
Вибірка у сенсі слова – це такий підхід до аудит.проверке, який передбачає дослідження документів і записи в бух.обліку не суцільним порядком, лише частково.
Вибірка у вузькому значенні слова – це перелік певним чином відібраних елементів перевіряється сукупності з єдиною метою з урахуванням їх детального вивчення дійти невтішного висновку про всю перевіряється сукупності.
Мета вибірки – суттєво скоротити час перевірки за збереження її якості.
Вибірку також застосовують у випадках, коли немає необхідності у проведенні суцільної перевірки через очевидну незначність можливих помилок.
Аудитори застосовують 2 види вибірки:
1-вибірка на відповідність
2-вибірка по суті
Вибірка на відповідність застосовується для тестування засобів контролю
обсяг вибірки на відповідність обернено пропорційно очікуваному рівню контрольного ризику, чим вище очікуваний контрольний ризик, тим менше вибірка і навпаки.
Щоб переконатися в надійності контролю, аудитор збільшує обсяг вибірки на відповідність. Вибірка по суті застосовується для перевірки сальдо та оборотів за рахунками.
Використання вибірки пов'язане з появою помилки вибірки. вона характеризує відхилення параметрів генеральної сукупності параметрів сукупності вибірки. Вона характеризує відхилення параметрів сукупності вибіркової.
Якщо помилки вибірки прямо пропорційно залежно від неоднорідності сукупності і обернено пропорційно від обсягу вибірки
В аудиті застосовується 2 підходи до помилки вибірки:
1) помилку вибірки розраховують і отримане значення використовує визначення параметрів генеральної сукупності
2) використання прийомів, що дозволяють зменшити помилку вибірки до прийнятного рівня, після чого її ігнорують.
До таких прийомів належать такі:
1. з генеральної сукупності заздалегідь видаляють елементи переважно ключові елементи. Їх перевіряють суцільними методами, а вибірку методами, що залишилися.
Елементи найбільшої вартості – найбільші цифри. Елементи найбільшої вартості вважаються величини, що становлять не менше 75% від рівня суттєвості розділу, що перевіряється б/в.
Ключові елементи – це такі цифри, у яких на професійну думку аудитора висока ймовірність спотворення.
стратифікація, тобто. розподіл генеральної сукупності на однорідні підгрупи (страти). Ділити можна за атрибутивною та кількісною ознаками. Вибірку ділять за кожною статтею.
помилку вибірки можна зменшити за рахунок збільшення її обсягу (n)
2. Методи відбору елементів аудиторської вибірки
Вибірка дає надійні результати, якщо вона є репрезентативною. Репрезентативна вибірка залежить від методів відбору її елементів. В аудиті застосовується 3 методи.
статистичний - це випадковий відбір, заснований на теорії ймовірності. Аудитор використовує програмний генератор випадкових чисел чи таблицю випадкових чисел.
систематичний відбір. При такому підході спочатку розраховується інтервал відбору, а потім довільно задають точку відліку, яку вибирають один інтервалі.
безсистемний відбір. Аудитор вибирає елементи довільно, без будь-якої системи.
Статистичний метод дає найкращий результат. Цей метод кожної одиниці генеральної сукупності рівні шанси потрапити у вибірку. Найгірший метод – системний.
Вибірка - безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.
Обсяг вибірки
Обсяг вибірки - кількість випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30-35.
Залежні та незалежні вибірки
При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця основа взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнюків,
- два виміри будь-якої ознаки до і після експериментального впливу,
- чоловіки та дружини
- і т.п.
Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:
- чоловіки та жінки,
- психологи та математики.
- Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.
Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:
- t-критерій Стьюдента
- T-критерій Вілкоксону
- U-критерій Манна-Уітні
- Критерій знаків
- та ін.
Репрезентативність
Вибірка може розглядатися як репрезентативна або нерепрезентативна.
Приклад нерепрезентативної вибірки
У США одним із найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році. Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним за телефонними книгами всієї країни, та людям із реєстраційних списків автомобілів. У 25 % бюлетенів, що повернулися (майже 2,5 мільйона) голоси були розподілені наступним чином:
57% віддавали перевагу кандидату-республіканцю Альфу Лендону
40% обрали чинного на той час президента-демократа Франкліна Рузвельта
На дійсних виборах, як відомо, переміг Рузвельт, набравши більше 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії мати телефони та автомобілі могли собі дозволити в основному представники середнього та верхнього класу (тобто більшість республіканців, а не демократів).
Види плану побудови груп із вибірок
Виділяють кілька основних видів плану побудови груп:
- Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.
- Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням лише однієї групи – експериментальної.
- Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.
Стратегії побудови груп
Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.
- Рандомізація (випадковий відбір)
- Залучення реальних груп
Рандомізація
Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів, можна скласти папірці з іменами всіх студентів вишу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).
Попарний відбір
Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з найкращим варіантом - залученням
Вибірка
Вибіркаабо вибіркова сукупність- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.
Характеристики вибірки:
- Якісна характеристика вибірки – кого саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.
- Кількісна характеристика вибірки – скільки випадків вибираємо, тобто обсяг вибірки.
Необхідність вибірки
- Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.
- Існує потреба у зборі первинної інформації.
Обсяг вибірки
Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30-35.
Залежні та незалежні вибірки
При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну пару (тобто коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнюків,
- два виміри будь-якої ознаки до і після експериментального впливу,
- чоловіки та дружини
- і т.п.
Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:
Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.
Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:
- та ін.
Репрезентативність
Вибірка може розглядатися як репрезентативна або нерепрезентативна.
Приклад нерепрезентативної вибірки
- Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.
- Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням лише однієї групи – експериментальної.
- Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.
Типи вибірки
Вибірки поділяються на два типи:
- імовірнісні
- неймовірні
Імовірнісні вибірки
- Проста ймовірнісна вибірка:
- Проста повторна вибірка. Використання такої вибірки ґрунтується на припущенні, що кожен респондент з часткою ймовірності може потрапити у вибірку. За підсумками списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і їх навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки разів, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.
Процедура побудови простої випадкової вибірки включає наступні кроки:
1. необхідно отримати повний список членів генеральної сукупності та пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;
2. визначити очікуваний обсяг вибірки, тобто очікуване число опитаних;
3. Витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має бути 100 людина, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватись комп'ютерною програмою.
4. вибрати зі списку-основи спостереження, номери яких відповідають виписаним випадковим числам
- Проста випадкова вибірка має очевидні переваги. Цей метод дуже простий для розуміння. Результати дослідження можна поширювати на сукупність, що вивчається. Більшість підходів до отримання статистичних висновків передбачають збирання інформації за допомогою простої випадкової вибірки. Однак метод простої випадкової вибірки має як мінімум чотири суттєві обмеження:
1. часто складно створити основу вибіркового спостереження, яка б провести просту випадкову вибірку.
2. результатом застосування простої випадкової вибірки може стати більша сукупність, або сукупність, розподілена на великій географічній території, що значно збільшує час і вартість збору даних.
3. результати застосування простої випадкової вибірки часто характеризуються низькою точністю та більшою стандартною помилкою, ніж результати застосування інших ймовірнісних методів.
4. в результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють сукупність, що вивчається. Імовірність цього особливо велика за невеликого обсягу вибірки.
- Проста неповторна вибірка. Процедура побудови вибірки така сама, тільки картки з номерами респондентів не повертаються назад у колоду.
- Систематична імовірнісна вибірка. Є спрощеним варіантом простої імовірнісної вибірки. За підсумками списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Розмір До визначається випадково. Найбільш достовірний результат досягається при однорідній генеральній сукупності, інакше можливі збіг величини кроку та якихось внутрішніх циклічних закономірностей вибірки (змішування вибірки). Мінуси: такі ж, як і в простій імовірнісній вибірці.
- Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (родина, школа, бригада тощо). Відібрані елементи зазнають суцільного обстеження. Відбір статистичних одиниць може бути організований на кшталт випадкової чи систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
- Районована вибірка. У разі неоднорідної генеральної сукупності, перш ніж використовувати ймовірнісну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районованою. Групами районування можуть бути як природні освіти (наприклад, райони міста), і будь-який ознака, закладений основою дослідження. Ознака, на основі якої здійснюється поділ, називається ознакою розшарування та районування.
- «Зручна» вибірка. Процедура «зручної» вибірки полягає у встановленні контактів із «зручними» одиницями вибірки – з групою студентів, спортивною командою, з друзями та сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обґрунтована. «Зручну» вибірку часто використовують із попереднього тестування анкет.
Неймовірні вибірки
Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям – доступності, типовості, рівного представництва тощо.
- Квотна вибірка – вибірка будується як модель, яка відтворює структуру генеральної сукупності як квот (пропорцій) досліджуваних ознак. Число елементів вибірки з різним поєднанням ознак, що вивчаються, визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена 5000 чоловік, з них 2000 жінок та 3000 чоловіків, тоді у квотній вибірці у нас будуть 20 жінок та 30 чоловіків, або 200 жінок та 300 чоловіків. Квотовані вибірки найчастіше ґрунтуються на демографічних умовах: стать, вік, регіон, дохід, освіта та інші. Мінуси: зазвичай такі вибірки нерепрезентативні, т.к. не можна врахувати відразу кілька соціальних параметрів. Плюси: доступний матеріал.
- Спосіб снігового кома. Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо)
- Стихійна вибірка - вибірка так званого "першого зустрічного". Часто використовується в теле- та радіоопитуваннях. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів. Мінуси: неможливо встановити якусь генеральну сукупність представляють опитані, і як наслідок – неможливість визначити репрезентативність.
- Маршрутне опитування часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому опитуватиметься, нумеруються всі вулиці. З допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 – це номер вулиці на карті, 8 – номер будинку, 32 – номер квартири.
- Районована вибірка із відбором типових об'єктів. Якщо після районування кожної групи відбирається типовий об'єкт, тобто. об'єкт, який переважно досліджуваних у дослідженні показників наближається до середніх показників, така вибірка називається районованої з відбором типових об'єктів.
6.Модальна вибірка. 7. Експертна вибірка. 8. Гетерогенна вибірка.
Стратегії побудови груп
Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.
Рандомізація
Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).
Попарний відбір
Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно- та дизиготних), оскільки дозволяє створити...
Стратометричний відбір
Стратометричний відбір- рандомізація із виділенням страт (чи кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що мають певні характеристики (стаття, вік, політичні переваги, освіта, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.
Наближене моделювання
Наближене моделювання- Складання обмежених вибірок та узагальнення висновків про цю вибірку на ширшу популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.
Наближене моделювання – формування моделі, яка чітко обумовленого класу систем (процесів) визначає його поведінка (чи необхідні явища) з прийнятною точністю.
Примітки
Література
Наслідів А. Д.Математичні методи психологічного дослідження. - СПб.: Мова, 2004.
- Ільясов Ф. Н. Репрезентативність результатів опитування у маркетинговому дослідженні // Соціологічні дослідження. 2011. № 3. С. 112-116.
Див. також
- У деяких типах досліджень вибірку ділять на групи:
- експериментальна
- контрольна
- Когорта
Посилання
- Концепція вибірки. Основні характеристики вибірки. Типи вибірки
Wikimedia Foundation. 2010 .
Синоніми:- Щепкін, Михайло Семенович
- Генеральна сукупність
Дивитись що таке "Вибірка" в інших словниках:
вибірка- група піддослідних, які мають певну популяцію і відібраних для експерименту чи дослідження. Протилежне поняття - сукупність генеральна. Вибірка є частиною сукупності генеральної. Словник практичного психолога. М: АСТ, … … Велика психологічна енциклопедія
вибірка- Вибірка Частина генеральної сукупності елементів, що охоплюється спостереженням (часто її називають вибірковою сукупністю, а вибіркою - сам метод вибіркового спостереження). У математичній статистиці прийнято… Довідник технічного перекладача
Вибірка- (sample) 1. Невелика кількість товару, відібрана, щоб представляти всю його кількість. Див: продаж за зразком (sale by sample). 2. Невелика кількість товару, передана потенційним покупцям, щоб дати їм можливість провести його. Словник бізнес-термінів
Вибірка- Частина генеральної сукупності елементів, яка охоплюється спостереженням (часто її називають вибірковою сукупністю, а вибіркою сам метод вибіркового спостереження). У математичній статистиці прийнято принцип випадкового відбору; це… … Економіко-математичний словник
ВИБІРКА- (sample) Довільний відбір підгрупи елементів з основної сукупності, характеристики яких використовуються з метою оцінки всієї сукупності загалом. Вибірковий метод використовується, коли занадто довго чи надто дорого обстежити всю сукупність … Економічний словник