Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Методические указания и решение типовых задач




 

Тема «Выборочное наблюдение» является одной из централь­ных в курсе теории статистики. Это обусловлено прежде всего взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателя­ми, таблицами, графиками и др. Основываясь на фундаменталь­ных теоретических положениях, в частности, предельных тео­ремах закона больших чисел (Чебышева-Ляпунова, Бернулли и др.), выборочное наблюдение тесно связано с курсами матема­тической статистики и теории вероятностей. Поэтому освоение теоретического материала, умение правильно решить практи­ческие задачи по данной теме, грамотно интерпретировать полученные результаты служат необходимым условием успеш­ного изучения курса теории статистики в целом и связанных с ней наук.

Формирование набора задач данной главы обусловлено практическими вопросами, требующими своего решения при организации выборочного наблюдения и анализе его резуль­татов. Такими вопросами являются определение способа от­бора и процедуры выборки, вычисление ошибок выборки и построение доверительных интервалов выборочных характе­ристик, а также расчет необходимого объема выборки. Пред­ложенные в данной теме задания охватывают все эти вопросы с учетом особенностей формирования выборочной совокупно­сти.

Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентатив­ность (представительность) выборочной совокупности. Различа­ет среднюю и предельную ошибки выборки. Эти два вида оши­бок связаны следующим соотношением:

Δ = tμ,

где Δ – предельная ошибка выборки;

μ – средняя ошибка выборки;

t – коэффициент доверия, определяемый в зависимости от уровня веро­ятности (некоторые значения t приведены в приложении).

Величина средней ошибки выборки рассчитывается дифференцирование в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле

,

при бесповторном: ,

где σ2 – выборочная (или генеральная) дисперсия;

σ – выборочное (или генеральное) среднее квадратическое отклонение;

n – объем выборочной совокупности;

N – объем генеральной совокупности.

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для вы­борочной средней такие пределы устанавливаются на основе следующих соотношений:

,

где и – генеральная и выборочная средние соответственно;

– предельная ошибка выборочной средней.

Покажем практическое применение рассмотренной выше методики на следующих примерах.

Задача 1.При проверке веса импортируемого груза на та­можне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г при среднем квадратическом отклонении 4 г. С вероятнос­тью 0,997 определите пределы, в которых находится средний вес изделий в генеральной совокупности.

Решение. Рассчитаем сначала предельную ошибку выборки. Так, при р = 0,997, t =3

.

Определим пределы генеральной средней:

30 – 0,84 ≤ ≤ 30 + 0,84, или 29,16 ≤ ≤ 30,84.

Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 до 30,84 г.

Задача 2. В городе проживает 250 тыс. семей. Для определе­ния среднего числа детей в семье была организована 2%-ная случайная бесповторная выборка семей. По ее результатам было получено следующее распределение семей по числу детей:

Число детей в семье
Количество семей

 

С вероятностью 0,954 найдите пределы, в которых будет находиться среднее число детей в генеральной совокупности.

Решение. Вначале на основе имеющегося распределения се­мей определим выборочные среднюю и дисперсию:

Число детей в семье хi Количество семей fi xifi xi -
-1,5 2,25
-0,5 0,25
0,5 0,25
1,5 2,25
2,5 6,25
3,5 12,25
Итого - -

 

Вычислим теперь предельную ошибку выборки (с учетом того, что р = 0,954 t =2).

.

Следовательно, пределы генеральной средней:

.

Таким образом, с вероятностью 0,954 можно утверждать, что среднее число детей в семьях города практически не отличается от 1,5, т. е. в среднем на каждые две семьи приходятся три ребенка.

Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчета связаны с определением дисперсии доли, которая вычисляется так:

,

где – доля единиц, обладающих данным признаком в выборочной совокупности, определяемая как отношение количества соответ­ствующих единиц к объему выборки.

Тогда, например, при собственно-случайном повторном от­боре для определения предельной ошибки выборки использует­ся следующая формула:

.

Соответственно при бесповторном отборе

Пределы доли признака в генеральной совокупности р выг­лядят следующим образом:

w – ΔW ≤ p ≤ w +ΔW.

Задача 3.С целью определения средней фактической про­должительности рабочего дня в государственном учреждении с численностью служащих 480 человек в июне 1996 г. была про­ведена 25%-ная механическая выборка. По результатам наблю­дения оказалось, что у 10% обследованных потери времени до­стигали более 45 мин. в день. С вероятностью 0,683 установите пределы, в которых находится генеральная доля служащих с потерями рабочего времени более 45 мин в день.

Решение. Определим объем выборочной совокупности:

n = 480 · 0,25 = 120 человек.

Выборочная доля w равна по условию 10%. Учитывая, что показатели точности механической и собственно-случайной бес­повторной выборки определяются одинаково, а также то, что при р = 0,683 t = 1, вычислим предельную ошибку выборочной доли:

.

Пределы доли признака в генеральной совокупности:

10 – 2,4 ≤ р ≤ 10 + 2,4, или 7,6 ≤ р ≤ 12,4.

Таким образом, с вероятностью 0,683 можно утверждать, что доля работников учреждения с потерями рабочего времени бо­лее 45 мин. в день находится в пределах от 7,6 до 12,4 %.

Ошибки и пределы генеральных характеристик при других способах формирования выборочной совокупности определяют­ся на основе соответствующих формул, отражающих особенно­сти этих видов выборки. Например, в случае типической выбор­ки показателем вариации является средняя из внутригрупповых дисперсий , при серийной выборке – межгрупповая (межсе­рийная) дисперсия δ2 и т.д. Кроме того, в последнем случае вместо объема выборочной совокупности n используется показа­тель числа серий r.

Следовательно, для типической выборки средняя ошибкавычисляется по формулам:

- при отборе, пропорциональном объему типических групп:

(повторный отбор);

(бесповторный отбор);

- при отборе, пропорциональном вариации признака (не про­порциональных объему групп):

(повторный отбор);

(бесповторный отбор),

где Ni и ni – объемы i-й типической группы и выборки из нее соответственно;

– групповые дисперсии.

При серийной выборке средняя ошибкаопределяется сле­дующим образом:

(повторный отбор);

(бесповторный отбор),

где R – число серий в генеральной совокупности;

– межгрупповая (межсерийная) дисперсия;

r – число серий в выборочной совокупности.

Задача 4. В области, состоящей из 20 районов, проводилось выборочное обследование урожайности на основе отбора серий (районов). Выборочные средние по районам составили соответ­ственно 14,5 ц/га; 16; 15,5; 15 и 14 ц/га. С вероятностью 0,954 найдите пределы урожайности во всей области.

Решение. Рассчитаем общую среднюю:

.

Межгрупповая (межсерийная) дисперсия

Определим теперь предельную ошибку серийной бесповтор­ной выборки (t = 2, р = 0,954):

.

Следовательно, урожайность в области с вероятностью 0,954 будет находиться в пределах:

15 – 1,7 ≤ ≤ 15 + 1,7, или 13,3 ц/га ≤ ≤ 16,7 ц/га.

Формулы необходимого объема выборки для различных спо­собов формирования выборочной совокупности могут быть выведены из соответствующих соотношений, используемых при расчете предельных ошибок выборки.

Приведем наиболее часто применяемые на практике выраже­ния необходимого объема выборки:

- собственно-случайная и механическая выборка:

(повторный отбор);

(бесповторный отбор);

- типическая выборка:

(повторный отбор);

(бесповторный отбор);

- серийная выборка:

(повторный отбор);

(бесповторный отбор).

При этом в зависимости от целей исследования дисперсии и ошибки выборки могут быть рассчитаны для средней величины или доли признака.

Рассмотрим примеры определения необходимого объема выборки для различных способов формирования выборочной совокупности.

Задача 5. В 100 туристических агентствах города предпола­гается провести обследование среднемесячного количества реа­лизованных путевок методом механического отбора. Какова дол­жна быть численность выборки, чтобы с вероятностью 0,683 ошибка не превышала 3 путевок, если по данным пробного обследования дисперсия составляет 225?

Решение. Рассчитаем необходимый объем выборки:

.

Задача 6.С целью определения доли сотрудников коммер­ческих банков области в возрасте старше 40 лет предполага­ется организовать типическую выборку пропорционально чис­ленности сотрудников мужского и женского пола с механи­ческим отбором внутри групп. Общее число сотрудников бан­ков составляет 12 тыс. человек, в том числе 7 тыс. мужчин и 5 тыс. женщин.

На основании предыдущих обследований известно, что сред­няя из внутригрупповых дисперсий составляет 1600. Определите необходимый объем выборки при вероятности 0,997 и ошибке 5%.

Решение. Рассчитаем общую численность типической вы­борки:

Вычислим объем отдельных типических групп:

;

.

Таким образом, необходимый объем выборочной совокупно­сти сотрудников коммерческих банков составляет 550 человек, в том числе 319 мужчин и 231 женщина.

Задача 7. В акционерном обществе 200 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного веса рабочих, имеющих профессиональ­ные заболевания. Известно, что межсерийная дисперсия доли равна 225. С вероятностью 0,954 рассчитайте необходимое коли­чество бригад для обследования рабочих, если ошибка выборки не должна превышать 5%.

Решение. Рассчитаем необходимое количество бригад на основе формулы объема серийной бесповторной выборки:

.

 







Дата добавления: 2014-11-10; просмотров: 4901. Нарушение авторских прав

codlug.info - Студопедия - 2014-2017 год . (0.008 сек.) русская версия | украинская версия