Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
Для того, чтобы вся эта дрянь не попала прямиком в клапан, при уста- новке баллона - держите обойму вертикально, так чтобы горловина баллона была напр...полностью>>
'Документ'
Даны два массива меток, которые находятся на некотором расстоянии друг от друга. Требуется соединить их в один массив. Каретка находится над крайней л...полностью>>
'Урок'
Практика «Пробные уроки и внеклассные занятия в школе» проводится с целью выработки у студентов профессиональных умений и навыков организации и провед...полностью>>
'Тесты'
9.Расчет видеопамяти осуществляется по формуле, где количество цветов в палитре (N), глубина каждой точки (I), количество точек по горизонтали и верти...полностью>>

Главная > Программа

Сохрани ссылку в одной из сетей:
Информация о документе
Дата добавления:
Размер:
Доступные форматы для скачивания:

Важно различать совокупность и основу выборки [1]. Последняя обычно является списком членов совокупно­сти, который используется для формирования выборки. Это может быть список подписчиков журнала, студентов университета и даже географическая карта. Описание основы выборки не обязательно должно включать всех чле­нов совокупности. Возможно, достаточно определить про­цедуру, при помощи которой можно найти любую единицу для включения в выборку.

Формирование списков. Редко встречаются списки, существенно облегчающие формирование простой слу­чайной выборки из целевой совокупности. Если они и были составлены в прошлом, то уже устарели.

Формирование списков для телефонных интервью. При формировании выборок используются телефонные спра­вочники. Проблема в том, что некоторые члены совокупно­сти могут быть упущены из-за смены места жительства, име­ют номер, не занесенный в справочник, или у них вообще нет телефона. Другой подход — покупка списков у журна­лов, компаний, выпускающих кредитные карточки или про­дающих товары по почте. Однако каждом подобному списку свойственны свои искажения,

Отличие совокупности и основы выборки. Если ос­нова выборки не входит в состав совокупности, возника­ют проблемы подмножества, супермножества и пересе­чения.

Проблема подмножества имеет место в случае, если некоторые элементы совокупности не представлены в вы­борке. Чтобы решить проблему подмножества, исследова­телю придется заново определить совокупность в терми­нах основы выборки либо найти другие источники данных.

Проблема супермножества имеет место, если неко­торые элементы выборки не представлены в совокупно­сти. Однако при этом выборка содержит все элементы со­вокупности.

Проблема пересечения имеет место, если некоторые элементы совокупности отсутствуют в основе выборки, а сама основа выборки содержит больше элементов, чем целевая совокупность.

364 т Приложение 2

3. ФОРМИРОВАНИЕ ВЫБОРКИ

Прежде всего нужно сделать выбор между традицион­ной процедурой формирования выборки и байесовским подходом. Далее нужно принять решение о том, будет ли это выборка с замещением или без него. В большинстве случаев используют традиционную процедуру формирова­ния выборки без замещения, поскольку с респондентом не контактируют дважды. Однако в большинстве случаев ситуация сложнее. Вопросов, на которые нужно получить ответы, несколько, а сами ответы сильно различаются между собой. Необходимо сформировать репрезентатив­ную выборку, которая может состоять из сотен единиц. Предпочтительно формировать случайную выборку. Для нее известна вероятность попадания каждого элемента совокупности в выборку. Случайность выборки позволяет исследователю доказать ее репрезентативность. Можно определить погрешность, возникающую из-за того, что вместо сплошного обследования совокупности использу­ется выборка. Случайная выборка позволяет более четко определить возможные искажения.

3.1. Случайные выборки

При формировании случайной выборки следует учесть четыре момента. Во-первых, должна быть известна целе­вая совокупность — группа, информацию о которой нуж­но получить. Во-вторых, должен быть разработан метод отбора элементов выборки. В-третьих, нужно принять ре­шение о размере выборки. Размер выборки будет зависеть от требуемой точности, дисперсии совокупности и затрат, Наконец, в-четвертых, нужно принять меры по решению проблемы неполучения ответа. Для формирования случай­ной выборки можно использовать следующие методы.

Простая случайная выборка — это подход, при ко­тором каждый член совокупности и, следовательно, каж­дая из возможных выборок имеют одинаковую вероятность быть выбранным. Для формирования случайной выборки используются таблицы или генератор случайных чисел.

Компромисс •точность—стоимость*. Компромисс между затратами на процедуру случайной выборки и по­лучаемой в результате точностью лучше всего описывает-

Статистика и выборка * Job

ся термином «эффективность выборки», которая опреде­ляется как соотношение точности и стоимости. Повыше­ния эффективности выборки можно достичь: а) путем сни­жения стоимости при заданной точности; б) путем повы­шения точности при заданной стоимости; в) путем повышения точности более высокими темпами, чем сто­имости; г) уменьшением точности более низкими темпа­ми, чем стоимости. Разные процедуры формирования слу­чайных выборок являются следствиями попыток повыше­ния эффективности выборок указанными путями.

Стратифицированная выборка. Для повышения эф­фективности простой случайной выборки используют ин­формацию о структуре основы выборки. Для этого выявля­ют естественные подгруппы последней, более однородные, чем совокупность в целом. Такие подгруппы называют стра­тами. Точность стратифицированной выборки увеличива­ется, если существуют различия между группами и схо­жесть внутри них по признаку интересующего показателя. Если точность растет более высокими темпами, чем сто­имость, то повышается эффективность выборки. Темпы роста точности и затрат зависят от переменных, используе­мых для распознавания групп, а также от силы связи меж­ду интересующим показателем и этими переменными. Раз­мер выборки из каждой группы зависит от степени разбро­са мнений внутри каждой группы (чем больше будет этот разброс, тем больше выборка). Размер выборки обратно про­порционален стоимости ее формирования (чем ниже сто­имость, тем больше объем выборки). Различия типов стра­тифицированной выборки связаны с техникой определения размера выборки внутри каждой группы.

Пропорциональная стратифицированная выборка предполагает, что число единиц выборки в каждой группе пропорциональна числу элементов этой группы в совокуп­ности.

Обратно пропорциональная стратифицирован­ная выборка. Предположим, что совокупность состоит из 600 потребителей. Из них 200 являются активными по­требителями, а 400 — менее активными. Если исследова­тель ценит мнение активных потребителей больше, то из первой группы в выборку должно попасть больше людей. В подобных случаях можно использовать обратно пропор-

366

Приложение 2

Статистика и выборка

367

циональную стратифицированную выборку. Если требует­ся обеспечить размер выборки из 60 человек, то использу­ется 10 %-я обратно пропорциональная стратифицирован­ная выборка. Вероятность отбора и число представителей каждой страты рассчитывают следующим образом: 1) доля активных пользователей в совокупности: 200/600 = 1 /3; 2) доля менее активных пользователей в совокупности: 400/600 = 2/3; 3) число активных пользователей в выбор­ке из 60 человек: 60-2/3=40; 3) число менее активных пользователей в выборке из 60 человек: 60 х 1/3= 20 {см. табл. 2.!).

Таблица 2.1

Обратно пропорциональная стратифицированная

выборка

Ук

п/п

Тип потребителя

Размер группы

Размер 10 %-й обратно

пропорциональной

страхи ф и ц и ро в а и н ой

выборки

1.

Активные пользователи

200

40

2.

Менее активные пользователи

400

20

Итого

600

60

Непропорциональная стратифицированная вы­борка предполагает, что размеры выборок из каждой груп­пы не пропорциональны ее доле в совокупности. Дело в том, что при сравнении большого числа малых групп, про­порциональная стратифицированная выборка может не обеспечить достаточный для проведения значимого срав­нения размер выборки. В подобных случаях используют непропорциональную стратифицированную выборку. Один из способов определения размеров выборок от каждой группы — принять их равными.

Кластерная выборка предполагает деление на гете­рогенные группы (кластеры), репрезентативные по отно­шению ко всей совокупности, из которых формируется случайная выборка. Эффективность выборки увеличива­ется за счет того, что стоимость уменьшается быстрее точ­ности. Недостаток — трудность формирования кластеров.

Систематическая выборка предполагает системати­ческое распределение выборки по списку членов совокуп­ности. Например, если из совокупности в 10 тыс. человек нужно сформировать выборку из 1 тыс. человек, то в нее входит каждый 10-й. Предположим, что совокупность представлена в виде перенумерованного списка. Включим в выборку случайным образом человека из первой десятки списка. Обозначим его номер в списке через i, U НЮ. После этого в выборку включается каждый iчеловек из второй, третьей и последующих десяток списка. Тогда в систематическую выборку попадут люди, чьи номера в списке равны t, i + Ю, i + 20,..., т. е. с номерами, образую­щими последовательность i + !0п, п = 0,1,2... Подобная процедура может дать выборку, эквивалентную простой случайной выборке. Эффективность систематической вы­борки растет за счет уменьшения стоимости при задан­ной точности. Однако точность зависит от организации списка. Поэтому исследователь должен учесть закономер­ности его составления. Если список организован в слу­чайном порядке, то точность систематической выборки может быть равна точности стратифицированной. Если же элементы отсортированы так, что повышают репрезен­тативность выборки, то точность систематической выбор­ки будет выше точности случайной. Наконец, если среди элементов наблюдается цикличность, то точность будет меньше точности случайной выборки.

Систематическая выборка часто используется в теле­фонных опросах. Из таблицы случайных чисел выбирает­ся значение, например 17. Далее каждое 17-е имя на каж­дой странице телефонного справочника включается в вы­борку. Естественно, если требуется большая выборка, со страницы можно брать более одного имени, если малень­кая — использовать каждую вторую (третью, четвертую) страницу.

3.2. Неслучайные выборки

При использовании неслучайных выборок устраняют­ся проблемы, связанные с разработкой основы выборки, и снижаются издержки. Вместе с тем ухудшается точность результатов исследования. Они могут быть искажены и

368 т

Приложение 2

Статистика и выборка

неоднозначны, и от полученной информации будет боль­ше вреда, чем пользы. От этих проблем не спасает увели­чение размера выборки. Поэтому следует по возможно­сти избегать неслучайных выборок. Тем не менее их мож­но эффективно использовать на поисковой стадии, при предварительном тестировании анкет, при работе с одно­родной совокупностью, для упрощения исследования, если исследователь не знает статистику. Различают че­тыре типа неслучайной выборки: типовая, выборка мето­дом «снежного кома», «удобная» и квотированная.

Типовая выборка предполагает включение в выбор­ку объектов определенного типа. Она используется, если применение случайной выборки либо невозможно 'либо требует больших затрат. Если требуется сформировать маленькую выборку (например, менее 10 элементов), ти­повая выборка, скорее всего, окажется надежнее и' ре­презентативнее случайной. Она используется при выбо­ре восьми-девяти респондентов для проведения фокус-группы 1мы]. В задачах манипулирования сознанием иногда полезно формировать намеренно искаженную вы­борку iMblJ.

Выборка методом снежного кома* предполагает, что каждого респондента просят назвать одного или не­скольких аналогичных специалистов. Она используется для установления контакта с небольшой совокупностью каждый член которой связан между собой по какому-то признаку. Одна из проблем состоит в том, что тот, кто ведет более активный образ жизни, имеет более высокую вероятность попадания в выборку.

Удобная* выборка состоит в том, что контакт уста­навливается с «удобными» единицами выборки. «Удобная» выборка часто используется для предварительного тести­рования анкеты.

Квотированная выборка — это типовая выборка, для которой оговаривается минимальное число представите­лей каждой группы совокупности. Она часто основана на таких демографических характеристиках, как географиче­ское месторасположение, возраст, пол, образование, доход Выборка «соответствует» совокупности по этим демогра­фическим характеристикам. Этот факт придает уверен­ность и позволяет устранить серьезные недостатки, свой-

ственные типовой выборке. Искажения возникнут, если интервьюеры вступают в контакт с теми, кого им проще найти, или если процент отказов составит J5-25 %.

Выборки из Интернета. Поскольку у многих потреби­телей нет доступа в Интернет, считается, что репрезента­тивность онлайновых выборок ограничена. Тем не менее последние могут быть репрезентативны по отношению к той совокупности, из которой они набраны. Репрезентативность зависит от того, какая методика использовалась для их полу­чения. Для активизации респондентов в Интернете исполь­зуют поощрения: лотереи, призы или деньги. Интернет мо­жет быть использован для работы с респондентами, опрос которых другими способами слишком дорог.

3.3. Неполучение ответа

К сожалению, некоторые члены выборки не предостав­ляют ответа, поскольку не могут или отказываются отве­чать, или находятся вне пределов досягаемости. Выборка должна быть достаточно большой, чтобы учесть эту воз­можность. Например, если нужна выборка из I тыс. рес­пондентов, и ожидается процент ответов на уровне 50 %, то придется найти 2 тыс. потенциальных членов выборки. При этом нужно помнить, что ответы тех, кто примет уча­стие в исследовании, могут отличаться от тех, кто ответы не предоставит. Уже сам факт того, что лицо не предо­ставляет ответа, часто означает его существенное отли­чие. Возможные методы решения проблемы неполучения ответа: а) усовершенствовать план исследования, чтобы повысить процент ответов; б) повторить попытку установ­ления контакта (обходы или звонки); в) попытаться оце­нить искажение из-за неполучения ответа.

Совершенствование плана исследования. При лич­ных и телефонных интервью нужно заинтересовать рес­пондента и установить с ним контакт. Этому могут спо­собствовать навыки интервьюера, правильно разработан­ный проект исследования и порядок вопросов. При почтовом опросе необходимо мотивировать респондента поощрениями. Число неполучения ответов из-за отсут­ствия респондента дома можно уменьшить, заранее дого­ворившись о встрече по телефону.

3?0 п

Приложение 2

Повторные попытки используются, если есть увеоен-ность, что они позволят получить существенное число до­полнительных ответов. Они наиболее эффективны пои

по°н1ен:аМмаНКеТИР°ВаНИй' 3 ТЭКЖе П° сношению к рГ пондентам, которых не удалось застать дома. Эффектив­ность увеличится, если проводить их в разное время дня и в разные дни недели. Однако, если ответы не были полу чены из-за отказа или неспособности респондента отв! татовП°ВТОРНЫе П°ПЫТКИ "' ДЗЛУТ ^"^нных резуль-

4. РАЗМЕР ВЫБОРКИ

нпг™3Р ВЫ60РКИ ЗЗВИСИТ °Т ценнос™ и требуемой точ­ности результатов исследования, разбросе значений со-вокупности, числа анализируемых групп и подгрупп иicZ

но исполВь,п°РКИ- ^ СТ°?М0СТЬ ВЫб°Рки ^зкаРУоПравда-но использование большей по объему выборки.

4.1. Приблизительный размер

Если средства на определение размера выборки огра­
ничены (например, бюджетом), или накоплен его опыт то
используют приближенные методы его опыт, то

Эмпирические правила. Сравнение групп позволяет получить полезную информацию. Нужно выявить мини­мальную группу и убедиться в том, что ее размер достато­чен и обеспечивает необходимую надежность. С. Сюд„ан рекомендует такой размер выборки, чтобы ее можно было поделить на группы по J 00 элементов и больше (?) Это -пример эмпирического правила. Кроме того, может потре­боваться сопоставление подгрупг. Поскольку приТто„ требуется меньшая точность, С. Сюдман рекомендует пол группы численностью 20-50 человек, Если однаГгрГп или подгрупп составляет небольшой процент в совокуп тети, то разумно использовать непропорциональную в'ы-

иг£°Л°^виМЫе исслед°ва*и»- Еще один подход -2*LIZ ™* исследоаания н использовать разме­ры их выборок в качестве руководства. Исследования долж­ны быть надежны и сопоставимы по числу групп выборки

Статистика и выборка > 37}

Данные табл. 2.2 основаны на анализе нескольких сот исследований и позволяют составить представление о типичном размере выборки.

Таблица 2.2 Типичные размеры выборок

Индивидуумы или семьи

Организации

Число

подгрупп

Националь­ное

исследова­ние

Региональное

или специальное исследование

Нацио­нальное исследо­вание

Региональное

}1ЛИ

специальное Исследование

Нет/мало

1000-1500

200-500

200-500

50-200

Среднее

1500-2500

500-1000

500-1000

200-500

Много

>2500

>1000

>1000

>500

4.2. Факторы размера

Характеристики совокупности. Первая из них — это среднее совокупности. Другой важной характеристикой совокупности является стандартное отклонение s и дис­персия. Дисперсия совокупности является мерой разбро­са мнений совокупности. Она зависит от того, насколько отдельный ответ разнится от среднего. Эта разница воз­водится в квадрат и усредняется по всем ответам сово­купности.

Характеристики выборки подобны характеристикам совокупности. Одной из характеристик выборки являет­ся выборочное среднее. Оно изменится, если сформиро­вать новую выборку. Среднее используется для оценки не­известного среднего совокупности. Другой характерис­тикой выборки является дисперсия выборки, которая может быть использована для оценки дисперсии совокуп­ности. Дисперсия мала, если ответы представителей вы­борки близки, и велика, если они разбросаны. Еще одной характеристикой выборки является стандартное отклоне­ние Иногда его можно оценить на основе проведенных ранее исследований.

Надежность выборки. Разные выборки дадут разные значения и отклонения. В предельном случае, если разли­чия между элементами совокупности отсутствуют, раз-

372

Приложение 2

броса не будет вообще. Разброс измеряется его стандарт­ной ошибкой Of, определяемой следующим образом:

(2.1)

(Ух -СУ/у/п.

Следовательно, разброс увеличивается с ростом стан­дартного отклонения s. Кроме того, разброс зависит от размера выборки п, падая по мере увеличения последне­го. Причина этого следующая. Если выборка невелика в нее достаточно включить несколько элементов с экстре­мальными значениями для того, чтобы существенно по­влиять на выборочное среднее. По мере увеличения раз­мера выборки, отдельные экстремальные значения оказы­вают меньшее влияние, поскольку усреднение проводится по большему числу элементов,

Пример мнения совокупности представлен графика­ми на рис. 2,2. Переменная X принимает значения от -2 до +2, показанные на горизонтальной оси. По вертикали указан процент респондентов, которые считают, что пе­ременная X принимает данное значение.

Пользуясь рис. 2.2, можно определить выборочное сред­нее X. Предположим, что изменения X от одной выбор­ки к другой следуют нормальному_распределению пред­ставленному на рис. 2.2. Обычно X будет ближе к сред­нему совокупности р. Вероятность того, что X больше р равна вероятности того, что X будет меньше него Верх­ний график на рис. 2.2 показывает, как распределена об­щая площадь под кривой нормального распределения Доля площади под кривой между двумя точками горизон­тальной оси равна вероятности того, что X окажется меж­ду этими двумя точками. Например, из центрального гра­фика видно что 95 % общей площади находятся между точкой р - 2а, и точкой р + х. Следовательно, вероят­ность того, что X будет отклоняться от среднего со­вокупности р не более, чем на 2а ^, равна 0,95.

Аналогично, из нижнего графика видно, что 90 % об­щем площади находятся междуточкой/< - 5щ/3 «точкой р + Ьах /3. Следовательно, вероятность того, что X будет отклоняться от среднего совокупности р не более, чем на ™%/3, равна 0,9.

373

Статистика и выборка



р-2ая р-ох р V + ox p + 20j X

р-(5/3)ах

p-(5/3)os X

Рис. 2.2. Нормальное распределение X

374 Ш Приложение 2

В табл. 2.3 приведены расчеты стандартной ошибки ах при разных размерах выборки по формуле (2.1). Для просто­ты предполагается, что стандартное отклонение совокуп­ности известно. Видно, что по мере увеличения размера выборки, стандартная ошибка о~х уменьшается. Тем самым, распределение X будет меняться, приближаясь к средне­му совокупности при увеличении размера выборки.

Таблица 2.3

Влияние размера выборки на стандартную ошибку

Размер выборки

а

ах = a Nn

10

1,49

0,470

40

1,49

0,235

100

1,49

0.149

500

1,49

0,067

Рис. 2.3 иллюстрирует такое влияние роста размера вы­борки на нормальное распределение Я. На нем показаны дза распределения X — при размерах выборки 10 и 40.

Статистика и выборка

График на рис. 2.3 иногда называют выборочным рас­пределением, поскольку он показывает вероятность полу­чения того или иного значения выборочного среднего Л.

4.3. Интервальные оценки

Выборочное среднее X используется для оценки не­известного среднего совокупности и. Поскольку X меня­ется от выборки к выборке, оно, вообще говоря, не равно последнему. Поэтому целесообразно ввести интервальную оценку/^ среднего совокупности д, определяемую по формуле:

!(р)=Х±а, UM

где а- ошибка выборки. При этом среднее совокупно­сти и находится в интервале от (Х- а) до <Х+ в) с опреде­ленной вероятностью, которую называют доверительной. Размер интервала зависит от требуемого уровня дове-пителъной вероятности. Допустим, нужно обеспечить последнюю на уровне 0,95. В соответствии с центральным графиком рис. 2.2, вероятность того, что X будет■ откло­няться от среднего совокупности р не более, чем на 2р% , равна 0.95. Поэтому 95 %-я интервальная оценка IUMifi) среднего совокупности р. равна:

Un)=X±2a, = X±2a/rn. W

Отсюда следует, что для 95% выборок интервальная оценка Ljp) будет включать среднее совокупности т. Интервале требуемого уровня доверительной вероят-ности (или. кратко, доверительный интервал) находится а пределах otV 2o/tf) Д° № 2а/Гп1 Если разброс значений совокупности невелик, то стандартное откло­нение совокупности о мало, и доверительный интервал мал Кроме того, он сужается с увеличением размеров выборки, поскольку с ростом п уменьшается «ошибка

Допустим, нужно обеспечить уровень доверительной вероятности, равный 0,9. В соответствии с нижним гра­фиком рис 2.2, вероятность того, что X будет отклонять­ся от среднего совокупности и не более, чем на 5os/3.

376 л

Приложение 2

равна 0,9. Поэтому 90 %-я интервальная оценка / (и)
среднего совокупности ц равна: ох

U»(fi) =Х±5<тх/3= Х± Ва/ЬПь (2.4)

Отсюда следует, что около 90 % выборок позволят рас­считать интервальную оценку I0JM), которая будет вклю­чать среднее совокупности //. Следует отметить, что до­верительный интервал от (Х~5а,/3) до (Х+5а,/3) меньше, чем в случае (2.3). Однако теперь меньше уве­ренность в том, что среднее совокупности попадет в этот

Если стандартное отклонение совокупности стнеизвест-no, т0 можно оценить его по стандартному отклонению выборки s. Тогда, заменяя в (2.3) а на s, получаем, что Уо /о-я интервальная оценка /%S5(u) среднего совокупно­сти р по стандартному отклонению выборки s равна:

$м(р) = Х±2ея = X ± 2s/Jn. (2.5)

Далее, заменяя в (2.4) стна s, получаем, что 90%-я интео-вальная оценка Рд$0(т) среднего совокупности * равна:

$*,(&) =Х± 5ах/3 = Х± 5а/ЗГп (2.6)

Как видно из (2.3)-(2.6), интервальная оценка зависит от доверительной вероятности и стандартного отклоне­ния совокупности или выборки и размера последней Если разброс значений совокупности невелик, то стандартное отклонение совокупности а и выборки s мало, и довери­тельный интервал невелик. Кроме того, он сужается с уве­личением размеров выборки, поскольку с ростом п умень­шается ее ошибка.

4.4, Оценки размера выборки

Оценки размера выборки зависят от допустимой ошиб­ки выборки а. стандартного отклонение совокупности s или выборки а. и доверительной вероятности. Значения этих параметров зависят от компромисса между ценно­стью более точной информации и стоимостью увеличения размера выборки. Для данного уровня надежности мень­шая ошибка выборки будет стоить увеличения ее размера

Статистика и выборка * 377

При неизменной ошибке выборки, более высокая надеж­ность потребует увеличения размера выборки. Как видно из (2.2)-(2.4), ошибку выборки аможно представить в виде:

а=га/4п, (2.7)

где z — коэффициент, зависящий от требуемого уровня доверительной вероятности: г- 2 — при уровне 0,95, г = = 5/3 — при уровне 0,95. Из (2.7) можно получить выраже­ние для размера выборки:

n = zW/a3. (2.8)

Таким образом, если заданы доверительная вероятность (и следовательно, г) и ошибка выборки а, а также извест­но стандартное отклонение s, то по формуле (2.8) можно определить ее необходимый размер.

Пример. Предположим, что нужно обеспечить 95%-й уровень доверительной вероятности, при известном стан­дартном отклонении с = 1,49. Сравнивая (2.2), (2.3) и (2,7), получаем, что г=2. Далее, ошибка выборки а = 0,3. В дан­ном случае размер выборки, определяемый по (2.8), равен

n = z*l=? х 1.4?/00 -99.

Если нужно обеспечить 90%-й уровень доверительной вероятности, то размер выборки можно уменьшить. Учи­тывая, что г = 5/3, размер выборки, определяемый по (2.8), равен

л = /cH/cz2 = (5/3? х l,4tf№fl$ = 69.

Если увеличить допустимую ошибку выборки а, то раз­мер выборки также уменьшится.

Коэффициент вариации. Представим ошибку выбор­ки а в виде:

а = 8и, (2.9)

где 5— требуемая точность, характеризующая ошибку выборки по отношению к среднему совокупности р, О В этом случае можно переформулировать задачу определения интервальной оценки. А именно, можно по­требовать, чтобы выборочное среднее не отклонялось от среднего совокупности и более чем на ЮОд процентов, при некотором уровне доверительной вероятности. Учитывая

378%

Приложение 2

(2.9), формулу для размера выборки (2.8) можно записать в виде

* = zV/Sy=zW, (2.10)

Рис. 2.4. Вычисление размера выборки


где с = 5/fi — коэффициент вариации совокупности. Таким образом, задав требуемую доверительную веро­ятности и точность 8, можно вычислить размер выборки по коэффициенту вариации, пользуясь формулой (2.10). Оп­ределение размера выборки п при доверительной вероят­ности в 0,90 и 0,95 иллюстрирует рис. 2.4.

Статистика и выборка * 379

Репрезентативные вопросы. Опрос обычно не огра­ничивается одним вопросом — иногда их сотни. Поэтому определять размер выборки для каждого вопроса нет смыс­ла. Разумный подход — выбрать несколько репрезента­тивных вопросов и по ним определить размер выборки. В этот набор следует включить вопросы с максимальным уровнем ожидаемой дисперсии.

Последовательная выборка. Иногда целесообраз­но взять небольшую выборку, посмотреть результаты. после чего решить, требуется ли более подробная инфор­мация от большей выборки. Вместе две выборки позво­лят получить меньший интервал оценки. Если же послед­ний все равно окажется слишком большим, то размер выборки может быть увеличен еще раз. Конечно, такой метод может привести к увеличению затрат и задержке решения.

ВЫВОДЫ

  1. Методы оценки параметров совокупности — сплош­ное обследование и выборка с оценкой параметров ее подмножества.

  2. Для формирования выборки нужно определить целе­вую совокупность, основу и единицы выборки.

  3. Случайные выборки (стратифицированные, кластерные, систематические и др.) основаны на использовании тео­рии вероятности, В некоторых ситуациях допустимо ис­пользование неслучайных выборок (таких как типовая выборка, выборка по методу «снежного кома», квотиро­ванная выборка).

  4. Для оценки характеристик совокупности используют­ся статистические характеристики выборки (среднее, дисперсия, стандартное отклонение).

  5. Интервальные оценки основаны на статистике выбор­ки и отражают ее среднее, стандартное отклонение, а также выбранный уровень доверительной вероятности.

  6. Размер выборки оценивается на основе желаемого уровня доверительной вероятности, допустимой ошиб­ки и дисперсии. Задав требуемую доверительную ве­роятность и точность, можно оценить размер выборки по коэффициенту вариации.



Похожие документы:

  1. Может быть использована специалистами предприятий. Книга выпущена в свет в рамках межиздательского проекта "Учебник для XXI века"

    Учебник
    ... Оперативный (ситуационный) анализ проводится ... факторов в анализе хозяйственной деятельности Значение классификации факторов.Основные типы факторов. Понятие и отличие различных типов факторов в АХД. Классификация факторов ... 45( ... этапе, тем ... 46, 47, 48 ...
  2. Управление взаимодействием этих элементов и процессов наиболее трудная, но вместе с тем и определяющая задача в системе организации управления качеством медицинской помощи

    Документ
    ... связи с тем, что изначально ... здравоохранением и различных типов медицинских учреждений, ... являются существенными факторами на начальном этапе работы, ... равен 41–45 годам. В ... анализ актов экспертиз 47 случаев ... качества. Ситуационный анализ обеспечения уровня ...
  3. 1. Введение в анализ хозяйственной деятельности (ахд) Понятие об ахд и история его развития

    Документ
    ... анализа – пропорционального выделения или долевого участия. Тема 4. Методика факторного анализа Понятие и типы факторного анализа. Классификация факторов ...
  4. Методика swot-анализа 24 Матрица swot 24

    Документ
    ... 45 Диверсификация 45 Интеграция 45 Совместное развитие и стратегические альянсы 45 13. Уровни стратегического управления 47 ... Анализ конкурентного окружения, факторы конкуренции Структурный анализ конкурентного окружения начинается с определения типа ...
  5. Краткий курс лекций для студентов заочного отделения 2009г

    Документ
    ... оперативный (ситуационный) анализ – ... 0,47 0,34 ... пр.  Д = 4,45  27,5  245 ... , тем быстрее ... мультипликативного типа, анализ ведем ... этап. Анализ трудоемкости продукции Снижение трудоемкости – важнейший фактор роста производительности труда. Анализ ...

Другие похожие документы..