Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
1-й тип. Пропорциональный или П-регулятор с одним параметром настройки. Его передаточная функция совпадает с передаточной функцией пропорционального т...полностью>>
'Руководство'
В книге говорится об искусстве целительства посредством физических и метафизи­ческих методов, описываются энергетические и кармические причины заболев...полностью>>
'Документ'
Место работы (полное наименование общеобразовательного учреждения в соответствии с Уставом), МБОУ «Средняя общеобразовательная школа №4» г. Приозерска...полностью>>
'Документ'
Извещаем Вас, что в соответствии с Правилами листинга Закрытого акционерного общества Фондовая биржа ММВБ , утвержденными Советом директоров ЗАО ФБ ММ...полностью>>

Главная > Документ

Сохрани ссылку в одной из сетей:
Информация о документе
Дата добавления:
Размер:
Доступные форматы для скачивания:

3.4. Структурные средние

К структурным средним величинам в статистике относят моду, медиану и квартили, квинтили, децили, перцентили.

Медиана – это значение признака, находящийся в середине ранжированной (упорядоченной по возрастанию или убыванию) совокупности. Медиана делит изучаемую совокупность на две равные части – у половины единиц совокупности значение признака меньше медианы, а у другой половины единиц совокупности значение признака больше медианы.

Медиана является центром распределения. Основное свойство медианы заключается в том, что сумма абсолютных отклонений фактических значений от медианы меньше, чем от любой другой величины:

,

где - i-тый вариант признака,

- значение медианы.

Медиана может быть определена для количественных и порядковых признаков. Расчет медианы для альтернативных и атрибутивных признаков невозможен, так как эти признаки нельзя ранжировать.

Порядок расчета медианы:

1. расположить данные в порядке возрастания (или убывания) значений признака;

2 определить номер медианной единицы

, (3.13)

где - номер медианной единицы,

n –число единиц совокупности;

3. определить медиану, т.е. значение признака соответствующее номеру медианной единицы.

Расчет медианы зависит от:

- характера исходных данных, а именно, от четного или нечетного числа единиц совокупности;

- от вида признака (количественный или порядковый);

- формы представления исходных данных (не сгруппированные данные, дискретный ряд распределения, интервальный ряд распределения).

Медиана количественного признака для интервального ряда распределения определяется по формуле:

, (3.14)

где - нижняя граница медианного интервала;

i –величина интервала;

- накопленная частота интервала, предшествующего медианному;

- частота медианного интервала;

- число единиц совокупности.

Медианным является интервал, первая накопленная частота которого превышает половину объема совокупности.

Мода – значение признака, наиболее часто встречающееся в совокупности.

Расчет моды для несгруппированных данных состоит в определении наиболее часто встречающегося значения. Если два и более варианта признака встречаются чаще остальных, то будет соответственно несколько модальных значений.

Расчет моды для дискретного ряда распределения состоит в определении признака имеющего наибольшую частоту.

Моду для интервального ряда распределения определяют по формуле:

, (3.15)

где - нижняя граница модального интервала;

i –величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

Модальным называется интервал с наибольшей частотой.

Расчет моды для порядковых и атрибутивных признаков не представляет сложности с математической точки зрения и состоит в определении значения признака, которое встречается чаще остальных.

Средняя, медиана и мода характеризуют типичное значение признака в изучаемой совокупности. Вместе с тем каждый из перечисленных показателей имеет свою экономическую интерпретацию и особенности применения. Использование перечисленных показателей зависит от вида признака и характера распределения.

В анализе распределений порядковых признаков используют медиану и моду. Порядковые данные не имеют среднего значения. Типичное значение порядкового признака может быть выражено с помощью медианы и моды. При этом медиана отражает значение признака наиболее близкого ко всем единицам совокупности, а мода, характеризует наиболее распространение значение признака.

В
анализе распределений количественных признаков для однородной совокупности обычно рассчитывают все три показателя. При этом соотношение значений средней, медианы и моды позволяют судить о характере распределения. Если данные

Рис. 3.1.Симметричное распределение

распределены симметрично, то значения средней медианы и моды совпадают (рис. 3.1.) Если распределение характеризуется ассиметрией, то значения средней и медианы отличаются. В распределениях с левосторонней ассиметрией значение средней меньше значений медианы и моды. В распределениях с правосторонней ассиметрией значение средней больше значений медианы и моды (рис. 3.2)

Рис. 3.2. Правосторонняя ассиметрия

Аномальные значения (значения существенно отличающиеся от других) не влияют на расчет медианы, но могут оказать существенное влияние на среднее значение признака. Поэтому, медиана является наиболее предпочтительной, по сравнению со средней величиной, характеристикой типичного уровня признака неоднородных совокупностей.

Квартили – это значения признака в упорядоченной совокупности, которые делят совокупность на четыре равные части. Первая или нижняя квартиль () характеризует значение признака, меньше которого расположено 25% единиц совокупности, а больше – 75%. Вторая квартиль соответствует медиане (), т.е. у 50% единиц совокупности значение признака меньше второй квартили, а у 50% - больше. Третья или верхняя квартиль () характеризует значение признака, меньше которого расположено 75% единиц совокупности, а больше – 25%.

Квинтили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на пять равных частей. Первая или нижняя квинтиль () характеризует значение признака, меньше которого расположено 20% единиц совокупности, а больше – 80%. Четвертая или верхняя квинтиль () характеризует значение признака, меньше которого расположено 80% единиц совокупности, а больше – 20%.

Децили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на десять равных частей. Первая или нижняя дециль () характеризует значение признака, меньше которого расположено 10% единиц совокупности, а больше – 90%. Девятая или верхняя дециль () характеризует значение признака, меньше которого расположено 90% единиц совокупности, а больше – 10%.

Перцентили – это значения признака в упорядоченной по возрастанию совокупности, которые делят совокупность на сто равных частей.

Глава 4. Показатели вариации в анализе социально-экономических явлений и процессов

4.1. Основные показатели вариации

Вариация значений признака представляет наибольший интерес при исследовании социально-экономических явлений и процессов.

Используемые в статистическом анализе показатели вариации можно разделить на три группы:

  • показатели размаха;

  • показатели, характеризующие отклонения от среднего уровня;

  • относительные показатели вариации.

К показателям размаха относят:

- вариационный размах;

- децильный размах;

- квартильный размах.

К показателям, характеризующим отклонения от среднего уровня, относят:

- среднее линейное отклонение;

- среднее квадратическое отклонение;

- дисперсию.

К относительным показателям относят:

- относительный квартильный размах;

- линейный коэффициент вариации;

- коэффициент вариации.

Вариационный размах или размах вариации характеризует абсолютную разницу между максимальным и минимальным значениями признака в изучаемой совокупности:

(4.1)

Основным недостатком данного показателя является то обстоятельство, что максимальные и минимальные значения признака могут быть обусловлены случайными обстоятельствами и в этой связи могут искажать типичный для изучаемой совокупности размах вариации.

Децильный размах (D) характеризует абсолютную разницу между значениями девятой (верхней) и первой (нижней) децилями:

(4.2)

Таким образом, децильный размах характеризует разброс 80% данных и, является более предпочтительным по сравнению с вариационным размахом, так как практически не зависит от экстремальных значений.

Квартильный размах или интерквартильный разбрас (interquartile rang - IQR) характеризует абсолютную разницу между третьим (верхним) и первым (нижним) квартилями:

(4.3)

Третья или верхняя квартиль (Q3) показывает значение признака больше которого расположено 25% значений. Таким образом квартильный размах характеризует разброс 50% центральных значений.

Среди показателей разброса наиболее часто в практическом анализе используют квартильный размах.

Показатели разброса графически можно представить в виде секционной диаграммы (boxplot). В секционной диаграмме пунктирная линия представляет медиану, прямоугольник характеризует квартильный разброс, а вертикальные линии, выходящие из прямоугольника (их часто называют «усами»), характеризуют границы разброса. Если в данных нет аномальных значений, то «усы» соответствуют минимальному и максимальному значениям признака. Обычно к аномальным значениям относят данные, отклонения которых от нижнего и верхнего квартиля больше чем в 1,5 раза превышают квартильный разброс. Если такие данные существуют, то они показываются в виде отдельных точек. В этом случае «усы» принимаются равными

нижний: (4.4)

верхний: (4.5)

Среднее линейное отклонение. Для абсолютной количественной оценки различий между всеми без исключения значениями признака в изучаемой совокупности используется оценка отклонений фактических значений от их среднего уровня. Чем больше различия между вариантами признака, тем больше и их отклонения от среднего уровня. Однако, как отмечалось в главе «Средние показатели», сумма отклонений фактических значений от средней всегда равна 0. Существует два основных подхода к усреднению отклонений фактических значений от средней. Первый состоит в том, что используют абсолютные значения отклонений и в результате получают показатель который называется среднее линейное отклонение. Второй состоит в том, что отклонения возводят в квадрат и в результате получают дисперсию и среднее квадратическое отклонение.

Среднее линейное или среднее абсолютное отклонение (mean absolute deviation – ) представляет собой среднее арифметическое из абсолютных значений отклонений фактических вариантов признака от среднего значения. В зависимости от характера исходных данных для расчета используют простую или взвешенную форму:

- простая форма; (4.6)

- взвешенная форма, (4.7)

Если данные не сгруппированы, то используют простую формулу, если сгруппированы – то взвешенную.

Дисперсия (variance) представляет собой средний квадрат отклонений значений признака от средней величины.

В зависимости от характера исходных данных для расчета используют простую или взвешенную формулу:

- простая форма; (4.8)

- взвешенная форма, (4.9)

Для расчета дисперсии в отдельных случаях удобнее использовать формулу, которая представляет собой алгебраическое преобразование выражений (4.8) и (4.9):

, где (4.10)

- средняя квадратическая.

В зависимости от характера исходных данных для расчета средней квадратической используются простая или взвешенная формы:

- простая, (4.11)

- взвешенная. (4.12)

Если данные не сгруппированы, то используют простую форму, если сгруппированы – то взвешенную.

Возведение отклонений фактических значений от средней в квадрат приводит к тому, что дисперсия имеет тоже наименования, что и изучаемый признак, но возведенное в квадрат. Это затрудняет экономическую интерпретацию полученных результатов. Поэтому наиболее удобным и широко распространенным на практике показателем вариации является среднее квадратическое отклонение, которое определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Среднее квадратическое отклонение характеризует среднее отклонение фактических значений признака в статистической совокупности от их среднего значения и рассчитывается на основе следующих формул:

- простая форма, (4.13)

- взвешенная форма (4.14)

(4.15)

Среднее квадратическое отклонение также называют стандартным отклонением (standard deviation).

Среднее квадратическое отклонение и среднее линейное отклонение близки друг другу по экономическому смыслу и между ними есть определенная связь. Для симметричных или умеренно ассиметричных распределений .

Среднее квадратическое отклонение более широко применяется в статистическом анализе по сравнению со средним линейным отклонением благодаря своим математических свойствам. Так среднее квадратическое отклонение является одним из параметров многих распределений и в первую очередь нормального распределения. В нормальном распределении примерно 2/3 всех значений отклоняются от среднего уровня не больше, чем на одну величину среднего квадратического отклонения. Приблизительно 95% всех значений отклоняются от среднего уровня не более чем на две величины среднего квадратического отклонения. И, наконец, около 99,7% всех значений лежат в пределах трех средних квадратических отклонений.

Коэффициенты вариации. Рассмотренные выше показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. Чтобы оценить масштабы вариации используют относительные показатели вариации, которые измеряют изменчивость значений признака в относительном выражении по сравнению со средним уровнем, что во многих случаях является более предпочтительным. Для оценки относительных размеров вариации используют линейный коэффициент вариации и квадратический коэффициент вариации. Последний показатель получил более широкое распространение, поэтому его обычно называют коэффициент вариации, опуская слово квадратический. Относительные показатели вариации, как правило, рассчитывают в процентах.

Линейный коэффициент вариации измеряют через соотношение среднего линейного отклонения и средней:

(4.16)

Коэффициент вариации измеряют через соотношение среднего квадратического отклонения и средней:

(4.17)

Информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. При этом показатели, рассчитанные по одной совокупности, сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени. Например, исследуется динамика вариации курса доллара по годам или по месяцам или сравнивается вариация показателей компаний различных отраслей или регионов.

4.2 Показатели вариации в анализе взаимосвязей

Показатели вариации могут быть использованы не только в анализе колеблемости изучаемого признака, но и для оценки степени влияния одного признака на вариацию другого признака, т.е. в анализе взаимосвязей между показателями.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками - факторным и результативным.

Для выявления взаимосвязи исходная совокупность делится на две или более группы по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:

(4.18)

где - общая дисперсия;

- средняя из внутригрупповых дисперсий;

- межгрупповая дисперсия.

Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием признака факторного. Это воздействие проявляется в отклонении групповых средних от общей средней:

(4.19)

где - среднее значение результативного признака по i-ой группе;

- общая средняя по совокупности в целом;

- объем (численность) i-ой группы.

Если факторный признак, по которому производилась группировка, не оказывает никакого влияния не признак результативный, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая дисперсия будет равна нулю.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:

(4.20)

где -дисперсия результативного признака в i-ой группе;

-объем (численность) i-ой группы.

Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:

(4.21)

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.



Похожие документы:

  1. Ответы к экзамену по статистике Предмет и метод статистики. Ее связь с другими науками

    Ответы к экзамену
    ... (группировку и сводку); Анализ результатов. К основным методам относятся: Диалектический метод (явления рассматриваются в развитии); Метод статистических группировок (позволяет ...
  2. Рабочая программа учебной дисциплины статистика (название дисциплины)

    Рабочая программа
    ... . Виды статистического наблюдения и способы его проведения. Статистическая сводка, ее задачи и значение. Организация сводки. Группировка как научная основа сводки, ее задачи и виды. Виды группировок, их задачи ...
  3. Учебно-методическое пособие Рекомендовано методической комиссией финансового факультета для студентов высших учебных заведений экономических специальностей Нижний Новгород

    Учебно-методическое пособие
    ... . Статистическая инструкция, ее назначение и содержание. Статистические сводки и группировки как второй этап статистического исследования. Понятие о сводке, ее назначение и задачи. Виды сводок ...
  4. Задачи дисциплины (8)

    Документ
    ... науки, ее место в системе общественных наук. Преломление черт диалектического метода в ... системы сбора и обработки информации. Тема 1.3. Сводка и группировка статистических данных Понятие, содержание и задачи сводки. Этапы сводки. Особенности сводки ...
  5. Руководство по переходу системы здравоохранения к работе с международной классификацией

    Руководство
    ... и сводки первичных ... и содержания его приема ... его написания и шифровки для статистических разработок, приемы представления статистических данных и стандарты группировок ... ее ... метод его ... задача ... система оценки этих обстоятельств во времени, месте, видах ...

Другие похожие документы..