Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
предоставления технических условий, условий подключения и порядка присоединения объектов капитального строительства к сетям водоснабжения и водоотведе...полностью>>
'Документ'
Для заданного процесса (см. свой вариант Таблицы 1) рассчитайте rH0298, rS0298, rG0298(двумя способами) и сделайте вывод по полученным значениям. О...полностью>>
'Документ'
пп. г) п.9 Стандартов раскрытия информации, а именно: предложение о размере цен(тарифов), долгосрочных параметров регулирования (при применении метода...полностью>>
'Документ'
1.1. ООО «Девиль» при осуществлении своей деятельности уделяет приоритетное внимание вопросам обеспечения информационной безопасности. В ООО «Девиль» ...полностью>>

Главная > Документ

Сохрани ссылку в одной из сетей:
Информация о документе
Дата добавления:
Размер:
Доступные форматы для скачивания:

Глава 5. Статистическое изучение взаимосвязи социально-экономических явлений

5.1. Причинность, регрессия, корреляция

Исследование объективно существующих связей между социально-экономическими явлениями и процессами является важнейшей задачей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения - это такая связь явлений и процессов, когда изменение одного из них - причины ведет к изменению другого - следствия.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

Статистическое изучение связи включает следующие этапы:

  • Качественный анализ, связанный с анализом природы социального или экономического явления методами экономической теории, социологии, конкретной экономики;

  • Построение модели связи. Реализация данного этапа базируется на методах статистики: группировках, средних величинах, и т.д.

  • Интерпретация результатов. Данный этап связан с качественными особенностями изучаемого явления.

Статистика разработала множество методов изучения связей. Выбор метода изучения связи зависит от познавательной цели и задач исследования.

Признаки по их сущности и значению для изучения взаимосвязи делятся на факторные и результативные. Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными, или просто факторами. Признаки, изменяющиеся под действием факторных признаков, называются результативными.

В статистике различают функциональную и стохастическую зависимости. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака.

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению.

По степени тесноты связи различают (табл.5.1):

Таблица 5.1

Количественные критерии оценки тесноты связи

Величина показателя связи

Характер связи

До 0,3

практически отсутствует

0,3 - 0,5

слабая

0,5 - 0,7

умеренная

0,7 - 1,0

сильная

По направлению выделяют связь прямую и обратную. Прямая - это связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака. Обратная – это связь, при которой с увеличением или с уменьшением значений одного признака происходит уменьшение или увеличение значений другого признака.

По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида:

(5.1)

Если же связь может быть выражена уравнением какой-либо кривой линии, то такую связь называют нелинейной или криволинейной, например:

параболы - (5.2)

гиперболы -; и т.д., то такую связь называют нелинейной или криволинейной.

Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных; графический; аналитических группировок; корреляции, регрессии.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группир

оваться точки вокруг определенной линии, выражающей форму связи.

Рис. 5.1. График корреляционного поля

Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

В статистике принято различать следующие варианты зависимостей:

  1. Парная корреляция - связь между двумя признаками (результативным и факторным, или двумя факторными).

  2. Частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

  3. Множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.

Регрессия тесно связана с корреляцией и позволяет исследовать аналитическое выражение взаимосвязи между признаками.

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).

Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии должны соблюдаться следующие требования:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (числовое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.

6. Отсутствие количественных ограничений на параметры модели связи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные социально-экономические явления и процессы.

5.2. Парная регрессия

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.

Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (a0, a1, и a2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (a0 , a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

S = (-)min

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

(5.3)

где n - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.

5.3. Множественная (многофакторная) регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:

Построение моделей множественной регрессии включает несколько этапов:

  1. Выбор формы связи (уравнения регрессии);

  2. Отбор факторных признаков;

  3. Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных математико-статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в реализации алгоритмов последовательного “включения”, “исключения” или “включения-исключения” факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм “включения” заключается в том, что факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, на сколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и алгоритм последовательного «исключения», сущность которого заключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.

Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель .

Наличие мультиколлинеарности между признаками приводит к:

  • искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;

  • изменению смысла экономической интерпретации коэффициентов регрессии.

В качестве причин возникновения мультиколлинеарности между признаками, можно выделить следующие:

  • Изучаемые факторные признаки являются характеристикой одной и той же стороны изучаемого явления или процесса.

  • Факторные признаки являются составляющими элементами друг друга.

  • Факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании качественного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (y) c каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

Аналитическая форма связи результативного признака от нескольких факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.

Линейное уравнение множественной регрессии имеет вид:

где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

- факторные признаки;

- параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и так далее.

5.4. Параметрические методы изучения связи

Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных зависимостей) факторных признаков.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

В теории разработаны и на практике применяются различные модификации формулы расчета данного коэффициента:

(5.4)

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

(5.5)

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:

(5.6)

где - коэффициент регрессии в уравнении связи;

- среднее квадратическое отклонение соответствующего, статистически существенного, факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: []. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно осуществлять следующим образом (табл.5.2):

Таблица 5.2

Оценка линейного коэффициента корреляции

Значение линейного коэффициента связи

Характеристика связи

Интерпретация связи

r = 0

отсутствует

-

0

прямая

с увеличением x увеличивается y

-1

обратная

с увеличением x уменьшается y и наоборот

r=1

функциональная

каждому значению факторного признака строго соответствует одно значение результативного признака

В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют так называемое корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.

Эмпирическое корреляционное отношение рассчитывается по данным группировки, когда характеризует отклонения групповых средних результативного показателя от общей средней:

(5.7)

где - корреляционное отношение;

- общая дисперсия;

- средняя из частных (групповых) дисперсий;

- межгрупповая дисперсия (дисперсия групповых средних).

Все эти дисперсии есть дисперсии результативного признака.

Теоретическое корреляционное отношение определяется по формуле:

(5.8)

где - дисперсия выровненных значений результативного признака, то есть рассчитанных по уравнению регрессии;

- дисперсия эмпирических (фактических) значений результативного признака.

Корреляционное отношение изменяется в пределах от 0 до 1 . Для измерения тесноты связи при множественной корреляционной зависимости, то есть при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.

Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле:

(5.9)

где - парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

Приближение к единице свидетельствует о сильной зависимости между признаками.

Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками и при фиксированном значении других факторных признаков, то есть когда влияние исключается, то есть оценивается связь между и в «чистом виде».

В случае зависимости от двух факторных признаков и коэффициенты частной корреляции имеют вид:

(5.10)

где - парные коэффициенты корреляции между указанными в индексе переменными.

В первом случае исключено влияние факторного признака , во втором - .



Похожие документы:

  1. Ответы к экзамену по статистике Предмет и метод статистики. Ее связь с другими науками

    Ответы к экзамену
    ... (группировку и сводку); Анализ результатов. К основным методам относятся: Диалектический метод (явления рассматриваются в развитии); Метод статистических группировок (позволяет ...
  2. Рабочая программа учебной дисциплины статистика (название дисциплины)

    Рабочая программа
    ... . Виды статистического наблюдения и способы его проведения. Статистическая сводка, ее задачи и значение. Организация сводки. Группировка как научная основа сводки, ее задачи и виды. Виды группировок, их задачи ...
  3. Учебно-методическое пособие Рекомендовано методической комиссией финансового факультета для студентов высших учебных заведений экономических специальностей Нижний Новгород

    Учебно-методическое пособие
    ... . Статистическая инструкция, ее назначение и содержание. Статистические сводки и группировки как второй этап статистического исследования. Понятие о сводке, ее назначение и задачи. Виды сводок ...
  4. Задачи дисциплины (8)

    Документ
    ... науки, ее место в системе общественных наук. Преломление черт диалектического метода в ... системы сбора и обработки информации. Тема 1.3. Сводка и группировка статистических данных Понятие, содержание и задачи сводки. Этапы сводки. Особенности сводки ...
  5. Руководство по переходу системы здравоохранения к работе с международной классификацией

    Руководство
    ... и сводки первичных ... и содержания его приема ... его написания и шифровки для статистических разработок, приемы представления статистических данных и стандарты группировок ... ее ... метод его ... задача ... система оценки этих обстоятельств во времени, месте, видах ...

Другие похожие документы..