Показатели, характеризующие структуру и форму распределения признака. Показатели центра распределения

Показатели вариации

Для характеристики среднего значения признака в вариационном ряду используются так называемые показатели центра распределения. К ним относятся средняя величина признака, мода и медиана.

Расчет средней величины признака () в вариационном ряду осуще­ствляется по формуле средней арифметической взвешенной:

, (1)

где x – варианты признака; f – частоты (частости)

При расчете средней величины интервального ряда в качестве вари­антов признака используются значения середины интервалов (гр. 5, табл. 1). Для нахождения середины открытых интервалов (в нашем примере это первая и последняя группы) необходимо их предваритель­но условно закрыть, т. е. определить недостающую верхнюю и нижнюю границы. Принято считать, что в первой группе величина интервала равна интервалу второй группы, а в последней - интервалу предыдущей. В рассматриваемом примере используется ряд с равными интервалами, величина которых 0.5 тыс. руб. Тогда условная нижняя граница первого интервала будет равна: 0.5 тыс. руб. - 0,5 тыс. руб. = 0, а середина - 0.25 тыс. руб., условная верхняя граница последнего интервала: 3,0 тыс. руб. + 0,5 тыс. руб. = 3,5 тыс. руб.. а середина - 3,25 тыс. руб.

Осуществим расчет средней величины месячного среднедушевого денежного дохода (х), используя в качестве весов частоты распреде­ления (f). Промежуточные расчеты запишем в гр. 6 табл. 1. Тогда

тыс.руб.

Месячный среднедушевой доход составляет 1820 руб.

Можно при расчете средней величины в качестве весов использо­вать частости распределения (ω) (промежуточные расчеты в гр. 7 табл. 1). Величина средней от этого не меняется.

тыс.руб.

Мода - значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретном ряду модой является вариант с наибольшей частотой (частостью). В интервальном вариационном ряду мода рассчитывается по формуле:

где - нижняя граница модального интервала;

Величина мо­дального интервала;

- частоты (частости) соответственно модального, домодального и послемодального интервалов.

Модальный интервал - это интервал, имеющий наибольшую частоту (частость). В нашем примере это третий интервал - от 1,0 ,до 1,5 тыс. руб.

Рассчитаем модальное значение признака, используя в качестве весов частости распределения:

Таким образом, в нашем примере наиболее часто встречающаяся величина среднедушевого дохода составляет 1290 руб.

Расчет моды с использованием в качестве весов частот распределения даст аналогичный результат:

Отметим, что вычисление моды в интервальном ряду является весьма условным.



Приближенно модальное значение признака можно определить и графически - по гистограмме. Для этого нужно взять столбец, имею­щий наибольшую высоту, и из его левого верхнего угла провести от­резок в верхний угол последующего столбца, а из правого угла – в верхний правый угол предыдущего (см. рис. 1). Абсцисса точки пе­ресечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности.

Медиана - вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким обра­зом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина - больше, чем медиана.

В интервальном ряду медиана определяется по формуле:

­, (3)

. - начало медианного интервала;

Величина медианного ин­тервала;

- сумма частот (частостей) вариационного ряда;

- час­тота (частость) медианного интервала;

- сумма накопленных час­тот (частостей) в домедианном интервале.

Медианный интервал - это интервал, в котором находится поряд­ковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего по­ловину объема совокупности.

По данным гр. 4 табл. 1 находим ин­тервал, сумма накопленных частот в котором превышает 50%. Это интервал от 1,5 до 2,0 тыс. руб. (S = 60,8%), он и является медиан­ным. Тогда

тыс. руб.

Следовательно, половина жителей города в нашем примере имеет месячный среднедушевой доход меньше 1720 руб., а половина - боль­ше этой суммы.

Расчет медианного значения по частостям распределения даст аналогичный результат:

тыс. руб.

где 1179 - сумма накопленных частот в домедианном интервале.

Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и является медианой (см. рис. 3).

Расчет модального и медианного значений для вариационных ря­дов с неравными интервалами осуществляется по формулам, аналогич­ным приведенным выше, только вместо показателей частот (часто­стей) используются показатели абсолютной или относительной плотности распределения, которые обеспечивают сопоставимость неравных интервалов.

Показатели плотности распределения находятся как отношения частот (частостей) к величине интервала:

Абсолютная плотность распределения

(4)

Относительная плотность распределения

(5)

где i - величина интервала.

По соотношению характеристик центра распределения (средней величины, моды и медианы) можно судить о симметричности эмпи­рического ряда распределения.

Симметричным является распределе­ние, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. В симметричном рас­пределении средняя величина, медиана и мода равны между собой:

Если , то имеет место правосторонняя асимметрия , т. е. большая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распреде­ления правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Соотношение характерно для левосторонней асиммет­рии , при которой большая часть единиц совокупности имеет значе­ния признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая.

Нашему примеру соответствует соотношение (1820 руб. > 1720 руб. > 1290 руб.), характерное для правосторонней асим­метрии, что подтверждается графиками - гистограммой и полигоном распределения (см. рис. 1 и 2). Наличие правосторонней асиммет­рии свидетельствует о том, что большая часть жителей города имела месячный среднедушевой доход выше, чем его модальное значение (1290 руб.).

При анализе вариационного ряда важно знать не только направ­ление асимметрии (правосторонняя или левосторонняя), но и ее сте­пень, которая измеряется с помощью коэффициентов асимметрии. Методика их расчета будет рассмотрена ниже.

Моду и медиану называют еще структурными средними , посколь­ку они дают количественную характеристику структуры строения ва­риационных рядов. К структурным характеристикам относятся и другие порядковые статистики: квартили - делящие ряд на 4 равные части, децили - делящие ряд на 10 частей, перцинтили - на 100 час­тей и др.

АНАЛИЗ РЯДОВ РАСПРЕДЕЛЕНИЯ

1. Ряды распределения и их виды

3. Показатели вариации

5. Средняя и дисперсия альтернативных признаков

6. Показатели формы распределения

    Ряды распределения и их виды

Ряд распределения – это упорядоченное распределение единиц совокупности на группы по какому-либо варьирующему признаку.

Распределение может быть по признакам, имеющимколичественное выражение , и по признакам,не имеющим количественного выражения .

Ряды распределения единиц совокупности по признакам, имеющим количественное выражение, называются вариационными рядами.

Ряды распределения единиц совокупности по признакам, не имеющим количественного выражения, называются атрибутивными рядами.

Каждый вариационный ряд состоит из двух элементов:

Варианта – отдельное значение группировочного признака в вариационном ряду –x.

Частота - число, которое показывает, как часто встречается та или иная варианта –f.

Частость – частота, выраженная в относительных величинах (в процентах или долях единицы) -d .

Частость

Распределение рабочих по размеру месячной заработной платы

Размер заработной платы, д.е. (x)

Численность рабочих

Накопленная частота

в абсолютных единицах, чел. (f)

в процентах к итогу (d)

Распределение семей по числу детей

Число детей (x)

Число семей

Накопленная частота

в абсолютных единицах (f)

в процентах к итогу (d)

Вариационные ряды по способу построения делятся на интервальные и дискретные.

Интервальные вариационные ряды – это такие ряды, где значения варианты даны в виде интервалов, т.е. сгруппированы.

Дискретные вариационные ряды - это такие ряды, где значения варианты не сгруппированы.

Ряды распределения можно представить графически.

Первичный ряд – это такой ряд, где значения варианты не повторяются, т.е. встречаются один раз.

Семь рабочих бригады имеют следующий стаж работы:

Стаж работы (лет): 2 5 7 9 10 11 12

Для анализа рядов распределения рассчитываются три группы показателей:

1) Показатели центра распределения.

2) Показатели вариации.

3) Показатели формы распределения.

2. Показатели центра распределения

К показателям центра распределения относятся:

1. Средние величины.

3. Медиана.

2.1. Средние величины

Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку.Средняя показываетхарактерную, типичную величину признака у единиц совокупности.

Средние которые применяются в статистике относятся к классу степенных средних .


x – варианта,f – частота,n – число вариант,m – показатель степени, - гармоническая частота

Основным условием правильного применения средних величин является однородность совокупности по осредняемому признаку.

Средняя только тогда будет верной обобщающей характеристикой совокупности по варьирующему признаку, когда при замене всех вариант средней, общий объем варьирующего признака останется неизменным.

Определение средних показателей на примерах.

Расчет среднего количества детей в семье (Пример 2)

Расчет средней заработной платы (Пример 1)

Расчет среднего стажа работы (Пример 3)

2.2. Мода

Модой в статистике называется варианта, которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

Мода в дискретных и интервальных рядах определяетсяпо разному .

Мода в дискретном вариационном ряду находится непосредственнопо определению.

В интервальных рядах сначала определяют модальный интервал по наибольшей частоте. Для определения значения моды используют формулу:

где - минимальная граница модального интервала;

Величина модального интервала;

Частота модального интервала;

Частота интервала, предшествующего модальному;

Частота интервала, следующего за модальным.

В примере 1 модальный интервал 170-180, а мода будет равна:

170 - минимальная граница модального интервала;

10 - величина модального интервала;

180 - частота модального интервала;

115 - частота интервала, предшествующего модальному;

45 - частота интервала, следующего за модальным.

Моду можно определить и графическим способом: из полигона распределения и гистограммы.

2.3. Медиана

Медианой в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

Сначала определяют номер медианы:

Медиана в дискретных и интервальных рядах определяется по разному.

Медиана в дискретном вариационном ряду находится непосредственно по определению на основе накопленных частот.

М
едиана находится там, где накопленная частота равна или превышает полусумму частот:

В примере 2

Из таблицы видно, что 101 семья находится там, где накопленная частота 115 (№41…№115)

В интервальных вариационных рядах сначала также находят номер медианы, а затем медианный интервал на основе накопленных частот.

М
едианный интервал находится там, где накопленная частота равна или превышает полусумму частот:

В медианном интервале для определения значения медианы используют формулу:

где - минимальная граница медианного интервала;

Величина медианного интервала;

Сумма частот;

Частота медианного интервала;

Накопленная частота интервала, предшествующего медианному.


В примере 1 номер медианы

медианный интервал 160-170, а медиана будет равна

160 - минимальная граница медианного интервала;

10 - величина медианного интервала;

500 - сумма частот;

160 - накопленная частота интервала, предшествующего медианному;

115 - частота медианного интервала.

Медиану можно определить и графическим способом, из кумуляты распределения.

3. Показатели вариации

Наряду со средними величинами большое теоретическое и практическое значение имеет изучение отклонение от средних.

Первичный ряд 1 Первичный ряд 2


Поэтому средние показатели дополняются показателями вариации.

ПОКАЗАТЕЛИ ВАРИАЦИИ

4. Внутригрупповая и межгрупповая вариация

Вариация признака определяется различными факторами. Некоторые из этих факторов можно выделить с помощью группировок.

Для этого определяют:

Среднюю из групповых дисперсий. Она измеряет внутригрупповую вариацию.

Дисперсию групповых средних. Она измеряет межгрупповую вариацию.

- коэффициент детерминации, показывает, какая доля всей вариации признака

обусловлена признаком, положенным в основу группировки.

Эмпирическое корреляционное отношение, показывает тесноту связи между

группировочным и результативным признаками.



Социология, социальная работа и статистика

ТЕМА 3 Ряды распределения. Показатели вариации ПЛАН ЛЕКЦИИ 1. Понятие рядов распределения. 2. Характеристики центра распределения. Средние величины. 3. Характеристики вариации. 4. Характеристики формы распределения. 1. Понятие рядов распределения 1. В результате...

ТЕМА 3

Ряды распределения. Показатели вариации

ПЛАН ЛЕКЦИИ

1. Понятие рядов распределения.

. Средние величины.

3. Характеристики вариации.

4. Характеристики формы распределения.

1. Понятие рядов распределения

1. В результате группирования получают ряды распределения. Ряд распределения — упорядоченная последовательность пар элементов: вариант-частота. Варианта - отдельное значение групировочного признака; частота - количество элементов в группе с соответствующим значением (уровнем) признака. Хорошим примером ряда распределения будут группированные результаты сдачи экзамена группой студентов:

«неудовлетворительно» - 4

«удовлетворительно» ~ 8

«хорошо» - 10

«отлично» - 3.

Вместо частот иногда удобнее употреблять часть, выраженную коэффициентом или процентом. В зависимости от признака ряды распределения бывают атрибутивными , как в приведенном выше примере, или вариационными , например распределение рабочих по уровню заработка.

Вариационные ряды могут быть дискретными или интервальными . Дискретные ряды построены для разрывных, или дискретных признаков. Дискретным является такой признак, который имеет определенные значения, между которыми не может быть никаких других (число детей в семьи). Интервальные ряды строятся, как правило, для непрерывных признаков , которые могут принимать любые значения в полных границах и выражаются лишь приблизительно (рост человека).

Интервальный ряд может быть построен и для дискретного признака, если она изменяется (варьирует) в широких границах (например, распределение всех страховых компаний города за численностью работников). При этом варианты группируются в интервалы, а частоты относятся не к отдельному значению признака, как в дискретных рядах, а ко всему интервалу.

Очень полезным и даже интересным может быть графическое изображение рядов распределения. Это будто фотография всей совокупности. Укажем, что дискретный ряд изображается в виде полигона (рис. 3.1), а вариационный ряд с равными интервалами ~ в.

Число детей, чел.

Рис. 3.1. Распределение семей по количеству лиц в семье в г. Киеве в 1995 г. (по данным социологического обследования).

виде гистограммы (рис. 3.2)

Рис. 3.2. Распределение населения г. Киева по возрасту в 1995 г. (по данным социологического обследования).

При возрастании объема совокупности и уменьшении ширины интервала гистограмма приближается к кривой.

Ряд распределения может быть охарактеризован системой характеристик (статистических оценок), среди которых различают характеристики центра, вариации и формы распределения.

2. Характеристики центра распределения . Средние величины.

К характеристикам центра относятся средняя, мода и медиана.

Средняя в статистике - абстрактная, обобщающая величина, которая характеризует уровень варьирующего признака в качественно однородной совокупности. Колебание индивидуальных значений признака, вызванные действием разных факторов, уравновешиваются в средней величине.

Средние, которые применяют в статистике, принадлежат к классу степенных, которые в обобщенной форме имеют вид:

где х - индивидуальные значения варьирующего признака (варианты);

z - показатель степени средней;

n — число вариант.

Конкретный вид средней зависит от ее степени. Основные виды степенных средних приведены в табл. 3.1. В ней f – частота (повторяемость индивидуального значения).

Таблица 3.1.

Формулы степенных средних

Степень (Z )

Название средней

Формула расчета

простая

взвешенная

Средняя гармоническая

Средняя геометрическая

Средняя арифметическая

Средняя квадратичная

При изучении закономерностей распределения применяют среднюю арифметическую, вариации - среднюю квадратичную, интенсивности развития — среднюю геометрическую. Разные виды средних, вычисленные для одних и тех же данных, имеют разную величину. Соотношение между ними имеет следующий вид и называется правилом мажорантности:

В социально-экономической статистике вычисления различных средних для одной и той же совокупности нецелесообразно, поэтому стоит вопрос выбора вида средней в каждом конкретном случае исследования.

Рассмотрим условия и примеры вычисления средних.

Средняя арифметическая — одна из наиболее распространенных, применяется в тех случаях, когда объем варьирующего признака для всей совокупности есть сумма индивидуальных значений ее отдельных элементов. Для не сгруппированных данных вычисляют среднюю арифметическую простую, для сгруппированных - взвешенную. Например, если имеем список рабочих строительной бригады, которая содержит данные об индивидуальных заработках за месяц, то, наверное, легче не подсчитывать количество рабочих, которые заработало одинаковые суммы денег за данный период, а просто подытожить все заработки, а потом поделить на численность бригады:

где x i - индивидуальные заработки, n — общее количество рабочих. Когда же, например, вычисляется средний заработок сотрудников кафедры, где профессора, доценты, лаборанты имеют фиксированные оклады, то удобнее перед суммированием перемножить количество профессоров на величину их оклада и т.д.:

где f - численность сотрудников соответствующей должности. В данном случае частота выступает в роли веса, поэтому и средняя носит название взвешенной. В обеих случаях результат будет одинаковой.

Если в роли веса применяют части (w ) , тогда формула будет иметь вид:

когда w представлены в процентах и

если w представлены в коэффициентах.

Если средняя вычисляется для интервального ряда распределения, то вариантами выступают середины интервалов, которые определяют как полусумму двух границ. Ширину открытого интервала условно принимают такой же, как в соседнем закрытом интервале.

Вычисление средней из относительных величин (средний процент, средний удельный вес) имеет особенность. В роли веса здесь выступают знаменатели тех соотношений, с помощью которых были вычислены индивидуальные относительные показатели.

Пример 3.1

На основании приведенных данных вычислить средний процент выполнения плана двумя бригадами (табл. 3.2).

Можно было бы предположить, что обе бригады в среднем выполнили план на 103%. Но средний показатель выполнения плана будет тяготеть в сторону цеха, который имеет большую часть продукции в общем плановом объеме, то есть к цеху №1.

Таблица 3.2

Выполнение бригадами цеха плана выпуска продукции

Бригада

Выполнение плана, %

Плановый выпуск, ед.

№1

№2

Действительно,

Свойства средней арифметической:

1) Алгебраическая сумма отклонений всех вариант от средней равняется нулю:

2) Если каждую варианту увеличить или уменьшить на любую постоянную величину, то и средняя изменится на ту же величину:

3) Если каждую варианту разделить или помножить на любое число, то и средняя уменьшится или увеличится в столько же раз:

4) Если частоты всех вариант увеличить или уменьшить на одно и то же самое число, то средняя при этом не изменится:

5) Сумма квадратов отклонений вариант от средней меньше любой другой величины:

Исходя из формулы вычисления средней, можно говорить о том, что на среднюю влияет колебание структуры совокупности. Объясним на таком примере.

Пример 3.2

Имеем данные о заработной плате и количестве сотрудников кафедры в разрезе (профессоры, лаборанты) за два периода (табл. 3.3).

Рассчитаем среднюю заработную плату за сентябрь, пользуясь формулой средней арифметической взвешенной.

Тогда

За октябрь она будет равняться:

Таблица 3.3

Оплата работы сотрудников кафедры за два периода

Должность

Оклад, грн.

Количество сотрудников, чел.

сентябрь

октябрь

сентябрь

октябрь

Профессор

Лаборант

Итого

То есть, при одинаковых условиях оплаты работы и численности сотрудников кафедры средняя уменьшилась благодаря изменению структуры ее профессионального состава.

Средняя гармоническая — применяется в тех случаях, если нам известны не сами варианты, а их обратные числа.

Пример 3.3

Например, мы имеем данные о затратах времени в часах на изготовление одной детали любым из трех рабочих: 1/2, 1/3 и 1/7. Требуется вычислить средние затраты времени на одну деталь. Тогда

Рассмотрим на примере применения формулы средней гармонической взвешенной.

Пример 3.4

Таблица 3.4

Средняя выработка на одного рабочего и объем продукции для двух видов бригад за апрель

Бригада

Фактический объем произведенной продукции, тыс. грн. (Q )

Средняя выработка одного рабочего, тыс. грн.

Количество бригад

Специализированная

Комплексная

Итого

1620

Для решения этой задачи необходимо исходить из экономического смысла усредненного показателя. То есть, средняя выработка одного рабочего (W ) будет равняться:

В условии отсутствуют данные о численности рабочих (T ), то есть мы не знаем частоты (f ), но ее можно рассчитать по формуле для каждой из бригад. Тогда в нашем примере необходимо использовать формулу средней гармонической взвешенной, где — средняя выработка одного рабочего для каждого вида бригад, Q - фактический объем произведенной продукции.

Средняя выработка одного рабочего для всех бригад составлял в апреле 5,4 тыс. грн.

В литературе можно встретить рекомендации по определению средних для признаков порядковой и номинальной шкалы. Авторы считают, что, если ранги порядковой шкалы отображают приблизительно одинаковые расстояния между отдельными качествами явлений, средний ранг можно вычислять так же, как и при измерении признаков метрической шкалы. В качестве примера они приводят средний уровень квалификации (разряд), средний аттестационный балл и др. Мы из своей стороны считаем, что «одинаковость расстояния» в приведенных примерах довольно сомнительная. Далее отмечается, что в некоторых случаях ранги могут быть числами положительными и отрицательными. Так, значение удовлетворенности рабочих своей профессией, «удовлетворен», «равнодушный», «недовольный», предлагается обозначить баллами, соответственно, 1, 0, -1, а потом определить среднюю арифметическую для всей бригады.

Отметим, что результаты таких процедур могут быть довольно условными, а поэтому советуем быть с ними осторожными.

К характеристикам центра распределения, кроме средней арифметической, принадлежит мода и медиана, которые еще называют порядковыми (структурными) средними и рассматривают вместе с такими характеристиками, как квантили и децили.

Мода (Мо) — значение варианты, которое чаще повторяется в ряду распределения. В дискретном ряду моду легко отыскать визуально, в интервальном ряду легко отыскать модальный интервал, а приблизительное значение моды исчисляется по формуле

Нижняя граница модального интервала; — размер модального интервала; - частота модального интервала; - частота предшествующего интервала; частота интервала, следующего за модальным.

Медиана (Ме) — варианта, которая делит ранжированный ряд на две, равные по численности, части. Так, если в ряду распределения рабочих по возрасту Ме = 34, то это означает, что половина из них меньшие этого возраста, половина — старшие этого возраста. Если ряд содержит парное число членов, медиана равняется средний из двух значений расположенных внутри ряда. Для нахождения медианы в дискретном ряду сначала вычисляют полусумму частот, а потом определяют, какая варианта приходится на нее. Для интервального ряда медиану вычисляют по формуле

где - нижняя граница медианного интервала; — размер медианного интервала; полусумма частот медианного интервала; — сумма накопленных частот перед медианным интервалом; — частота медианного интервала.


Пример 3.5

Таблица 3.5

Распределение семей по количеству лиц в семье в г. Киеве в 1995 г. (по данным социологического обследования)

Размер семьи, чел.

Частость, %

Накопленная частость, %

20.3

29.7

36.6

66.3

24.7

91.0

97.2

99.4

7 и больше

100.0

В этом ряду распределения Мо = 3 и Ме = 3, так как больше половины единиц совокупности находится в первых трех группах.

Пример 3.6

Таблица 3.6

Возрастная структура населения Луганской области в 1999 г. (на начало года) (по данным Луганского областного управления статистики)

Группы по возрасту

Количество, тыс.

Частость, %

Накопленная частость, %

251,0

10-19

407,1

20-29

360,4

30-39

388,8

40-49

417,2

50-59

283,2

60-69

323,7

70 и старше

236,7

Всего

В этом примере модальный интервал Мо расположен в группе (40-49), тогда

Медианный интервал Ме расположен в группе (30-39), тогда по формуле

Каждую из двух частей, на которые медиана разделяет совокупность по объему, в свою очередь также можно поделить с помощью квартилей Q .

Первый квартиль Q 1 , таким образом, отделяет четверть совокупности, второй Q 2 то есть сама медиана, -половину, третий Q 3 - три четверти. Также вычисляют децили и процентили . Так, q - й процентиль — это число, меньше которого принимают значение q % совокупности. Таким образом, 25 — й процентиль есть первая квартиль, а 10 — й процентиль — первая дециль. Иногда Q 1 и Q 3 соответственно, называют нижним и верхним квартилями.

Меру рассеяния вариант можно характеризовать величиной (Ме - Q 1 ;) или (Q 3 - Ме ), еще лучше - их средним значением - средним квартильным отклонением, которое исчисляется по формуле

Q=(Q 1 -Q 3 )/2/

Укажем, что в интервале (Ме ± Q ) лежит половина всех вариант. Мода и медиана не зависят от всех вариант совокупности и потому не заменяют среднюю, как обобщающую величину, а лишь дополняют ее. В отдельных случаях они имеют даже некоторое преимущество перед средней арифметической. Значения всех трех характеристик совпадают лишь в случае симметрии ряда распределения (рис. 3.3, 3.4, 3.5).

Характеристики центра, обобщая индивидуальное, характеризуют общее, тем не менее, не отображают степень и закономерности отклонения индивидуального от общего, то есть степень вариации и форму распределения.

3. Характеристики вариации

Вариация признака является свойством статистической совокупности и обусловлена действием большого множества взаимосвязанных причин, среди которых есть основные и второстепенные. Основные формируют центр распределения, второстепенные — вариацию признаков, совокупное их действие — форму распределения . Чем меньшая вариация, тем более надежными, типичными являются характеристики центра, прежде всего средняя.

Для характеристики вариации применяют систему таких оценок.

Размах вариации — это разность между наибольшим и наименьшим значением признака

В интервальном ряду распределения R определяют как разность между верхней границей последнего интервала и нижней границей первого или же разность между средними значениями этих интервалов.

Как мера вариации R не всегда может быть надежной, поскольку зависит от двух крайних значений, которые часто не являются типичными для совокупности, или имеют случайный характер. Они получили название «выбросы». В практике статистических исследований крайние значения подлежат обработке или, по крайней мере, внимательному рассмотрению. Как правило, это ошибки кодирования или регистрации, иногда они имеют случайный характер. Поэтому их часто просто выбрасывают, суживая тем самым размах и делая совокупность более однородной. Также уменьшает влияние случайных причин так называемый квартильный размах, вычисленный по формуле

В любом случае, отбрасывая крайние значения, следует помнить, что иногда с ними может быть связано что-то интересное или даже феноменальное. Вместо простого отбрасывания предлагают процедуры вычисления оценок распределения, которые нечутки к структуре данных и получили название робастных . Робастными оценками называют также оценки распределения, которые получают при применении этих методов.

Программы статистических пакетов часто предусматривают вычисления оценок Хампеля, Ендрюса и Тьюки.

Например, Тьюки (Тиісеу) предложил один из видов робастных оценок, а именно винзоризованные оценки. Суть в том, что крайние значения не отбрасываются, а заменяются. Если имеем упорядоченный ряд значений х 1 , х 2 , ..., х n , то х 1 присваивается значение х 2 а х n - значение x n -1 . Если такая операция не дает желательных результатов, то есть совокупность еще не становится довольно однородной, то процедуру повторяют (например, с помощью пакета статистических программ ВМОР до 5 раз). Так, при двукратной винзоризации х 1 и х 2 присваивается величина варианты х 3 , а двум последним в ряде — величина х n -2 .

Важно подчеркнуть, что статистический анализ относится к таким работам, где от усердия подготовки материала может зависеть успех всего дела. Относительно всяческих процедур «чистки» или предыдущей обработки данных, то здесь кроме профессиональной стороны дела существует еще и этическая. Исследователь должен стремиться к объективному, научно обоснованному результату, а он может оказаться и не таким, как хотелось бы.

Среднее отклонение вычисляется как:

1) среднее линейное отклонение:

а) невзвешенное: б ) взвешенное:

2) среднее квадратичное отклонение:

Характеристика вариации имеет название дисперсии:

а) невзвешенное: б) взвешенное:

На практике применяют более простую формулу расчета дисперсии:

Чем меньшее среднее отклонение, тем типичнее средняя, тем более однородная совокупность. всегда больше чем d . В симметричных и умеренно асимметрических распределениях = 1,25 d . Характеристики R , d и - именованные величины, которые имеют единицы измерения варьирующего признака.

При сравнении степени вариации одного и того же признака в разных совокупностях используют коэффициент вариации:

или линейный коэффициент вариации :

С его помощью можно оценить также однородность совокупности. Однородной принято считать совокупность, для которой < 33%, что учитывают при предварительной обработке данных.

Рассмотрим особенности вычисления некоторых характеристик для альтернативного признака. Обозначим наличие признака через 1, его отсутствие — через 0. Часть единиц, которые имеют данный признак обозначим через р, которые не имеют — через q .

Тогда

Очевидно, при отсутствии вариации =0; максимальное значение дисперсии составляет 0,25 при р = q =0,5 . Если номинальный признак принимает больше двух значений, оценка его вариации равняется произведению частей:

4. Характеристики формы распределения

Анализ статистической совокупности можно сделать более полным, если отобразить закономерности соотношения вариант и частот определенной функцией, которую называют теоретической кривой . Она является моделью реального явления в целом. Если кривая построена по данным наблюдения, то она имеет название эмпирической кривой .

По своей форме кривые распределения делятся на симметричные и асимметричные. Если в асимметричном распределении вершина смещена влево, то мы имеем правостороннюю асимметрию («правый хвост»), и наоборот.

Рис. 3.3. Левосторонняя асимметрия: < Ме < Мо.

Рис. 3.4. Симметричное распределение: = Ме = Мо ,

Рис. 3.5. Правосторонняя асимметрия: > Ме > Мо.

Кривые бывают одно-, дву- и многовершинные. Многовершинность свидетельствует о неоднородности совокупности.

В зависимости от формы вершины кривые распределения бывают остро- и плосковершинные. Степень асимметрии и островершинности измеряют с помощью коэффициента асимметрии и эксцесса, которые обозначают, соответственно, как А и Е . При нормальном распределении Е = 3, при островерхом Е > 3, при плосковерхом Е < 3 (рис. 3.6, 3.7). То есть можно вести речь про большую или меньшую остро(плоско)верхость.

Рис. 3.6. Островерхое распределение.

Рис. 3.7. Плосковерхое распределение.

Коэффициент асимметрии можно рассчитывать по простой формуле таким образом

Значение А s может быть положительным и отрицательным.

При симметричном распределении А == 0, при правосторонний ассиметрии А > 0, при левосторонний — А < 0. Если имеет место отклонение от 0 в того или другая сторону, то можно вести речь про большую или меньшую асимметрию.

Характеристики формы распределения базируются на моментах распределения. Момент распределения — это средняя k -ой степени отклонений - а.

В зависимости от величины а моменты делятся на первичные (а = 0), центральные (а = х) и условные (а = const ). Степень k определяет порядок момента . В литературе обычно записывают

Тогда

То есть для расчета коэффициента асимметрии и эксцесса прежде всего необходимо рассчитать моменты третьей и четвертой степени.

Особое место среди кривых распределения занимает нормальная кривая, которая отображает нормальное распределение (см. рис. 3.4), или распределение Гаусса. Оно есть результатом влияния неограниченного количества независимых один от другого факторов, который встречается в природе очень часто. Понятие нормального распределения положено в основу многих методов статистики.

Рассмотрим пример, который иллюстрирует методику расчета всех показателей вариации и формы распределения.

Пример 3.7

Имеем данные о выполнении норм выработки рабочими одного из цехов завода (табл. 3.7).

Таблица 3.7

Распределение рабочих по выполнению норм выработки

Группы по выполнению нормы, %

Количество рабочих, чел. (f )

Середина интервала x "

Кумулята,

x " f

Отклонение от средней

До 100

97.5

1170

12.3

100-105

102.5

2050

105-110

107.5

8600

110-115

112.5

5175

115-120

117.5

4230

120 и выше

122.5

12.7

Итого

21960

Так как данные сгруппированы, среднее рассчитывается по формуле средней арифметической взвешенной:

Для расчета показателей вариации построим табл. 3.8.

Таблица 3.8

Расчет показателей вариации и формы распределения

Группы

147.6

1815,48

22330,4

274663,9

146,0

1065,80

7780.3

56796,5

112,0

423,20

973,4

2238,7

124.2

355,34

905.4

2444.6

277,2

2734,44

16435,2

126550.9

76,2

967,74

12290,3

156086.8

Итого

883,2

7362,00

1453,2

618781,4

В табл. 3.8 в графах 1-2 приведенные промежуточные данные, которые рассчитаны для удобства пользования формулами. Используем их для расчета среднего линейного отклонения и дисперсии для сгруппированных данных:

Среднее квадратичное отклонение:

Относительные характеристики вариации:

а) линейный коэффициент вариации

Относительно низкие коэффициенты вариации свидетельствуют об однородности совокупности рабочих по выполнению норм выработки.

Для характеристики формы распределения используем коэффициент асимметрии и эксцесса через моменты третьего и четвертого порядка

Тогда

Рассчитанные значения свидетельствуют о том, что распределение рабочих по выполнению норм выработки левостороннее с небольшой плосковерхостью. Построим график распределения (рис. 3.8).

До 100 105-110 155-120

Выполнение нормы выработки, %

Рис. 3.8. Гистограмма распределения рабочих по выполнению норм выработки.

Вопросы для самоконтроля.

1. Назовите элементы вариационного ряда распределения. В чем различие между частотой и частостью?

2. Какими будут ряды распределения квартир по числу комнат и по густоте их заселения (чел./комн.)? Дискретными или интервальными?

3. Почему средняя является абстрактной величиной и почему обобщающей?

4. Чему равняется средняя заработная плата в коллективе, одна часть которого имеет заработок 100 грн., вторая - 500 грн.?

5. Назовите характеристики центра ряда распределения по признаку «профессия».

6. Каким образом изменится средний оклад сотрудников кафедры, если одной половине его увеличить вдвое , второй ~ вдвое уменьшить.

7. Назовите характеристики центра ряда распределения по признаку «уровень квалификации».

8. Постройте график распределения для таких данных о возрасте рабочих бригады:

№ п/п

возраст, лет

Вычислите Me , Q 1 , Q 3 , Q 4 .

9. Для каждой ли группы студентов численностью 25 чел. могут быть найдены такие характеристики, как мода и медиана для ряда распределения по возрасту; по полу?

10. На основании приведенных данных за месяц определить среднюю часть продукции высшего качества и среднюю производительность работы одного рабочего для всех бригад. Объясните, какие виды средних следует употреблять в данном случае и почему, производительность работы определяется как объем продукции произведенной одним работником за месяц.

Вид бригады

Число бригад

Объем выработанной за месяц продукции

Часть продукции высшего качества, %

Средняя производительность одного рабочего, тыс.грн.

Специализированная

96.0

Комплексная

92.6

11. На основе таких данных вычислить дисперсию образования работников фирмы:

Образование

Часть работников, %

среднее

среднее специальное

высшее

12. Вычислить характеристики такого ряда распределения:

№ работника

Заработок, грн.

13 Какие признаки называют дискретными; непрерывными?

Средняя арифметическая взвешенная:

где - значения j-ой середины интервалов;

Частости j-го интервала.

В связи с тем, что в Excel отсутствует формула для вычисления средней арифметической взвешенной в ячейку В84 запишем выражение = СУММПРОИЗВ (V3:V7).

Мода и медиана относятся к структурным средним. Их значения находятся из выражений:

(17)

(18)

где - нижние границы модального и медианного интервалов;

Ширина модального и медианного интервалов;

Частость модального интервала;

Частость интервала, предшествующему модальному;

Частость интервала следующего за модальным;

Половина суммы накопленных частостей (равна 0,5);

Накопленная частость до медианного интервала;

Частость медианного интервала.

Формулы (15,16 и17) записаны в ячейках B84,В85 и В86 соответственно.

В первом пункте задания сделан вывод о правосторонней асимметрии, а по сгруппированным данным получается, что асимметрия левосторонняя, т.к. .

Противоречие объясняется некоторым произволом в выборе количества групп. Для каждой из 4-х представленных на рис. 5,6, 7, 9 диаграммах будут свои значения , отличающиеся друг от друга. Если существует возможность вычислить значения по несгруппированным данным, то ее необходимо использовать.

Показатели вариации

1. Размах вариации (формула 15, ячейка В76).

2. Среднее линейное отклонение (ячейка В87):

. (19)

3. Дисперсия (ячейка В88):

. (20)

4. Среднее квадратическое отклонение (ячейка В89):

. (21)

5. Коэффициент осцилляции (ячейка В90):

. (22)

6. Линейный коэффициент вариации (ячейка В91):

. (23)

7. Коэффициент вариации (ячейка В92):

. (24)

8. Относительный показатель квартильной вариации (ячейка В93):

;

;

Квартильное отклонение;

Соответственно первая и третья квартили распределения;

Нижние границы интервалов, в которых находятся первая и третья квартили;

Ширины интервалов первой и третьей квартили;

и - сумма накопленных частостей в интервалах предшествующих интервалам, в которых находятся первая и третья квартили;

Частости интервалов, в которых находятся первая и третья квартиль.

В практике из показателей вариации получили широкое применение дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Показатели дифференциации

1. Коэффициент фондовой дифференциации

, (26)

где - средние значения для 10% банков с наибольшими и для 10% с наименьшими значениями активов.

Формула (26) реализована в ячейке В94. Средние значения активов «богатых» банков превышают средние значения активов «бедных» в 1,5 раза.

2. Коэффициент децильной дифференциации

где - максимальное значение активов у 10% банков с наименьшими активами;

Минимальное значение активов у 10% банков с наибольшими активами;

; (28)

; (29)

Нижние границы интервалов, в которых находятся первая и девятая децили;

Ширины интервалов первой и девятой децили;

Сумма накопленных частостей в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили;

Частости интервалов, в которых находятся первая и девятая децили.

Выражения (27-29) реализованы в ячейке В95. Из двух показателей предпочтение следует отдать коэффициенту фондовой дифференциации. Его значение более устойчиво (при соблюдении правил округления) по сравнению с коэффициентом децильной дифференциации, зависящего от количества групп в структурной группировке. Кроме того, оба показателя являются ненормированными. Вследствие этого одно и тоже значение каждого из них можно толковать по-разному. Для устранения указанной неопределенности условимся вычислять значения и по формулам:

Оценку степени дифференциации можно осуществить по шкале Чеддока:

Учитывая, что расчетное значение , степень дифференциации банков по стоимости активов является слабой.

Показатели концентрации

1. Кривая Лоренца

В статистике для изучения степени неравномерности распределения определенного суммарного показателя между единицами отдельных групп вариационного ряда используется кривая Лоренца (или кривая концентрации). Для ее построения распределение единиц совокупности (числа банков) и распределение суммарного показателя (суммы активов в банках) должны быть представлены в долях или процентах, а затем для обоих распределений рассчитываются накопленные (кумулятивные) итоги. В данном примере суммы активов в j-ой группе банков приведены в ячейках Z2: Z7, которые рассчитаны с помощью функции СУММ. Их соответствующие частости помещены в ячейки АА2: АА7. Кумулятивные итоги в частостях размещены в ячейках Y2: Y7 и АВ2: АВ7, а в процентах – AD2: AD7, AE2: AE7. Кривая Лоренца приведена на рис.7. Она построена с помощью мастера диаграмм, тип «точечная». Диалоговое окно приведено на рис. 8.

Рисунок 7


Рисунок 8

2. Коэффициент Джини

Рассчитывается на основе кривой Лоренца

Формула (30) реализована в ячейке В96. Учитывая, что коэффициент Джинни равен 0,09, концентрация активов банков практически отсутствует.

Для отражения особенностей структуры распределения признака в совокупности используют квантили распределения.

Квантили – это варианты признака, занимающие в упорядоченном (ранжированном) ряду единиц совокупности определенное место (каждое четвертое, каждое пятое, каждое шестое и т.д.). в результате квантили делят ряд распределения на равные (по числу единиц) части: квартили – на четыре; квинтили – на пять; секстили – на шесть; децили – на десять; перцентили – на сто частей. Значение квантилей для сгруппированных данных определяют по накопленным частотам.

Наиболее широко используют децили и квартили ряда распределения.

Первая дециль (D 1) – это такое значение признака, что 0,1 (или 10 %) единиц совокупности имеют значение признака меньше, чем D 1 , а 0,9 (90 %) – больше чем 0D 1 . Вторая дециль (D 2) – это такое значении признака, что 0,2 (или 20 %) единиц совокупности имеют значение признака меньше, чем D 2 , а 0,8 (80 %) – больше, чем D 2 . Аналогично определяют D 3 , D 4 , D 5 , D 6 , D 7 , D 8 , D 9 . Формулы расчета крайних децилий следующие:

где, – нижняя граница интервалов, где находятся первая и девятая децили; , – величины интервалов, где располагаются первая и девятая частоты децили; – общая сумма частот (частостей); , – суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили; и – частота интервала, в котором располагаются соответственно первая и девятая децили.

Первая квартиль (Q 1) определяет такое значение признака, что ¼ единиц совокупности имеют значение признака меньше, чем Q 1 , а ¾ – больше чем Q 1 . Вторая квартиль (Q 2) равна медиане. Третья квартиль (Q 3) определяет такое значение признака, что ¾ единиц совокупности имеют значения признака меньше, чем Q 3 , а ¼ – больше, чем Q 3 . Величины крайних для интервального ряда распределения могут быть рассчитаны по следующим формулам:

где – нижняя граница интервала, в котором находятся первая и третья квартили; – суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых располагаются первая и третья квартили; – частота интервала, в котором находятся первая и третья квартили.

Для характеристики формы распределения используют показатель симметричности распределения частот – коэффициент асимметрии, и показатель эксцесса, который отражает крутизну (островершинность) этого распределения. Расчету значений этих показателей предшествует вычисление так называемых моментов распределения.

Моментом распределения называют среднюю арифметическую тех или иных степеней отклонений индивидуальных значений признака от определенной исходной величины:

где, x i – значения признака; A – величина, от которой определяются отклонения; k – степень отклонения (порядок момента).

В зависимости от того, что принимается за исходную величину, различают три вида моментов:

– начальный (М) при А=0;

– центральный () при А= ;

–условный (m), когда А – произвольная величина, не равная и отличная от нуля.

Начальный момент первого порядка представляет собой среднюю арифметическую, а центральный (нулевое свойство средней арифметической) всегда равен нулю. Центральный момент второго порядка – это дисперсия, а для третьего порядка он равен нулю в симметричном распределении и используется при определении показателя асимметрии. Центральный момент четвертого порядка применяется при вычислении показателя эксцесса.

Коэффициент асимметрии представляет собой нормированный центральный момент третьего порядка, т.е. отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

Коэффициент асимметрии (A s) характеризует асимметричность распределения признака в совокупности. Если A s =0, то распределение симметричное, если A s >0, то асимметрия правосторонняя, а если A s <0, то асимметрия левосторонняя. Величина A s может изменяться от –1 до +1 (для одновершинных распределений).

Для симметричных распределений среднее арифметическое значение, мода и медиана равны между собой. Учитывая это, показатель асимметрии может быть рассчитан следующим образом:

Для оценки существенности асимметрии вычисляют показатель средней квадратической ошибки коэффициента асимметрии:

Если отношение имеет значение больше трех, то это свидетельствует о существенном характере асимметрии.

Показатель островершинности распределения – эксцесс (Е х) – рассчитывается для умеренно асимметричных распределений. Он будет наиболее точным, если при вычислении используется нормированный центральный момент четвертого порядка. В нормальном распределении это отношение равно трем, поэтому формула для расчета эксцесса как показателя отклонения от нормального распределения имеет следующий вид:

Эксцесс представляет собой отклонение вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Наличие положительного эксцесса означает, что распределение более островершинное, чем нормальное, а при отрицательном эксцессе распределение имеет более плосковершинный характер, чем нормальное.

Конец работы -

Эта тема принадлежит разделу:

О.Д. Малышева. Статистика предприятия

Учреждение образования могилевский государственный университет продовольствия..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Статистика предприятия
Курс лекций для студентов специальности 1 – 27 01 01 «Экономика и организация производства (по направлениям)» Часть I Могилев 2012 УДК 311.1 &n

Предмет статистики
В настоящее время слово статистика широко употребляется в обиходе. Оно имеет латинское происхождение (от слова status – состояние, положение вещей). В науке этот термин был введен

Категории статистической науки
Так как статистика дает характеристику массовых явлений, то она имеет дело со следующими категориями: 1 статистические показатели; 2 статистическая совокупность; 3 статис

Задачи статистики
Перед статистикой как составной частью системы управления народным хозяйством стоят следующие основные задачи: 1 всестороннее исследование происходящих в обществе экономических и социальны

Организация статистики в Республике Беларусь
В Республике Беларусь статистика организована по централизованному признаку. В своей деятельности органы государственной статистики Республики Беларусь руководствуются законом «О государственной ст

Статистическое наблюдение
Статистическое исследование включает в себя три этапа или стадии: – статистическое наблюдение; – сводку и группировку статистического материала; – анализ

Организационные формы наблюдения
Различают две основные формы статистического наблюдения: 1Отчетность – основная форма статистического наблюдения, с помощью которой статистические органы в определенные ср

Виды статистического наблюдения
Виды статистических наблюдений можно классифицировать по ряду признаков: по частоте регистрации фактов: – непрерывное (текущее); – прерывное. По

Способы статистического наблюдения
Существуют различные способы статистических наблюдений: – непосредственное наблюдение; – документальный способ; – опрос. Непосредственное наблюдение

Организация работы по статистическим наблюдениям
Чтобы провести статистическое наблюдение, надо сформулировать его цель и основные гипотезы, которые должны быть проверены по данным наблюдения. Для успешного проведения статистических набл

Ошибки статистического наблюдения
Ошибки наблюдения – это неточности статистических данных. Они делятся на ошибки регистрации и репрезентативности (представительности). Ошибки регистрации

Контроль статистических данных
Различают три основных вида контроля: – внешний; – счетный (арифметический); – логический. Внешний контроль – это чисто визуальная проверка прав

Статистические группировки и их виды
Первым шагом статистической сводки является статистическая группировка. Это один из наиболее распространенных методов обработки статистической информации. Таким образом, группировк

Типологическая группировка
Типологическая группировка может строиться для разных целей и по различным критериям. Задача выделения типов из общей совокупности решается сравнительно просто только в тех случаях, когда различия

Структурная группировка
Группировки, характеризующие распределение единиц однотипной совокупности по каким-либо признакам, называются структурными. К ним относятся группировки рабочих по возрасту, стажу, зарплате

Аналитическая группировка
Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результа

Вторичные группировки
Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа

Ряды распределения, их виды и графическое изображение
Статистический ряд распределения – это упорядоченное распределение совокупности на группы по определенному варьирующему признаку. Ряды распределения принято оформлять в ви

Статистические таблицы
Статистические таблицы являются средством наглядного выражения результатов исследования. Значение таблиц определяется тем, что они позволяют изолированные статистические данные рас

Статистические графики
Современную науку невозможно представить себе без применения графических методов. Особое место графические методы занимают в статистике и экономике, имеющих дело с большими комплексами циф

Абсолютные величины, их виды, единицы измерения
Первым видом обобщающих статистических показателей являются абсолютные величины. Это такие количественные величины, которые выражают объем или размер общественных явлений в конкрет

Относительные величины, их виды и значения
В исследованиях любого общественного процесса важно изучать его в развитии и сравнивать с другими аналогичными показателями. Относительные – такие величины, которые характ

Основные принципы построения относительных величин
При построении относительных величин следует помнить: 1 Сравниваемые абсолютные показатели должны быть чем-то связаны в реальной жизни объективно, независимо от нашего желания. 2

Построение системы статистических показателей
Поскольку отдельные свойства объекта или явления не изолированы, а связаны между собой, то и статистические показатели, отражающие эти свойства объекта, необходимо связывать в систему. Вид

Понятие средней величины. Виды средних величин
Средние величины – наиболее распространенные обобщающие величины в статистике. Средней величиной называется обобщающая характеристика совокупности однотипных явлений по какому-либо количес

Средняя арифметическая, ее свойства и вычисление
Средняя арифметическая используется в двух формах: – в форме простой: (1) – в форме средней арифметической взвешенной: (2) Формула 1 применяется тогда,

Вычисление средней арифметической способом моментов
Способ моментов применяется для упрощения вычисления средней арифметической при условии, что варианты большие числа. Применяется в основном для рядов с равными интервалами. Суть метода:

Средняя гармоническая, ее виды и вычисления
Средняя гармоническая – это величина обратная средней арифметической из обратных значений признака. Применяется в 2-х формах: в форме простой:

Мода и медиана. Их вычисление в дискретных и интервальных вариационных рядах
Мода и медиана – особого рода средние, которые используются для изучения структуры вариационного ряда. Их иногда называют структурными средними, в отличие от рассмотренных ранее ст

Вычисление моды и медианы в интервальном вариационном ряду
Мода в интервальном вариационном ряду вычисляется по формуле где ХМ0 - начальная граница модального интервала, hм0 – величина

Характеристика показателей вариации
Средняя величина, характеризуя вариационный ряд в целом, не показывает, как располагаются вокруг нее варианты осредняемого признака, т.е. средняя не характеризует колеблемость приз

Основные свойства дисперсии и ее вычисление
Дисперсия – это наиболее часто используемый показатель вариации. Это средний квадрат отклонения вариантов от их среднего значения. Используется в двух формах: – простой

Вычисление дисперсии способом моментов
Способ моментов применяется для упрощения расчетов в том случае, если варианты − большие числа. Первые четыре пункта такие же, как для вычисления средней арифметической способом моментов.

Дисперсия альтернативного признака
В ряде случаев возникает необходимость изучать не среднюю величину, а долю единиц, обладающих каким-либо признаком. Признаки, имеющие только два взаимоисключающих значения − это наличие призн

Определение тесноты связи между факторами. Правило сложения дисперсий
Если некоторая совокупность единиц делится на группы, то наряду с общей дисперсией может быть рассчитана дисперсия по отдельным группам (групповая или частная), а также средняя из групповых и межгр

Принципы и методы построения общих индексов
Для того, чтобы рассчитать общий индекс, надо, прежде всего, преодолеть несуммарность отдельных элементов изучаемого явления. Это достигается путем введения в индекс какого-то дополнительного и неи

Построение индексов качественных показателей в агрегатной форме
Построение индексов качественных показателей будем рассматривать на примере агрегатного индекса цен (Пааше и Ласпейреса). В первом индексе (Пааше) в числителе стоит количество произведенно

Построение агрегатных индексов, объемных показателей
Построение индексов объемных показателей рассмотрим на примере построения индекса объема произведенной или реализованной продукции. Этот индекс можно вычислить по схеме: – Ласпейр

Построение агрегатного индекса производительности труда
В некоторых случаях произведение индексируемой величины на вес дает нам такой объемный показатель, элементы которого являются несоизмеримыми и не поддаются суммированию. Рассмотрим на прим

Индексы с постоянными и переменными весами
Системой индексов называется ряд последовательно построенных индексов. Такие системы характеризуют изменения, происходящие в изучаемом явлении в течение исследуемого периода времен

Преобразование агрегатных индексов в индексы средние из индивидуальных
Индекс средний из индивидуальных получается путем преобразования агрегатного индекса. Для этого в числителе или знаменателе агрегатного индекса вместо индексируемого показателя ставят выражение его

Индексный метод анализа факторов динамики (система взаимосвязанных индексов)
Индексный метод анализа факторов динамики широко применяется для анализа роли отдельных факторов в динамике какого-либо сложного явления. Например: Рассмотрим динамику товарооборо

Индексы постоянного, переменного состава и влияния структурных сдвигов
Характеризуя динамику народного хозяйства, мы пользуемся наряду с объемными также и средними показателями. На величину среднего значения показателя может оказывать влияние как изменение самого осре

Построение территориальных индексов
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, областям, т.е. исчислении территориальных инд

Решение
Территориальный индекс цен, в котором в качестве базы сравнений принимаются данные по городу А (), будет иметь вид, где, – фактически действующие цены в городе А и Б;

Ряды динамики и их виды
Рядами динамики в статистике называют ряды последовательно расположенных в хронологическом порядке показателей, которые характеризуют развитие явлений. Исследование рядов

Темпы роста, их вычисление
Темпы роста − это отношение уровней ряда одного периода к другому. Темпы роста могут быть вычислены как базисные, когда все уровни ряда относятся к уровню одного и т

Вычисление средних показателей динамики
Средний уровень ряда называется средней хронологической. Средняя хронологическая − это средняя величина из показателей, изменяющихся во времени. В и

Решение
1 Среднегодовой размер заработной платы определим по формуле средней арифметической простой тыс. р. 2 Ежегодный (цепной) абсолютный прирост () определим по формуле,

Приемы анализа рядов динамики
Для исследования закономерностей динамики социально-экономических процессов изучают общую линию развития, или так называемый тренд. Изменение уровня ряда динамики обусловл

Аналитическое выравнивание ряда динамики
Использование методов этой группы позволяет преодолеть недостатки приемов механического сглаживания. Они дают возможность учитывать все уровни динамического ряда, моделировать динамические процессы

При четном числе уровней динамического ряда
При нечетном Тогда, подставив значение ∑t=0 в систему уравнений, получим следующую систему уравнений: . Следовательно, значе

Приемы анализа сезонных колебаний
Под сезонными колебаниями понимаются более или менее устойчивые внутригодовые колебания уровней социально-экономических явлений. Сезонные колебания являются результатом влияния природных, обществен

Решение
Индекс сезонности определим по формуле, где – одноименные (одномесячные) средние (в нашем примере в среднем за три года); – общая средняя; – средний уровень ряд

Общее понятие о выборочном методе и причины его использования
1. Выборочное наблюдение – это один из видов несплошного наблюдения, когда исследованию подвергается какая-то часть совокупности; показатели, характеризующие эту отобранную часть, распространяются

Способы отбора
Существуют различные виды (способы) отбора единиц в целях образования выборки. Выборку можно проводить путем последовательного отбора отдельных единиц (это индивидуальный отбор) или путем

Собственно случайная выборка
Собственно-случайная выборка – это такая выборка, при которой отбор единиц и групп единиц для обследования производится в случайном порядке. Часто для таких целей применяется жеребьевка. При этом к

Решение
1 Рассчитаем предельную ошибку выборки () по формуле, где – коэффициент доверия, который зависит от вероятности, с которой можно гарантировать, что предельная ошибка выб

Решение
На основании имеющегося распределения семей определим выборочную среднюю и дисперсию чел. Предельную ошибку выборки определим по формуле, где – коэффици

Механический отбор
Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы. При этом размер интервала рав

Типический (районированный) отбор
В некоторых случаях, когда генеральная совокупность не однотипна, применяется предварительное деление ее на типически однородные группы (районы). Группировка производится по существенным признакам,

Гнездовой (серийный) отбор
Иногда приходится отбирать не отдельные единицы, а целые группы или серии с тем, чтобы затем в этих группах подвергать обследованию все без исключения единицы. Серийный отбор применяется в 2 вариан

Понятие о моментном наблюдении и малой выборке
Особым видом выборочного наблюдения является моментное наблюдение. Оно широко распространено в промышленности. Суть его в том, что на отдельные определенные моменты времени фиксируется наличие отде

Виды связей
Исследование объективно существующих связей между явлениями -важнейшая задача теории статистики.Статистика разработала множество методов изучения связей, выбор которых зависит от п

Коэффициент взаимной сопряженности Чупрова и Пирсона
Коэффициент взаимной сопряженности Чупрова и Пирсона применяется тогда, когда исследуется теснота связи между варьированием двух атрибутивных признаков, когда это варьирование обра

Коэффициенты ассоциации и контингенции
Коэффициенты ассоциации и контингенции применяются тогда, когда исследуется связь между варьированием двух атрибутивных признаков, по каждому признаку имеется две группы (таблица 10.2). &n

Метод сравнения параллельных рядов
Установить наличие и характер связи между количественными признаками можно с помощью метода сравнения параллельных рядов, заключающегося в следующем. Признаки-факторы мы р

Коэффициент Фехнера
Коэффициент Фехнера основан на методе параллельных рядов. Суть его в том, что сравниваются знаки отклонений значений признака от их средних арифметических. 1 Находим средние арифметические

Коэффициент корреляции рангов
Коэффициент корреляции рангов – это более точный коэффициент определения тесноты связи между количественными признаками. С помощью этого коэффициента можно определить не только силу, но и направлен

Метод аналитических группировок
Значительно более отчетливо будут проявляться корреляционные зависимости, если мы применим метод группировок и будем сравнивать не индивидуальные данные, а групповые средние. Группировка п

Метод корреляционно-регрессионного анализа. Корреляционное отношение и коэффициент корреляции
При исследовании корреляционных зависимостей решению подлежит широкий круг вопросов: 1 предварительный анализ свойств моделируемой совокупности; 2 установление факта наличия связи

Измерение тесноты связи между признаками
Для определения тесноты связи между факторным и результативным признаком используются: 1 индекс корреляции R, вычисляемый по формуле где − общая диспе

Проверка значимости корреляционной связи с помощью дисперсионного анализа
Можно проверить значимость корреляционной связи с помощью дисперсионного анализа. Дисперсионный анализ основывается на расчленении общей вариации признака на вариацию систематическую, обусловленну

Понятие о многофакторном корреляционно-регрессионном анализе
Для многофакторного корреляционного анализа математически задача формулируется следующим образом: требуется найти аналитическое выражение, наилучшим образом отражающее связь между факторными призна

Статистика
Курс лекций Составитель Малышева Ольга Дмитриевна Редактор Т.Л. Бажанова Технический редактор А.А. Щербакова Подп