Статистические группировки могут быть типологическими. Классификация и группировка в статистике

Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.

Второй этап статистической работы – статистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.

Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом.

Проведение сводки включает три этапа:

1) предварительный контроль – это проверка данных;

2) группировка данных по заданным признакам – это определение производных показателей;

3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.

Смысловая согласованность статистических сведений – это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.

Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.

Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.

Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.

Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.

Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.

Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:

1) выбирается группировочный признак для образования однородных групп;

2) определяется порядок формирования и число групп;

3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;

4) создаются макеты статистических таблиц для предоставления результатов сводки.

Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.

Сводка также бывает децентрализованной и централизованной.

Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.

Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.

По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.

2. Сущность и классификация группировок

Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.

Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».

Статистическая группировка – это один из основных этапов проведения статистического исследования.

Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.

Три основных типа задач, решаемых с помощью метода статистической группировки:

1) выделение социально–экономических типов явлений;

2) изучение структуры явления и структурных сдвигов, происходящих в явлении;

3) выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления. Различают следующие виды статистических группировок:

1) типологические;

2) структурные;

3) аналитические.

Качественно однородные группы совокупностей, т. е. объекты, которые по своим группировочным признакам близки друг к другу, называют типологической группировкой.

Примером типологической группировки являются: группировка земель, по формам собственности. Основное внимание в типологической группировке должно уделяться идентификации типов и выбору группировочного признака. Для построения типологической группировки необходимо воспользоваться количественными и качественными (атрибутивными) признаками.

Группировка по атрибутивному признаку предполагает, что число выделенных групп соответствует фактическому числу градаций этого признака. По количественному признаку необходимо правильно установить интервал группировки, определить необходимое число групп. Проблема определения интервалов типологической группировки решается на основании выделения таких количественных границ изменения группировочного признака, при которых явление изменяет или приобретает новое качество.

В типологической группировке от числа существующих социально–экономических типов зависит число групп. От состава, структуры однородных групп и изучения вариации признаков внутри однотипной совокупности и однотипных групп на основе построения структурной группировки зависят социально–экономические типы явлений. Разделение однородной совокупности на определенные группы, которые в дальнейшем будут характеризовать структуру по определенному группировочному признаку, называют структурной группировкой. Здесь также рассматриваются количественные и атрибутивные признаки. Примером является группировка рабочих склада по квалификации.

По атрибутивному признаку группы отличаются друг от друга по характеру признака. Количественный признак также предполагает определение числа групп и ширины интервала.

Основная задача статистических группировок – исследование связей и зависимостей между признаками единиц статистической совокупности, которая решается с помощью построения аналитических группировок. Аналитическая группировка – это группировка, выявляющая взаимосвязи и взаимозависимости между изучаемыми социально–экономическими явлениями и признаками, их характеризующими.

Все признаки в статистической науке можно подразделять на факторные и результативные. Признаки, которые оказывают большое влияние на изменение результативных признаков, называют факторными. Признаки, изменяющиеся под влиянием факторных признаков, называют результативными.

Важная задача при построении аналитической группировки – выбор числа групп, на которые необходимо разбить изучаемую совокупность единиц наблюдения, и определение их границ.

Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по груп–пировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.

Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.

Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировоч–ным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.

При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.

Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку Различают группировки по используемой информации:

1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;

2) вторичные – это результат соединения или расчленения группировки.

3. Принципы построения группировок

Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.

Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.

В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.

Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.

Для определения числа групп можно воспользоваться формулой Стерджесса:

h + 3,322 ? lg N,

где h – число групп;

N – число единиц совокупности;

lgN – десятичный логарифм от N.

Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.

На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.

Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.

Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

h = R/n = (х мах – х min) / n,

гдех мах,х min – максимальное и минимальное значение признака в совокупности;

n – число групп.

Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.

В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

Основой статистической группировки является группиро- вочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2.

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды но ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена но национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы но одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным. Типичным примером является группировка населения по полу.

10. Виды группировок

В зависимости от степени сложности изучаемого явления и от поставленных задач статистические группировки могут выполняться по одному или нескольким группировочным признакам.

Группировка называется простой (одномерной) , если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

структурные – предназначены для выявления состава изучаемого явления;

типологические – предназначены для выделения в статистической совокупности различных социально-экономических типов явлений;

аналитические (факторные) – используются для изучения связей и зависимости между варьирующими признаками.

Структурные группировки

Структурные группировки используются для изучения внутреннего строения статистической совокупности и характеристики структурных сдвигов. Они дают информацию о текущем состоянии массовых явлений и применяются в целях оперативного управления.

Структурная группировка выполняется в несколько этапов:

выбор группировочного признака;

определение необходимого числа групп;

определение параметров групп;

распределение единиц наблюдения по выделенным группам;

расчет структурных характеристик;

формулировка выводов.

Выбор группировочного признака осуществляется в соответствии с целями статистического исследования. В качестве группировочного обычно выступает существенный признак. Обязательным условием выполнения любой группировки, в том числе и структурной является упорядочение статистической совокупности по значениям группировочного признака.

Определение необходимого числа групп . Число групп должно быть достаточным для объективного представления изучаемой совокупности. При большом числе групп различия между ними становятся малозаметными, а в самих группах в виду их малой наполняемости перестает действовать закон больших чисел и возможно проявления случайности. При малом же их числе в одну группу могут попасть статистические единицы с существенно различающимися значениями признака.

На количество выделяемых групп влияют следующие факторы:

уровень колеблемости группировочного признак - чем значительнее вариация признака, тем большее количество групп необходимо выделять при прочих равных условиях;

размер изучаемой статистической совокупности - чем больше размер исследуемой совокупности, тем большее количество групп необходимо выделять.

Выделенные группы должны быть достаточно заполненными. Наличие пустых групп или малое число статистических единиц в них свидетельствуют о неправильном определении их числа.

Ориентировочно число групп можно определить использую эмпирическую зависимость, называемую формулой Стерджесса:

m ≈ 1 + 3,322 × lg N ,

где m – количество групп;

N - число единиц статистической совокупности.

Зависимость Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близкое к нормальному, и при этом используются равные интервалы.

Существует еще один способ определения количества выделяемых групп, он связан с применением среднеквадратичного отклонения равными и неравными σ : если ширина интервала равна 0,5σ , то выделяется 12 групп, если 2/3σ ,то 9 групп, если σ – то 6 групп.

В каждой выделенной группе рассчитываются следующие параметры:

верхняя граница интервала x i в

нижняя граница интервала x i н

ширина интервала а i ;

середина интервала b i .

Нижней границей интервала x i н называется наименьшее значение признака в группе.

Верхней границей интервала x i в называется наибольшее значение признака в группе.

Интервалы группировки бывают равными и неравными (прогрессивно возрастающими, прогрессивно убывающими, произвольными, специализированными).

Если вариация признака проявляется в сравнительно узких границах, и распределение статистических единиц носит достаточно равномерный характер, то строят группировку с равными интервалами.

Для равноинтервальной группировки ширина интервала а i определяется по формуле:

а i = (X max – X min ) / m = R / m

где R – размах вариации,

R = X max - X min

При определении размаха вариации R из наблюдения исключаются аномальные значения признака. Полученное значение ширины интервала а i округляется в бóльшую сторону. На основе рассчитанной ширины интервала а i последовательно определяется границы интервалов x i н и x i в .

Определение границ начинается с первой группы. Ее нижняя граница принимается равной минимальному значению признака в совокупности, т. е. х 1 н min , верхняя граница определяется как x 1 в = х 1 н + а i

Для второй группы нижняя граница принимается равной верхней границе первой группы, т. е. x 2 н 1 в , верхняя определяется как x 2 в = х 2 н + а i и так далее.

В целом границы интервалов определяются формулами:

x i н = x i -1 в .

x i в = x i н + а i

Середина интервала (центральная варианта) b i определяется как полусумма верхней и нижней границ, т.е. по формуле:

b i = ( x i в + x i в )/2

Параметр середина интервала используется при расчете обобщающих характеристик изучаемой совокупности. Достаточно часто при выполнении группировки используются открытые интервалы. В открытых интервалах указывается только одна граница: верхняя - у последнего интервала, нижняя – у первого.

Для закрытия таких интервалов необходимо предварительно определить их ширину. Проблема ширины открытых интервалов решается следующим образом:

    при равноинтервальной группировке она есть величина постоянная;

    при неравноинтервальной - предварительно определяется закономерность изменения ширины интервала для некрайних групп, выявленная закономерность позволяет определить ширину соответствующего интервала и рассчитать недостающую границу.

Распределение единиц совокупности по группам.

Основной задачей данного этапа является подсчет числа единиц, попавших в каждую из выделенных групп n i .

При распределении единиц наблюдения по выделенным группам, особенно если группировочный признак является непрерывным, имеет место неопределенность: к какой группе относить единицы со значениями признака, совпадающими с границами интервалов? Для устранения неопределенности используют принцип единообразия – такие единицы включаются в группу, в которой нижняя граница совпадает со значением признака.

Например , имеются группы предприятий по объему производства, млн. руб.: 400 – 450; 450 – 500; 500 – 550; 550 – 600; 600 – 650.

К какой группе следует отнести предприятия с объемом производства 500млн. руб.? В соответствии с принципом единообразия - ко второй группе.

Расчет структурных характеристик.

Расчет заключается в определении для каждой группы удельного веса (доли) ее единиц в общем объеме статистической совокупности. Как и любая относительная величина этот показатель может быть определен в виде коэффициентов:

d i = n i / N

или в виде процентов

d i = ( n i / N ) ×100%

Рассчитав такие доли для всех групп, мы получаем структуру изучаемой статистической совокупности, равную полному набору долей, т.е. сумма d i = 1

или

сумма d i = 100%

На основе анализа показателей структуры делаются соответствующие выводы.

Формулировка выводов о составе совокупности

Для структурных группировок в выводах отражаются два положения:

Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

Каков характер изменения структуры в зависимости от изменения значения признака. С увеличением x доля может увеличиваться, либо уменьшаться. Это довольно типично для экономических показателей.

Выводы должны быть сделаны обязательно, иначе пропадает смысл группировки. Данные структурных группировок обычно представляются в форме соответствующей таблицы.

Типологическая группировка

Ее цель состоит в изучении распространенности различных типов экономических явлений в статистической совокупности. Типологические группировки применяются, как правило, к неоднородной совокупности и осуществляются посредством сложных неравноинтервальных группировок.

Результатом типологических группировок является разделение совокупности на классы, социально- экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная, смешанная) или группировка секторов экономики.

При выполнении типологических группировок важно правильно выбрать основание группировки. Для этого необходимо предварительно выявить возможные типы явления на основе анализа сущности и закономерностей его развития. Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Аналитические группировки

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы:

    факторные

    результативные.

Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Сложные группировки

К сложным группировкам относятся группировки, выполняемые по двум и более основаниям. Сложные группировки делятся на-

    комбинационные

    многомерные.

Комбинационные группировки выполнятся по нескольким признакам последовательно. Последовательность устанавливается исходя из логики взаимосвязи показателей. Как правило, группировку начинают с атрибутивного признака. При комбинационной группировке совокупность логически последовательно разбивается на однородные части по отдельным признакам: на группы - по одному признаку, затем внутри каждой группы по второму признаку - на подгруппы и т.д. Такие группировки предназначены для более глубокого анализа изучаемого явления, позволяют выявить и сравнить различия и связи между исследуемыми признаками, которые невозможно установить на основе изолированных группировок по каждому из исследуемых признаков. Однако следует иметь в виду, что при изучении влияния большого числа признаков применение комбинационных группировок невозможно, так как это приводит к дроблению информации, а значит, к затушевыванию проявлений закономерности. Даже при наличии больших объемов информации приходится ограничиваться двумя – четырьмя признаками.

Комбинационная группировка по двум признакам (X, Y ) оформляется в виде шахматной таблицы, в которой значения одного признака X откладываются по строкам, а значения второго признака Y – по столбцам. На пересечении j –ого столбца и i -ой строки (в теле таблицы) находятся частоты совместного проявления значения признака Y в j- ом столбце и значения признака X в i -ой строке.

К многомерным группировкам относятся группировки, выполненные по нескольким группировочным признакам одновременно.

Цель многомерных группировок – классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно.

В процессе такой группировки решаются, например, задачи типизации – выделяются самостоятельные экономические или социальные типы явлений.

Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д. Можно выделить типы предприятий по финансовому положению на основе таких показателей как размер прибыли, уровень рентабельности производства, уровень капитализации, уровень ликвидности ценных бумаг и т.д.

В психологии многомерные группировки используются для выделения типов людей по степени их профессиональной пригодности, в медицине – для диагностики болезней на основе множества симптомов.

При выполнении многомерных группировок могут быть использованы два основных подхода:

Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.

Второй подход состоит в использовании методом кластерного анализа.

Задачи группировок состоят в следующем:

  • выделение социально-экономических типов;
  • изучение структуры совокупности;
  • исследование связи между признаками.

В соответствии с указанными задачами различают три вида группировок:

  • типологические;
  • структурные (вариационные);
  • аналитические (факторные).

Типологическая группировка – это разделение разнородной совокупности на однокачественные группы (частные совокупности), которые отличаются типом явлений.

Структурная группировка предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку.

Аналитическая группировка является средством изучения связи между признаками.

Особенность типологической группировки состоит в том, что перечень типов, которые могут встречаться в изучаемой совокупности, предварительно устанавливается экспертным путем в соответствии с поставленной целью исследования. Например, в целях регламентации банковской деятельности контролирующие органы США делят банки по объему собственных средств на пять типов:

  • – с большим капиталом;
  • – достаточным капиталом;
  • – недостаточным капиталом;
  • – значительно недостаточным капиталом;
  • – критически недостаточным капиталом.

Банк, который переходит в более низкую категорию, не может без разрешения регулирующих органов увеличивать активы, выплачивать дивиденды держателям акций.

В России в целях изучения деловой активности банков на основе соответствующего мониторинга, проводимого Центром экономической конъюнктуры при Правительстве РФ, их делят по такому же признаку, но только на три группы: малые, средние и крупные.

Экспертным путем осуществляется и выбор признаков для разграничения выделяемых типов явлений. Так, разделение банков по размеру возможно и по другим признакам, например по объему суммарных активов.

Структурная группировка обеспечивает разграничение групп в соответствии с уровнем вариации по изучаемому признаку. Пример такой группировки представлен в табл. 2.1.

Таблица 2.1

Группировка кредитных организаций РФ по величине активов (%, к итогу")

Группа кредитных организаций по величине активов (г), млн руб.

Количество филиалов

Собственные средства

Объем вкладов физических лиц

Объем кредитов, предоставленных банкам и другим клиентам

Пример показывает, что указанные различия между типологической и структурной группировками во многом являются условными. С одной стороны, выделенные типы отражают структуру совокупности. С другой – если задать границы интервалов суммы активов, соответствующие типам банков по размеру (малые, средние, крупные), то можно будет назвать группировку типологической.

Аналитическая группировка в силу характера решаемых задач отличается тем, что при ее построении признаки делятся на факторные и результативные. Единицы совокупности группируются по факторному признаку, а затем каждая группа характеризуется средними величинами результативного признака.

Сопоставляя изменения средних значений результативного признака по группам с изменением фактора, можно сделать вывод о наличии или отсутствии связи, ее форме и направлении (линейная или нелинейная, прямая или обратная). Пример аналитической группировки представлен в табл. 2.2.

Таблица 2.2

Характеристика зависимости соотношения вложенных и израсходованных сбережений населения региона в зависимости от состава семьи

В приведенном примере средний уровень соотношения вложенных и израсходованных сбережений населения изменится от группы к группе семей; наблюдается нелинейная зависимость между показателем, характеризующим размер семьи, и средним уровнем соотношения суммы вложенных и израсходованных сбережений: в семьях большего размера это соотношение ниже.

Использование структурных группировок позволяет не только раскрыть соотношение отдельных частей изучаемой совокупности, но и через сопоставление во времени проанализировать наметившиеся в ней структурные сдвиги. В качестве сводной характеристики интенсивности изменений можно использовать интегральные показатели структурных сдвигов, в частности линейный и квадратический коэффициенты абсолютных структурных сдвигов.

Для оценки усиления или снижения интенсивности структурных сдвигов целесообразно проводить их расчет по нескольким периодам. Достаточно распространенным сводным показателем структурных сдвигов, имеющим не только нижнюю, но и верхнюю границы изменения, является индекс различий. Он колеблется от нуля до единицы. Чем ближе его величина к единице, тем значительнее степень изменений в составе анализируемой группы статей.

Формулы расчета:

1) линейный коэффициент абсолютных структурных сдвигов:

2) квадратический коэффициент абсолютных структурных сдвигов:

Примером такого использования структурной группировки могут служить данные о прогнозе изменений в экономике, предусмотренные в приложении 2 к Концепции долгосрочного социально-экономического развития Российской Федерации на период до 2020 года (табл. 2.3).

Таблица 2.3

Прогноз изменения структуры добавленной стоимости по основным секторам экономики (в ценах 2007 г.)

Сектор экономики

Удельный вес в общей сумме добавленной стоимости, %

2007 г. (d 0)

2020 г. (d 1)

Инновационный

Нефтегазовый

Сырьевой сектор

Транспорт

Оптовая и розничная торговля

Для данных, представленных в таблице, линейный коэффициент абсолютных структурных сдвигов равен 2,6 процентного пункта (п. п.); квадратичный коэффициент абсолютных структурных сдвигов равен 3,6 п. п.; индекс различий равен 0,08.

Данные, приведенные в табл. 2.3, и показатели интенсивности структурных сдвигов свидетельствуют о прогнозируемых заметных изменениях в составе добавленной стоимости по основным секторам экономики за 2007–2020 гг.

Группировка может быть произведена по одному или нескольким признакам. Если группы образуются по одному признаку, группировка называется простой.

Группировка, в которой разделение совокупности на группы производится по двум или более признакам, взятым в сочетании, называется комбинационной. В этом случае каждая группа, выделенная по одному (первому) признаку, разбивается на подгруппы по второму, а последние – на подгруппы по третьему признаку и т.д.

Одновременное использование нескольких группировочных признаков позволяет выявить качественные различия, структурные особенности и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков. Однако комбинация группировочных признаков резко увеличивает число групп, отсюда при использовании комбинационных группировок предполагается достаточно большое число наблюдений.

Основанием группировки может служить как неколичественный (атрибутивный), так и количественный признак.

Атрибутивные признаки выражают свойства явления в виде их наименования. Отсюда выбор группировочного признака предопределяет иногда и количество групп. Так, при группировке населения по полу возможны только две группы, а при изучении профессионального состава рабочих может быть образовано несколько групп с учетом разных профессий.

В целом атрибутивный характер признака не снимает вопроса о числе выделяемых групп, так как при обилии атрибутивных вариантов создается чрезмерная раздробленность изучаемого явления. В результате для образования групп по таким признакам приходится объединять ряд их значений. Рекомендуется, например, объединять родственные профессии в группы, охватывающие тот или иной вид труда (токари, фрезеровщики могут быть объединены в группу станочников), либо рабочие различных профессий вспомогательного производства могут быть распределены на следующие укрупненные группы: ремонтную, технического контроля, транспортную и т.д.

Разграничение групп и подгрупп по количественным группировочным признакам, как правило, связано с образованием интервалов по этим признакам. Лишь тогда, когда дискретный признак изменяется в небольших пределах, группировка совпадает со значением признака (например, семьи – по числу членов и т.д.).

Интервалы группировки – это количественные значения признака, на основе которых исследуемые явления разбиваются на группы. Разность между верхней и нижней границами интервала составляет его величину. Интервалы бывают равными (когда их величина одинакова во всех группах) или неравными (когда их величина изменяется от одной группы к другой).

Равные интервалы применяются в тех случаях, когда изменение признака происходит в сравнительно узких границах и носит более или менее равномерный характер. Они дают возможность шире применять математические приемы анализа.

Для группировки с равными интервалами величина интервала определяется по формуле

где i – величина отдельного интервала; и – наибольшее и наименьшее значения признака в исследуемой совокупности; п – число групп.

Неравные интервалы иногда применяют как прогрессивно возрастающие или убывающие. Использование таких интервалов при изучении социально-экономических явлений обусловлено тем, что для большей их части количественное изменение размера признака имеет неодинаковое значение в высших и низших группах. Так, разница в товарообороте, составляющая 10 тыс. руб., для мелких магазинов имеет существенное значение, а для крупных – несущественное.

И наконец, интервалы группировки могут быть замкнутыми (с указанием нижней и верхней границ) и открытыми (с указанием одной из границ). Открытые интервалы применяют только для крайних групп.

Порядок выбора группировочного признака, приемы образования, смысл и значение интервалов и групп – все эти вопросы конкретизируются применительно к каждому виду группировок.

Число интервалов при типологической группировке определяется числом выделенных типов, а величина каждого из них зависит от содержания отграничиваемого с его помощью типа. При этом используют, как правило, открытые и неравные интервалы.

В аналитических и структурных группировках анализ проводится в рамках однокачественных совокупностей, отграниченных в результате типологической группировки. В связи с этим объективного единого принципа определения числа групп нет. В каждом конкретном случае необходимо принимать во внимание объем изучаемой совокупности и характер изменчивости признака. Чем значительнее совокупность единиц, чем интенсивнее меняется признак, тем больше может быть образовано групп. С целью определения границ вариации и непосредственного сопоставления изменения взаимосвязанных признаков в структурных и аналитических группировках применяют чаще всего закрытые, равные интервалы. Однако требование, связанное с обеспечением достаточной заполненности групп, приводит к необходимости использования в ряде случаев группировки но неравным интервалам.

Ориентировочно количество групп при группировке с равными интервалами можно рассчитывать по формуле, предложенной американским ученым Стерджессом:

где N – число единиц совокупности; п – число групп.

Статистические группировки, как правило, формируют на основе первичного статистического материала. Такие группировки называют первичными. Иногда для образования новых групп приходится пользоваться уже имеющимися группировками. Такие группировки называют вторичными.

Необходимость в перегруппировке данных возникает в тех случаях, когда произведенные ранее группировки не удовлетворяют целям исследования по двум основным причинам:

  • число имеющихся групп больше (или меньше), чем это требуется для характеристики типических отношений и связей;
  • первичная группировка проведена по разным группировочным признакам или разным интервалам с точки зрения сопоставимости данных, относящихся к различным периодам времени или различным территориям.

Новые группы могут быть получены следующими способами:

  • 1) перегруппировкой по величине интервалов первичной группировки;
  • 2) перегруппировкой по удельному весу отдельных групп в общем их итоге.

Для достижения единообразия в обработке статистических данных на практике часто используют классификации.

Классификация рассматривается как разновидность типологической группировки. Она представляет собой систематизированные распределения явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Примерами могут служить ОКВЭД, классификация секторов экономики и экономических активов в системе национальных счетов и др.

Классификация является своеобразным стандартом, установленным на определенный промежуток времени. В основе классификации, как правило, лежит атрибутивный признак, который может иметь множество разновидностей. Они дополняются и конкретизируются в номенклатуре. Под номенклатурой понимается стандартный перечень объектов и групп, входящих в определенную классификацию.

Четко разделить группировки и классификации довольно трудно, поскольку они выполняют однотипные функции. Классификации рассчитаны на длительное применение, однако с течением времени их пересматривают и корректируют.

В отличие от классификации группировки производят для целей данного конкретного исследования, рассмотрения в нем какого-либо отдельного вопроса. Например, при разработке концепции жизненного цикла домохозяйства американскими маркетологами использовались следующие границы возраста: молодость – до 35 лет; средний возраст – 35–64 года; старший возраст – 65 лет и старше.

В отечественной практике для анализа поведенческой модели различных групп населения на потребительском рынке согласно методике регулярных опросов потребительского поведения населения в России, которые проводятся Росстатом ежеквартально, используются другие возрастные границы: молодость – 16–29 лет; средний возраст – от 30–49 лет; старший возраст – 50 лет и старше.

В настоящее время с целью группировки объектов, характеризующихся большим количеством признаков, широко используются методы многомерной группировки, или методы многомерной классификации.

По существу, здесь сохраняется реализуемый при типологической группировке принцип сходства и различия единиц совокупности. Сходство – это однородность единиц в группах, различие – это их существенное расхождение по группам. Иными словами, во-первых, в один класс объединяются объекты, сходные между собой в некотором отношении, а во-вторых, степень сходства объектов, принадлежащих к одному классу, должна быть больше, чем степень сходства объектов, относящихся к разным классам. В типологической группировке понятия сходства и степени сходства не формализованы, а в процедурах многомерной классификации они формализованы и выражаются рядом функциональных соотношений.

В случае многомерной классификации при распределении единиц па однородные группы одновременно используются все группировочные признаки, т.е. реализуется политетический подход к образованию групп.

Объекты объединяются в один класс в соответствии с выбранным типом мер их сходства (коэффициенты связи, показатели расстояния, коэффициенты подобия). Например, данный метод статистического анализа приобретает особое значение в связи с введением системы управления предприятиями и организациями, обеспечивающей своевременное изменение параметров их деятельности в условиях нестабильности внешней среды, для адаптации к запросам конъюнктуры рынка. Сложность решения такого рода задач заключается в том, что в этом случае необходимо проводить анализ не изолированно, а в сравнении с другими субъектами хозяйственной деятельности.

Переход к широкому использованию методов многомерной классификации связан с накоплением достаточно большого объема систематизированной информации. В связи с этим неслучайно сферой активного приложения метода многомерной классификации стал финансовый сектор. Отчетность институциональных единиц этого сектора, прежде всего банков, в силу специфики их деятельности как финансовых посредников формируется с учетом

потребностей различных категорий внешних пользователей, например классификация коммерческих банков по уровню их деловой активности, ресурсообеспеченности, кредитоориентированности, инвестиционной активности, финансовой устойчивости.

Простейшим вариантом многомерной классификации является группировка на основе многомерной средней. Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. В силу несопоставимости абсолютных значений разных признаков многомерная средняя вычисляется из относительных величин, рассчитанных по этим признакам. Формула многомерной средней следующая:

где i – номер единицы совокупности; j – номер признака; – многомерная средняя для i -й единицы совокупности; т – число признаков; – значение признака для i -й единицы; – среднее значение признака , рассчитанное по всей совокупности единиц.

Пример группировки на основе многомерной средней представлен в табл. 2.4.

Таблица 2.4

Группировка банков по показателям эффективности управления активными и пассивными операциями

Доходность активов (x 1)

Маржа прибыли, т.е. отношение прибыли к доходам 2)

Средние значения

Рассчитанные многомерные средние позволяют сравнить банки и сделать вывод, что два банка имеют примерно одинаковый уровень эффективности управления активами и пассивами, один банк – средний уровень, два банка отстают от остальных и имеют примерно одинаковую величину Р, (0,58 и 0,50).