Основанием группировки в статистике является. Статистическая сводка и группировка

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Сводка статистических данных

Сводка и группировка материалов статистического наблюдения

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет средних и относительных показателей.

Статистическая сводка осуществляется по специально составленной программе, в которой указываются методы сбора и обработки информации. Содержание сводки чаще всего отражается в системе обоснованных макетов таблиц. Результаты сводки позволяют достаточно полно охарактеризовать весь изучаемый объект и отдельные его части с помощью многочисленных показателей.

Выполнение статистической сводки состоит из следующих этапов:

1) Определение задачи сводки в соответствии с целью экономико-статистического исследования.

2) Построение необходимых группировок.

3) Проверка достоверности и полноты собранной информации. Расчет показателей, необходимых для характеристики изучаемого явления и формулировки выводов.

Если по изучаемой совокупности производится только подсчет общих итогов без какой-либо предварительной систематизации собранного материала, то сводка называется простой.

Центральное место в статистической сводке отводится группировке. Группировка является важнейшим методом статистического иссле­дования, позволяющим уловить переход количественных изменений в качественные, выявить закономерности развития изучаемого явления или процесса.

Статистическая группировка - это процесс образования однород­ных групп на основе расчленения статистической совокупности на части (группы, подгруппы) по существенным для единиц этой совокупнос­ти признакам.

В экономико-статистических исследованиях применяются группировки трех видов:

1) типологические группировки;

2) структурные группировки;

3) аналитические группировки.

Типологическая группировка используется для выявления и характеристики социально-экономических типов явлений. Примером такой группировки может служить деление совокупности предприятий на ча­сти в соответствии с их формой собственности, деление экономически активного населения региона на занятых и безработных.

Структурная группировка позволяет охарактеризовать состав явления, процесса или совокупности. Например, группировка населения по полу, возрасту или душевому доходу. Анализ результатов таких груп­пировок, выполненных за несколько периодов, позволяет оценить изменение структуры явлений во времени, что отражает важнейшие закономерности их развития.

Аналитическая группировка используется для установления взаимо­связи между отдельными явлениями и их признаками. В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного призна­ка. Например, с помощью группировки предприятий по фондовооруженности труда (факторный признак) можно установить наличие зави­симости от него производительности труда (результативного признака): в группах с более высокой фондовооруженностью труда будет наблюдаться и более высокая его производительность (хотя по отдельным предприятиям это соотношение может и не наблюдаться).



Признак , на основе которого производится деление единиц совокупности на группы, называется группировочным признаком или основанием группировки.

Если группы образуются по одному признаку, то группировка называется простой (например, деление населения на возрастные группы). Группировка по двум или нескольким признакам называется сложной или комбинационной. Например, возрастные группы населения делятся на подгруппы по полу и т.д. Как правило, даже при достаточно большом объеме совокупности при построении статистических группировок огра­ничиваются двумя-четырьмя группировочными признаками.

Выбор группировочного признака сравнительно прост, если группировка производится по атрибутивному признаку. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Например, группировки населения по полу или социальному положению.

В случае, если атрибутивные (качественные) признаки имеют большое количество разновидностей, разрабатываются классификации разновидностей.

Классификации - это особый вид группировок, представляющих собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемой совокупности. Классификации выступают в качестве статистического стандарта, устанавливаемого на определенный период. Например, ОКВЭД - Общероссийский классификатор видов экономической деятельности, продукции и услуг, классификатор основных фондов и т.д.

количественному дискретному признаку, то число групп соответствует числу вариант (значений признака), если оно не очень велико. Например, распределение рабочих по тарифному разряду или студентов по оценкам, полученным на экзамене. При большом числе вариант дискретного признака их объединяют в группы.

Когда группировка производится поколичественному непрерывному признаку, весь диапазон его изменения разбивается на интервалы «от - до». Например, при группировке предприятий по объему производства: 1-й интервал - (100-200 тыс. рублей), 2-й интервал - (200-300 тыс. рублей) и т.д., последний интервал - (800 тыс. рублей - 1 млн. рублей).

Интервал, в котором указана лишь одна граница, называется открытым. Интервал, имеющий верхнюю и нижнюю границу, называется закрытым. Длина интервала - это разница между его верхней и нижней гра­ницей. Интервалы бывают равные, неравные и специализированные. Неравные интервалы применяются в аналитических группировках для того, чтобы число единиц совокупности в группе было достаточно вели­ко, и чтобы они были приблизительно одинаково заполнены. Специали­зированные интервалы используются в типологических группировках. Границы устанавливаются там, где намечается переход от одного качества к другому.

Величина интервала и число групп при выполнении группировки по непрерывному количественному признаку определяется, исходя из целей исследования, особенностей изучаемого признака, объема и качества имеющейся информации. Количество групп и длина интервала группировки взаимосвязаны: чем больше образовано групп, тем меньше длина интервалов и наоборот.

Ориентировочно число групп с равными интервалами можно определить по формуле американского ученого Стерджесса:

где N - объем совокупности.

Логари́фм числа b по основанию a определяется как показатель степени, в которую надо возвести основание a , чтобы получить число b . Обозначение: .

Формула (3.1) устанавливает следующие соотношения между числом групп (n) и объемом статистической совокупности (N), на базе которой строится группировка:

N 15–24 25–44 45–89 90–179 180–359 360–719
n

Соответственно, формула Стерджесса для определения длины интервала группировки по непрерывному количественному признаку выглядит следующим образом:

где и соответственно, наибольшее и наименьшее значение группировочного признака.

Все сказанное позволяет выделить следующие основные стадии в последовательности выполнения статистических группировок:

1. Обоснование группировочного признака и показателей, с помощью которых предполагается характеризовать выделенные группы.

2. Определение числа групп и длины интервалов.

3. Составление макета групповой вспомогательной таблицы и выполнение необходимых расчетов.

4. Составление макета итоговой таблицы и расчет необходимых показа­телей.

5. Анализ полученных результатов и формулировка выводов.

Основой статистической группировки является группировочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2. Классификация видов группировочного признака

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды по ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


Рис. 3.3. Классификация видов статистической группировки


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена по национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь, сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы по одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным . Типичным примером является группировка населения по полу.

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

: 10]. Используют классификации: отраслевую; профессиональную; основных фондов; капитальных вложений; строительных машин. В статистике внешней торговли используется «Товарная номенклатура внешнеэкономической деятельности». В условиях возникновения новых форм хозяйствования начинают использоваться классификаторы форм собственности, организационно-правовых форм хозяйствующих субъектов.

Для дальнейшей обработки собранных в ходе статистического наблюдения первичных данных широко используют и метод группировки.

Это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.

Признаки, по которым проводится группировка, называют группировочными признаками . Группировочный признак иногда называют основанием группировки . Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.).

При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д.

Если берется, предположим, такой качественный признак, как образование, то групп будет ровно столько, сколько существует ступеней или профилей образования. В образовании по ступеням групп будет шесть (неполное среднее; среднее; неполное среднее специальное; специальное среднее; неполное высшее; высшее). По профилю образования количество групп может совпадать или с числом профессиональных групп, или с числом сфер образования (гуманитарное; инженерно-техническое; естественнонаучное).

Основные приемы построения и выполнения группировок

Если для построения группировки используется только один признак, то такую группировку называются простой, если группировка проводится по нескольким признакам, ее называют сложной. Сложная группировка бывает или комбинационная, или многомерная.

Комбинационная группировка выполняется последовательно: группы, выделенные по одному признаку, затем выделяются в подгруппы по другому признаку, которые, в свою очередь, могут выделяться по следующему другому признаку. В этом случае число групп будет равно произведению числа выделенных групп на число группировочных признаков. Процедура определения оптимального числа групп основана на применении формулы Стерджесса

где n - число групп; N - число единиц совокупности.

Из формулы видно, что выбор числа групп зависит от объема совокупности. Если групп оказывается много и они включают малое число единиц, то групповые показатели могут стать ненадежными. Поэтому альтернативой комбинационной группировке является многомерная группировка , которая осуществляется по комплексу признаков одновременно. Ее применение требует использования электронной вычислительной техники. С помощью специально разработанных электронных программ формируются однородные группы на основании близости по всему комплексу признаков.

Определение числа групп тесно связано с понятием величина интервала : чем больше число групп, тем меньше величина интервала, и наоборот. - разница между максимальным и минимальным значениями признака в каждой группе. Он определяет количественные границы групп, что для статистической практики имеет большое значение, особенно когда нужно образовать качественно однородные группы. Например, исследуется совокупность предприятий по выполнению коллективных договоров. Здесь нельзя объединять предприятия, которые не выполнили обязательства, и те, которые их перевыполнили. Показатель здесь - величина интервала.

Другим примером является невозможность образовывать группу 95 - 105%, поскольку это разные части совокупности. Следует образовать две группы: 95 - 100% и 101 - 105%. В этом случае границы, по которым различаются совокупности, абсолютно соблюдаются.

Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала есть разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница (у первого - верхняя, у последнего - нижняя), то речь идет об открытых интервалах . Если у интервала имеются и нижняя, и верхняя границы, то речь идет о закрытых интервалах . Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Если можно заранее установить определенное количество групп, то величину равного интервала можно вычислить по формуле

(3.2)

где i - величина равного интервала; x max , x min - наибольшее и наименьшее значения признака; n - число групп.

Если не требуется предварительного установления числа групп, то используется другой способ определения величины равного интервала - по формуле

(3.3)

где n - число наблюдений.

Если величина равного интервала рассчитывается по данной формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом.

В статистической практике чаще применяются неравные интервалы (постепенно возрастающие или постепенно убывающие). При этом исследуемая совокупность делится на группы примерно равного заполнения с большим числом единиц. Неравные интервалы могут использоваться, например, в таких случаях:

    а) при исследовании группировки с применением нескольких признаков, дающих возможность составить несколько подгрупп, где требуются уже и более длинные и более короткие интервалы;

    б) при образовании крупных групп с новым качеством на базе мелких групп при условии сохранения их однородности, что приводит к увеличению интервалов.

В статистической практике используются также специализированные интервалы . Интервалы называют специализированными, если речь идет об установлении границ интервала в группах, схожих по типу и по признаку, но имеющих отношение, скажем, к разным отраслям производства.

Виды группировок. Статистическая таблица

Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей.

С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности (табл. 3.1), по формам хозяйствования, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы.

Таблица 3.1

Группировка полиграфических предприятий
одного из городов России
по формам собственности

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть может решаться задача по изучению структурного состава той или иной однородной совокупности, структурных изменений по тому или иному группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений (табл. 3.2).

Таблица 3.2

Группировка населения России
по размеру среднедушевого дохода

(условные цифры)

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы. Пример аналитической группировки представлен в табл. 3.3.

Таблица 3.3

Группировка продолжительности договорных связей
книжного магазина и качества продукции

Продолжительность договорных связей магазина с поставщиками, лет Число поставщиков Доля качественной стандартной книжной продукции, %
абсолютное в % к итогу
До 2 3 14 65
3–5 8 38 69
5–8 6 29 74
Свыше 8 4 19 91
Итого 21 100 74,8

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими. - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Примером комбинационной группировки может быть распределение полиграфических предприятий по трем существенным признакам: степени оснащенности современным полиграфическим оборудованием, степени применения современных технологий и уровню производительности труда. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.

При составлении таблиц необходимо соблюдать общие правила :

    таблица должна быть легко обозримой;

    общий заголовок должен кратко выражать основное содержание;

    наличие строк «общих итогов»;

    наличие нумерации строк, которые заполняются данными;

    соблюдение правила округления чисел.