Виды группировок. Статистическая группировка

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Группировкой называется разбиение общей совокупности единиц объекта наблю-дения по одному или нескольким существенным признакам на однородные группы, раз-личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи-ровать связи между отдельными признаками. Группировки являются важнейшим стати-стическим методом обобщения статистических данных, основой для правильного исчис-ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати-стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос-новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения соста-ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна-ками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки не-обходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются дру-гие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе-ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

Единицы статистической совокупности группируются по факторному признаку;

Каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).


Сначала группы формируются по одному признаку, затем группы делятся на под-группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно-сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь-ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про-изводить группировку по атрибутивным признакам, значения которых имеют ярко выра-женные качественные различия.

Принципы построения статистических группировок и классификаций.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери-зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится раз-биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп-пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест-венные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отрас-левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе-стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос-нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно-сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распреде-ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко-леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце-нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R = Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на-блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве-сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче-ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно-стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль-но-математический способ предполагает использование формулы Стерджесса :
n = 1 + 3,322 × lgN, (3.1)

n - число групп;

N - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово-купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред-него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп-ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп-ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето-дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных гра-ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

Равные и неравные;

Открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про-грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при-знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/n = Xmax - Xmin/n (3.2)

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини-мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели-чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це-лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи-руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав-ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по-сле построения равных интервалов по изучаемому признаку образуются группы, содер-жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо-димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес-сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва-лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле-дующим образом:

h i+1 = h i + a,

а в геометрической прогрессии:

h i+1 = h i x q,

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь-шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа-телю численности работающих, который варьирует от 500 человек до 3500 человек, неце-лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп-нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор ис-следователя в построении равных или неравных интервалов зависит от степени заполне-ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су-щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно-сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос-тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин-тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны-ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна-чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю-чать единицы наблюдения, значения признака у которых совпадают с границами интерва-лов. Например, во вторую или третью группу должна войти строительная фирма с объе-мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про-тивном случае - ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель-ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди-ниц совокупности, значения которых являются граничными, к той или иной группе реша-ется на основе анализа последнего открытого интервала.

Возможны два случая обозначе-ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин-тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интерва-лы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло-виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес-сивно-убывающими. Такие интервалы называются произвольнымии , как правило, ис-пользуются при группировке предприятий, например, по уровню рентабельности.

Введение

В практической статистике широко применяется метод классификаций и группировок. Классификация - это систематическое распределение явлений и объектов по определенным группам, классам, разрядам на основании их сходства и различия. Используют классификации: отраслевую; профессиональную; основных фондов; капитальных вложений; строительных машин.

Для дальнейшей обработки собранных в ходе статистического наблюдения первичных данных широко используют и метод группировки.

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.

Признаки, по которым проводится группировка, называют группировочными признаками. Группировочный признак иногда называют основанием группировки. Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.).

При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д.

Виды группировок. Статистическая таблица

Виды группировок зависят от целей и задач, которые они выполняют. С помощью метода статистических группировок выделяют качественно однородные совокупности, изучают структуры совокупности и изменения, происходящие в них, а также решают задачи по исследованию существующих связей и зависимостей.

С известной мерой условности для выполнения этих задач группировки соответственно делят на типологические, структурные и аналитические.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. При этом очень важно правильно отобрать группировочный признак, который поможет идентифицировать выбранный тип. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности (табл. 1), по формам хозяйствования, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы.

Таблица 1 - Группировка полиграфических предприятий одного из городов России по формам собственности

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть может решаться задача по изучению структурного состава той или иной однородной совокупности, структурных изменений по тому или иному группировочному признаку. На основе структурных изменений изучаются закономерности общественных явлений (табл. 2).

Таблица 2 - Группировка населения России по размеру среднедушевого дохода (условные цифры)

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы. Пример аналитической группировки представлен в табл. 3.

Таблица 3 - Группировка продолжительности договорных связей книжного магазина и качества продукции

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими.

Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам. Статистическая таблица содержит два элемента: подлежащее и сказуемое.

Подлежащее статистической таблицы есть перечень групп или единиц, составляющих исследуемую совокупность единиц наблюдения.

Сказуемое статистической таблицы - это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц.

Различают простые, групповые и комбинационные таблицы.

В простых таблицах , как правило, содержится справочный материал, где дается перечень групп или единиц, составляющих объект изучения. При этом части подлежащего не являются группами одинакового качества, отсутствует систематизация изучаемых единиц. Сказуемое этих таблиц содержит абсолютные величины, отражающие объемы изучаемых процессов.

Групповые и комбинационные таблицы предназначены для научных целей, где, в отличие от простых таблиц, в сказуемом - средние и относительные величины на основе абсолютных величин.

Групповая таблица - это таблица, где статистическая совокупность разбивается на отдельные группы по какому-либо одному существенному признаку, при этом каждая группа характеризуется рядом показателей. Примером такой группировки может быть разделение российских семей на группы по месту проживания (сельское и городское), где образуются подгруппы семей по количеству детей. Анализ этих группировок по материалам переписи 1989 года позволил сделать вывод, что большинство семей, независимо от принадлежности к городскому или сельскому населению, имеют только по одному ребенку.

Комбинационная таблица - это таблица, где подлежащее представляет собой группировку единиц совокупности по двум и более признакам, которые распределяются на группы сначала по одному признаку, а затем на подгруппы по другому признаку внутри каждой из уже выделенных групп. Комбинационная таблица устанавливает существенную связь между факторами группировки. Примером комбинационной группировки может быть распределение полиграфических предприятий по трем существенным признакам: степени оснащенности современным полиграфическим оборудованием, степени применения современных технологий и уровню производительности труда. Такого рода статистические таблицы позволяют осуществить всесторонний анализ, но они менее наглядны.

10. Виды группировок

В зависимости от степени сложности изучаемого явления и от поставленных задач статистические группировки могут выполняться по одному или нескольким группировочным признакам.

Группировка называется простой (одномерной) , если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

структурные – предназначены для выявления состава изучаемого явления;

типологические – предназначены для выделения в статистической совокупности различных социально-экономических типов явлений;

аналитические (факторные) – используются для изучения связей и зависимости между варьирующими признаками.

Структурные группировки

Структурные группировки используются для изучения внутреннего строения статистической совокупности и характеристики структурных сдвигов. Они дают информацию о текущем состоянии массовых явлений и применяются в целях оперативного управления.

Структурная группировка выполняется в несколько этапов:

выбор группировочного признака;

определение необходимого числа групп;

определение параметров групп;

распределение единиц наблюдения по выделенным группам;

расчет структурных характеристик;

формулировка выводов.

Выбор группировочного признака осуществляется в соответствии с целями статистического исследования. В качестве группировочного обычно выступает существенный признак. Обязательным условием выполнения любой группировки, в том числе и структурной является упорядочение статистической совокупности по значениям группировочного признака.

Определение необходимого числа групп . Число групп должно быть достаточным для объективного представления изучаемой совокупности. При большом числе групп различия между ними становятся малозаметными, а в самих группах в виду их малой наполняемости перестает действовать закон больших чисел и возможно проявления случайности. При малом же их числе в одну группу могут попасть статистические единицы с существенно различающимися значениями признака.

На количество выделяемых групп влияют следующие факторы:

уровень колеблемости группировочного признак - чем значительнее вариация признака, тем большее количество групп необходимо выделять при прочих равных условиях;

размер изучаемой статистической совокупности - чем больше размер исследуемой совокупности, тем большее количество групп необходимо выделять.

Выделенные группы должны быть достаточно заполненными. Наличие пустых групп или малое число статистических единиц в них свидетельствуют о неправильном определении их числа.

Ориентировочно число групп можно определить использую эмпирическую зависимость, называемую формулой Стерджесса:

m ≈ 1 + 3,322 × lg N ,

где m – количество групп;

N - число единиц статистической совокупности.

Зависимость Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близкое к нормальному, и при этом используются равные интервалы.

Существует еще один способ определения количества выделяемых групп, он связан с применением среднеквадратичного отклонения равными и неравными σ : если ширина интервала равна 0,5σ , то выделяется 12 групп, если 2/3σ ,то 9 групп, если σ – то 6 групп.

В каждой выделенной группе рассчитываются следующие параметры:

верхняя граница интервала x i в

нижняя граница интервала x i н

ширина интервала а i ;

середина интервала b i .

Нижней границей интервала x i н называется наименьшее значение признака в группе.

Верхней границей интервала x i в называется наибольшее значение признака в группе.

Интервалы группировки бывают равными и неравными (прогрессивно возрастающими, прогрессивно убывающими, произвольными, специализированными).

Если вариация признака проявляется в сравнительно узких границах, и распределение статистических единиц носит достаточно равномерный характер, то строят группировку с равными интервалами.

Для равноинтервальной группировки ширина интервала а i определяется по формуле:

а i = (X max – X min ) / m = R / m

где R – размах вариации,

R = X max - X min

При определении размаха вариации R из наблюдения исключаются аномальные значения признака. Полученное значение ширины интервала а i округляется в бóльшую сторону. На основе рассчитанной ширины интервала а i последовательно определяется границы интервалов x i н и x i в .

Определение границ начинается с первой группы. Ее нижняя граница принимается равной минимальному значению признака в совокупности, т. е. х 1 н min , верхняя граница определяется как x 1 в = х 1 н + а i

Для второй группы нижняя граница принимается равной верхней границе первой группы, т. е. x 2 н 1 в , верхняя определяется как x 2 в = х 2 н + а i и так далее.

В целом границы интервалов определяются формулами:

x i н = x i -1 в .

x i в = x i н + а i

Середина интервала (центральная варианта) b i определяется как полусумма верхней и нижней границ, т.е. по формуле:

b i = ( x i в + x i в )/2

Параметр середина интервала используется при расчете обобщающих характеристик изучаемой совокупности. Достаточно часто при выполнении группировки используются открытые интервалы. В открытых интервалах указывается только одна граница: верхняя - у последнего интервала, нижняя – у первого.

Для закрытия таких интервалов необходимо предварительно определить их ширину. Проблема ширины открытых интервалов решается следующим образом:

    при равноинтервальной группировке она есть величина постоянная;

    при неравноинтервальной - предварительно определяется закономерность изменения ширины интервала для некрайних групп, выявленная закономерность позволяет определить ширину соответствующего интервала и рассчитать недостающую границу.

Распределение единиц совокупности по группам.

Основной задачей данного этапа является подсчет числа единиц, попавших в каждую из выделенных групп n i .

При распределении единиц наблюдения по выделенным группам, особенно если группировочный признак является непрерывным, имеет место неопределенность: к какой группе относить единицы со значениями признака, совпадающими с границами интервалов? Для устранения неопределенности используют принцип единообразия – такие единицы включаются в группу, в которой нижняя граница совпадает со значением признака.

Например , имеются группы предприятий по объему производства, млн. руб.: 400 – 450; 450 – 500; 500 – 550; 550 – 600; 600 – 650.

К какой группе следует отнести предприятия с объемом производства 500млн. руб.? В соответствии с принципом единообразия - ко второй группе.

Расчет структурных характеристик.

Расчет заключается в определении для каждой группы удельного веса (доли) ее единиц в общем объеме статистической совокупности. Как и любая относительная величина этот показатель может быть определен в виде коэффициентов:

d i = n i / N

или в виде процентов

d i = ( n i / N ) ×100%

Рассчитав такие доли для всех групп, мы получаем структуру изучаемой статистической совокупности, равную полному набору долей, т.е. сумма d i = 1

или

сумма d i = 100%

На основе анализа показателей структуры делаются соответствующие выводы.

Формулировка выводов о составе совокупности

Для структурных группировок в выводах отражаются два положения:

Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

Каков характер изменения структуры в зависимости от изменения значения признака. С увеличением x доля может увеличиваться, либо уменьшаться. Это довольно типично для экономических показателей.

Выводы должны быть сделаны обязательно, иначе пропадает смысл группировки. Данные структурных группировок обычно представляются в форме соответствующей таблицы.

Типологическая группировка

Ее цель состоит в изучении распространенности различных типов экономических явлений в статистической совокупности. Типологические группировки применяются, как правило, к неоднородной совокупности и осуществляются посредством сложных неравноинтервальных группировок.

Результатом типологических группировок является разделение совокупности на классы, социально- экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная, смешанная) или группировка секторов экономики.

При выполнении типологических группировок важно правильно выбрать основание группировки. Для этого необходимо предварительно выявить возможные типы явления на основе анализа сущности и закономерностей его развития. Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Аналитические группировки

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы:

    факторные

    результативные.

Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Сложные группировки

К сложным группировкам относятся группировки, выполняемые по двум и более основаниям. Сложные группировки делятся на-

    комбинационные

    многомерные.

Комбинационные группировки выполнятся по нескольким признакам последовательно. Последовательность устанавливается исходя из логики взаимосвязи показателей. Как правило, группировку начинают с атрибутивного признака. При комбинационной группировке совокупность логически последовательно разбивается на однородные части по отдельным признакам: на группы - по одному признаку, затем внутри каждой группы по второму признаку - на подгруппы и т.д. Такие группировки предназначены для более глубокого анализа изучаемого явления, позволяют выявить и сравнить различия и связи между исследуемыми признаками, которые невозможно установить на основе изолированных группировок по каждому из исследуемых признаков. Однако следует иметь в виду, что при изучении влияния большого числа признаков применение комбинационных группировок невозможно, так как это приводит к дроблению информации, а значит, к затушевыванию проявлений закономерности. Даже при наличии больших объемов информации приходится ограничиваться двумя – четырьмя признаками.

Комбинационная группировка по двум признакам (X, Y ) оформляется в виде шахматной таблицы, в которой значения одного признака X откладываются по строкам, а значения второго признака Y – по столбцам. На пересечении j –ого столбца и i -ой строки (в теле таблицы) находятся частоты совместного проявления значения признака Y в j- ом столбце и значения признака X в i -ой строке.

К многомерным группировкам относятся группировки, выполненные по нескольким группировочным признакам одновременно.

Цель многомерных группировок – классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно.

В процессе такой группировки решаются, например, задачи типизации – выделяются самостоятельные экономические или социальные типы явлений.

Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д. Можно выделить типы предприятий по финансовому положению на основе таких показателей как размер прибыли, уровень рентабельности производства, уровень капитализации, уровень ликвидности ценных бумаг и т.д.

В психологии многомерные группировки используются для выделения типов людей по степени их профессиональной пригодности, в медицине – для диагностики болезней на основе множества симптомов.

При выполнении многомерных группировок могут быть использованы два основных подхода:

Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.

Второй подход состоит в использовании методом кластерного анализа.

Предмет статистики.

Статистика – это сложная и многогранная наука, в курсе которой излагаются основные категории и принципы статистич.науки, научные основы методов анализа статист.данных.

Предмет – изучение количественной стороны массовых общественных явлений и процессов в неразрывной связи с их качественной стороной в определенных условиях места и времени. При определении предмета является важным соблюдение след.принципов: однородность массовых явлений, предварительный качественный анализ, определение закономерностей, применение количественных методов, исчисление обобщающих показателей.

Одна из важнейших задач ст.-ки – правильно определить содержание стат.показателей и разработать методологию их расчета. Задачи ст.-ки можно разделить на 2группы: методологические и практические. Задачей статистики на современном этапе соц.-эконом. развития РФ является характеристика происходящих изменений, связанных с переходом к рыночным отношениям. Органы гос. и ведомственной статистики РФ решают след.задачи:

1)совершенствование действующих и построение новых систематических классификаторов, регистров и показателей, отражающих ход и результаты совершаемых реформ;

2)разработка и реализация программы адаптации отечественных систем учета и статистики к междунар.стандартам.

3)создание системы оперативного управления корпоративными и федеральными отечественными программами статистических работ;

4)разработка общероссийских классификаторов продукции (ОКП),видов эконом.деятельности,товаров,услуг и капиталов по виду деятельности, разработка классификаторов природных ресурсов.

5)реорганизация методов сбора обработки и обмена данных,замена сплошных обследований выборочными

6)создание базы данных и разработка российских сайтов и технологий доступа к сети Интернет

7)разработка методов изучения финансовых и нефин.активов,статистики платежного баланса внешней торговли

8)улучшение системы экономико-статист.образования в РФ.

Приемы, с помощью которых статистика изучает свой предмет называется методологией.

Статистическая методология – система приемов, способов и методов, проявляющихся в структуре, динамике и взаимосвязи соц.-эконом.явлений.

Во всяком стат.явлении можно выделить 3стадии:

1) массового стат. наблюдение – сбор первичного стат.материала;

2)сводка и разработка результатов наблюдения (группировка)

3)анализ полученных сводных данных (табличный и графический методы)

Все стат.методы взаимосвязаны и представляют собой единую систему,применение которой гарантирует правильность и достоверность получаемых результатов.

Статистическая методология

Организация государственной статистики в РФ

Основные организационные формы статистического наблюдения.

Виды стат.наблюдения.

Стат.наблюдение – это первая стадия всякого стат.исследования, кот.представляет собой планомерную, научно-организационную системат.работу по собиранию массовых первичных данных о явлениях и процессах общественной жизни.

Задачи стат.наблюдения – получение достоверной исходной информации в кратчайшие сроки.

3 основные формы организации получения сведений:

1)отчетность – документ, содержащий стат.сведения о работе предприятий, организаций, учреждений. Отч. всегда носит обязательный характер и предоставляется в указанный срок. Отчетность делится на типовую (состав показателей одинаков для предприятий всех отраслей) и специальную (состав показ. изменяется в зависимости от особенностей отраслей экономики).

2)специально организованные стат.обследования – сбор сведений в форме переписей, единовременных учетов и специально организованных обследований.

3) регистры

При подготовке стат.наблюдения решаются след. методологические вопросы: определение цели и объекта наблюдения; состав признаков,подлежащих регистрации; разработка документов для сбора данных; выбор единицы наблюдения; определение методов и средств получения данных.

Программа стат.набл. состоит из 2частей:

1.Адресная часть – помимо указаний на местоположение наблюдаемой единицы, включает определение:

Объекта наблюдения – совокупность явлений и процессов, имеющих общие признаки, подлежащие регистрации

Единицы набл. – первичная ячейка объекта наблюдения,являющаяся источником информации

Единица совокупности – первичный элемент объекта наблюдения,являющийся носителем изучаемого признака.

Как учитывать факты (все или их часть)

В какие сроки производить учет фактов

В зависимости от этих признаков набл.подразделяется на виды: (1.по степени охвата явлений регистрацией) сплошное и несплошное (выборочное; способ основного массива; анкетное; монографическое)

В зависимости от задач и характера исследуемого явления набл.бывают: (2.по непрерывности учета фактов во времени) текущие, периодические и единовременные. Период.и единоврем.наблюдения требуют определения критического момента (это определенный момент, к которому приурочивают собираемые сведения).

Способы получения стат.информации при организации стат.наблюдения:

1.Непосредственное наблюдение (информация учитывается представителями органов гос.статистики или др.организаций)

2.Документальный способ (источник – формы,заполняемые предприятиями на основе документов первичного учета)

3.Опрос: экспедиционный (устный опрос), саморегистрация, корреспонденческий (добровольно)

Организационные и программно-методологические вопросы статистического наблюдения.

Виды статистических группировок.

Группировка-это разделение совокупности на части по существенным признакам.

Группировка является важным статистическим методом обощения данных, основой для правильного исчисления статистических показателей.

Статистическая группировка делится по следующим признакам:

1)по целям и задачам

2)по числу группировок и признаков

3)по упорядовачиванию исх данных

Прежде чем проводить группировку необходимо определить группировочный признак или основание группировки.

Основанием группировки является признак, по которому совокупность делиться на группы.

Выбор основания группировки зависит от цели группировки и предварительного экономического анализа.

Основанием группировки может быть либо атребутив, либо коллическтвенный признак.

Атребутивные признаки выражают свойство явления(например:профессия)

Колличественные признаки-это кол-во;имеют цифровое выражение, относят в соответствие группы данных в соотв. с размерами признака.

Группировка единиц совокупности на основании их сходства и различия, называется классификация.

i=(Xmax-Xmin)/n,где i-велечина интервала, n-число групп

n=1+3.322lgN-число единиц совокупности

Группировка по целям и задачам:

1)Типологические группировки

Происходит разделение численности совокупности на классы и социальные группы.Примерами типологических группировок явл. группировки по формам собственности(госуд, муницип, частная)

2)Структурные группировки-разделениеоднородной в качественном отношении совокупности на группы, характер. строение совокупности и её структуру(Пример:промышленность по предприятиям, по объёмувыпуска продукции)

3)Аналитическая группировка-дает возможность установить связь между отдельнымипризнаками изучаемого соц.экономического явления.

Она помогает установить связь между двумя признаками.Зная характер связи можно определить её причину.

В статистике зависимые признаки называются результативными, а признаки, оказывающие влияние-факторными===>Группировочный признак-факторный, а характеризующий-результативный.

Метод аналитической группировки позволяет не тоько устанавливать связь между соц.эк. признаками, но и выявить факторы, влияющие на эту связь.

По числу группировок и признаков:

1)Простая группировка-данные по признаку и подсчёт итогов

2)Сложная шруппировка-группируем данные на отдельные группы и подсчитываем данные по отдельным группам и общие данные.

3)Комбинировання шруппировка-когда мы ведем ресчет по двум признакам

4)Многомерная группировка-группировка по 3 и более признакам

По упорядоч.

1)на основании первичных данных

2)на основании вторичных

Первый результат группировки является ряд распределения.Это упорядоченное распределение единиц совокупности на группы по изучаемому варьирующему признаку.

Ряд распределения характеризуется двумя элементами:

1)обознач. группы;2)численность единиц в группах

Численность каждой группы называется частотами ряда распределения.

Сумма всех частот определяет численность всей совокупности.

Численность групп, выр. в долях от общей численности единиц называется частностями и выражаются в %

Ряды распределения может быть образованы по атребутивному или количественному признак.

При группировке данных по атреб. признаку ряд распределения составляет отдельные группы, ук. их наименования и численность или удельный вес каждой группы.

При группировке данных по кол. признаку-ряды вариационные.

Различают вариационные ряды прерывные(дискретные), непрерывные(интервальные)

Вариационный ряд будет дискретным, если его группы составлены по признаку, изменяются прерывно, т.е. через определенное число(число детей)

Вариационный ряд будет непрерывным, если группировочный признак, составляющий основу группировки может принимать в определ. интервале различные значения.

Ряды распределения дополняются частностями и куммулятивными частотами(->численность единиц, образуемую от группы к группе путем суммирования предыдущих частот(с нарастающим итогом)

Цель группировок

Выделить важнейшие соц.эконом. типы явлений

Дать характеристику состава(структуры) совокупности по какому-либо признаку в пределах уже определенного соц.эконом типа

Выявить взаимосвязи в изменениях изучаемых признаков.

Вторичная группировка.

Ряды распределения.

Первичный результат группировки-ряд распределения, упорядоченное распределение единиц совокупности на группы по изучаемому варьирующему признаку. Характеризуется 2элементами: 1.обозначение группы и численность единиц в группе (вариант) 2.численнсть каждой группы наз частотами ряда распред.сумма всех частот определяет численность всей совокупности.

Ряды распределения могут быть образованы по атрибутивному или количественному признакам.

При группировке по атрибут признаку ряд распределения составляет отдельные группы, указ на их наименования и численность(удельный вес) каждой группы от…

При группировке данных по колич признаку получаются ряды,наз вариационными.

Различают вариационные ряды: 1.прерывные(дискретные)2.непрерывные(интервальные)

Вариац ряд будет дискретным,если варианты представлены целыми значениями признака.

Вариац ряд наз непрерывным,если варианты представлены числовыми интервалами.

Ряды распределения дополняются частостями и накопленными(кумулятивными) частотами.

Частость- относительная частота,представляемая долями(удельными весами) абсолютной численности единиц в общей совокупности.

Накопленная частота представл собой численность единиц,образуемую от группы к группе путем суммирования предыдущих частот(нарастающим итогом).

Частный случай атрибутивного признака-признак альтернативный,когда единицы совокупности либо имеют изучаемый признак,либо не имеют. В случае наличия количественного значения единице совокупности присваивается численное значение,равное единице, а при его отсутствии равное нулю.

Величина равных интервалов определяется i=(Xmax-Xmin)/n n-число групп

Структурные средние показатели-мода и медиана.Мода-наиболеечасто встречающееся значение признака. Медиана-значение признака единиц совокупности,стоящей в середине упорядоченного ряда


Похожая информация.