Наибольшее значение признака в интервале называется

3.3. Статистическая сводка и группировка.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных дан­ных и получение на этой основе сводной характеристики объек­та в целом при помощи обобщающих показателей, что достига­ется путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обоб­щению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, прису­щих изучаемому явлению в целом.

По глубине и точности обработки материала различают свод­ку простую и сложную.

Простая сводка - это операция по подсчету общих итогов по совокупности единиц наблюдения.

Сложная сводка - это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группи­ровки и сводки в виде статистических таблиц.

Проведение сводки необходимо осуществлять по следующим этапам:

• выбор группировочного признака;

• определение порядка формирования групп;

• разработка системы статистических показателей для харак­теристики групп и объекта в целом;

• разработка макетов статистических таблиц для представле­ния результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определен­ным, существенным для них признакам.

В соответствии с зада­чами группировки различают следующие ее виды: типологичес­кая, структурная, аналитическая.

Типологическая группировка - это расчленение разнород­ной совокупности на отдельные качественно однородные груп­пы и выявление на этой основе экономических типов явлений.

группировки должно осуществляться на основе анализа сущности изучаемого явления.

Структурной называется группировка, которая предназначе­на для изучения состава однородной совокупности по какому-либо варьирующему признаку.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической груп­пировкой.

В статистике признаки можно разделить на факторные и результативные. Факторными называются признаки, оказываю­щие влияние на изменение результативных. Результативными называются признаки, изменяющиеся под влиянием факторных. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.

Все рассмотренные группировки могут быть построены по какому-то одному или нескольким существенным признакам.

Группировка, в которой группы образованы по одному при­знаку, называется простой.

Сложной называется группировка, в которой расчленение совокупности на группы производится по двум и более призна­кам, взятым в сочетании (комбинации). Сначала группы форми­руются по одному признаку, затем эти группы делятся на под­группы по другому признаку, которые, в свою очередь, делятся по третьему признаку, и т. д. Итак, сложные группировки дают возможность изучить единицы совокупности одновременно по нескольким признакам.

При построении сложной группировки возникает вопрос о пос­ледовательности разбиения единиц объекта по видам признаков. Как правило, рекомендуется сначала производить группировку по атри­бутивным признакам, значения которых имеют ярко выраженные качественные различия, а затем - по количественным.

Построение группировки начинается с опреде­ления состава группировочных признаков.

Группировочным признаком называется признак, по кото­рому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака за­висят выводы статистического исследования.

В основание группировки могут быть положены как количе­ственные, так и атрибутивные признаки. Первые имеют число­вое выражение (объем торгов, возраст человека, доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, семейное положение, отраслевую принадлежность предприятия, его форму собственности и т. д.).

После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака. Например, группировка пред­приятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.

Определение числа групп можно осуществить и математи­ческим путем с использованием формулы Стерджесса:

(1)

где n - число групп;

N - число единиц совокупности.

Когда определено число групп, то следует определить интер­валы группировки.

Интервал - это значение варьирующего признака, лежащее в определенных границах.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значе­ние признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бы­вают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и спе­циализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

(2)

где хмах и xmin - максимальное и минимальное значения признака в совокуп­ности;

n - число групп.

Округление величины интервала может проводится только в большую сторону.

Если размах вариации признака совокупности велик и значе­ния признака варьируются неравномерно, то необходимо исполь­зовать группировку с неравными интервалами.

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя - у первого, нижняя - у после­днего.

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному в зависимости от того, непрерывный это признак или прерывный.

Если основанием группировки служит непрерывный признак, то может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Для того чтобы правильно отне­сти к той или иной группе единицу объекта, значение признака у которой совпадает с границами интервалов, можно использо­вать открытые интервалы. Решение об открытии нижней или верхней границы может быть принято самостоятельно.

Если в основании группировки лежит прерывный признак, то нижняя граница 1-го интервала равна верхней границе (i-1) ин­тервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала будут иметь вид (чел.): 100 - 150, 151 -200, 201 -300.

При наличии достаточно большого количества вариантов значений признака первичный ряд является трудно обозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т. е. расположение всех вариантов в возрастающем (или убывающем) порядке.

Например, стаж работы (годы) 22 рабочих бригады характеризуется следующими данными: 2, 4, 5, 5, 6, 6, 5, 6, 6, 7, 7, 8, 8, 9, 10, 11, 4, 3, 3, 4, 4, 5.

Ранжированный ряд, построенный по этим данным: 2, 3, 3, 4. 4, 4. 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11.

При рассмотрении первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее - частота повторения;- объем изучаемой совокупности).

Способы построения дискретных и интервальных рядов различны.

Для построения дискретного рядас небольшим числом вариантов выписываются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения варианта,. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, в другой - частоты. Построение дискретного вариационного ряда не составляет труда.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов (), необходимо установить оптимальное число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности. При группировке внутри однокачественной совокупности появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.

Проиллюстрируем построение интервального вариационного ряда по данным приведенного ранее примера распределения рабочих по стажу работы.

Для нашего примера, согласно формуле Стерджесса (3.1), при число групп. Зная число групп, определим интервал по формуле (2):

.

В результате получим следующий ряд распределения рабочих по стажу работы ():

... 2-4 4-6 6-8 8-10 10-12

… 3 8 6 3 2

Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет.

От группировок следует отличать классификацию. Класси­фикацией называется систематизированное распределение явле­ний и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительной чертой классификации является то, что в основу ее кладется атрибутивный признак. Классификации стан­дартны, устойчивы, т. е. остаются неизменными в течение дли­тельного периода времени, и, как правило, разрабатываются органами государственной и международной статистики.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Полигон используется при изображении дискретных вариа­ционных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. По­лученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломанную линию, называемую полигоном частот. Для замыкания полигона крайние точки (сле­ва и справа на ломанной линии) соединяют с точками на оси абсцисс и получают многоугольник. По данным табл. 1 пост­роим полигон (рис. 1).

Таблица 1

Распределение работников строительной фирмы «Скат»

по уровню дохода в январе 1998 г.

Группы работников, по уровню дохода,

руб.

Число работников,

Чел.

Удельный вес,

% к итогу

До 5 000

60

52,2

5 000 - 7 500

30

26,1

7 500 - 10 000

15

13,0

10 000 и более

10

8,7

Итого

115

100,0

Рис.1. Полигон распределения работников строительной фирмы "Скат"

по уровню дохода в январе 1998 г.

Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абс­цисс откладываются величины интервалов, а частоты изобража­ются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате мы получим гистограмму-график, на ко­тором ряд распределения изображен в виде смежных друг с другом столбиков.

Если середины верхних сторон прямоугольников соединить прямыми, то гистограмма может быть преобразована в полигон распределения (рис. 2).

Рис. 3.2. Гистограмма и полигон распределения работников строитель­ной фирмы «Скат» по уровню дохода в январе 1998 г.

Для графического изображения вариационных рядов может использоваться также кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показы­вают, сколько единиц совокупности имеют значения признака, не большие, чем рассматриваемое значение.

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат - накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломанную линию, т.е. кумуляту. Если при графическом изображении вари­ационного ряда в виде кумуляты оси поменять местами, то по­лучим огиву.

StudFiles.ru

Методические указания. Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях – это группировочный признак, число групп и интервал группировки.

Признак, по которому осуществляется группировка, называется основанием группировки, или группировочным признаком.Группировочные признаки могут быть атрибутивными и количественными.

Атрибутивные признаки регистрируются в виде текстовой записи (например, профессии рабочих, социальная группа населения). Количественные признаки имеют непосредственное числовое выражение (стаж работы, размер дохода). Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).

После определения основания группировки следует решить вопрос о количестве групп, на которое надо разбить исследуемую совокупность.

При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, т.е. градаций, видов, состояний у признака, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то разрабатывается классификация – систематизированное распределение явлений и объектов на определённые группы, классы, разряды на основании их сходства и различия.

При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т.е. может принимать только некоторые – чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака. При небольшом объёме совокупности не следует образовывать большое число групп, т.к. они будут малочисленными, а показатели, рассчитанные для таких групп не позволят получить адекватную характеристику исследуемого явления. В каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но ещё учитывать и особенности объекта и цель исследования.

При непрерывном изменении признак принимает, любые значения (например, стаж работы, возраст рабочих), поэтому группы ограничиваются значениями признака в интервале «от и до». На практике используют три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные.

Здесь необходимо учитывать несколько условий:

а) число групп детерминируется уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;

б) число групп должно отражать реальную структуру изучаемой совокупности;

в) не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы. Наличие пустых групп или малое число статистических единиц в них свидетельствуют о неправильном определении их числа.

Группировка с равными интервалами строится, если вариация признака проявляется в узких границах и распределение носит равномерный характер. Величина равного интервала определяется по формуле:

(1)

где R – размах вариации определяется как

разность между наибольшим и

наименьшим значением признака в совокупности R=Xmax - Xmin;

n – число групп.

Для расчёта величины интервала по этой формуле необходимо заранее установить число групп п (при числе наблюдений более 200 используют 10 – 15 групп). Возможен и другой способ установления числа групп. В этом случае используется формула Стерджесса:

n =1 + 3.322 lgN (2)

Где n – число групп;

N – число единиц совокупности.

Применение этой формулы целесообразно при большом числе единиц совокупности. При объёме совокупности 20-25 единиц число групп рекомендуется принимать п ≤ 4.

Формула Стерджесса позволяет определить величину интервала без предварительного установления числа групп:

(3)

В практических расчетах можно использовать следующие соотношения, полученные на основании формулы Стерджесса:

N 15-24 25-44 45-89 90-179 180-359 360 и более
n

Зависимость Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близко к нормальному, и при этом используются равные интервалы. Существует еще один способопределения количества выделяемых групп, он связан с применением среднеквадратичного отклонения равными и неравными σ: если величина (ширина) интервала равна 0,5σ , то выделяется 12 групп, если 2/3σ ,- то 9 групп, если σ – то 6 групп.

Прежде чем определять размах вариации, из совокупности следует исключить аномальные значения признака. Если максимальное или минимальное значение сильно отличается от смежных с ним значений, то для определения величины интервала используют не максимальное и минимальное значения, а значения, несколько превышающее минимум и несколько меньше максимума. Полученную по формуле (1) величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала – величина, имеющая один знак до запятой (например, 0,66; 1,375; 5,82), то полученные значения следует округлить до десятых и использовать в качестве шага интервала (соответственно 0,7; 1,4; 5,8). Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле (1.1), равна 12,785. Тогда это значение следует округлить до целого числа, т.е. до 13. В случае, когда рассчитанная величина интервала представляет собой трёхзначное, четырёхзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250. Чаще всего, полученное значение величины (ширины) интервала округляется в бóльшую сторону. При округлении в меньшую сторону последний интервал делают открытым.

В каждой выделенной группе рассчитываются следующие параметры:

- верхняя граница интервала;

- нижняя граница интервала;

- ширина интервала;

- середина i-го интервала.

Нижней границей интервала ( ) называется наименьшее значение признака в интервале - данной группе. Верхней границей интервала ( ) называется

наибольшее значение признака в интервале - данной группе.

Интервалы группировки бывают равными и неравными(прогрессивно возрастающими, прогрессивно убывающими, произвольными, специализированными). Если вариация признака проявляется в сравнительно узких границах, и распределение статистических единиц носит достаточно равномерный характер, то строят группировку с равными интервалами.

На основе рассчитанной ширины интервала последовательно определяются границы интервалов и . Определение границ начинается с первой группы. Ее нижняя граница принимается равной минимальному значению признака в совокупности , т. е. , а верхняя граница определяется как

Для второй группы нижняя граница принимается равной верхней границе первой группы, т. е. , верхняя определяется как

и т. д. В целом границы интервалов определяются формулами:

и

Середина интервала (центральная варианта) определяется как

полусумма верхней и нижней границ, т.е. по формуле:

Параметр середина интервала используется при расчете обобщающих

характеристик изучаемой совокупности.

Интервалы могут быть открытыми и закрытыми. Открытыеинтервалы – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.Закрытые интервалы – это те интервалы, у которых обозначены обе границы. Величина открытого интервала принимается равной величине смежного с ним закрытого интервала.

Основной задачей распределения единиц совокупности по группамявляется подсчет числа единиц, попавших в каждую из выделенных групп . При распределении единиц наблюдения по выделенным группам, особенно если группировочный признак является непрерывным, имеет место неопределенность: к какой группе относить единицы со значениями признака, совпадающими с границами интервалов? Для устранения неопределенности используют принцип единообразия – такие единицы включаются в группу, в которой нижняя граница совпадает со значением признака. Например, имеются группы предприятий по объему производства, млн. руб.:400 – 450; 450 – 500; 500 – 550; 550 – 600.

К какой группе следует отнести предприятия с объемом производства 500млн. руб.? В соответствии с принципом единообразия - ко второй группе. (Т.е нижняя граница – включительно, а верхняя – исключительно)

Группировка с неравными интервалами применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах. Неравные интервалы часто применяются в аналитических группировках. В этом случае интервалы выбираются так, чтобы число единиц в образовавшихся группах было достаточно велико, т.е. группы были одинаково заполнены.

В типологических группировках используются специализированные интервалы. Границы в них устанавливаются там, где начинается переход от одного качества к другому. Наметить точки перехода можно только на основе теоретического анализа, используя для выделения типов совокупность признаков, характеризующих различные стороны изучаемого явления.

Иногда имеющуюся группировку необходимо несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных, типичных групп или изменить границы прежних групп с тем, чтобы сделать группировку сопоставимой с другими. Такая переработка результатов первичной группировки называется перегруппировкой, или вторичной группировкой.

Для количественной характеристики каждой группы часто выполняют расчет структурных характеристик. Расчет заключается в определении для каждой группы удельного веса (доли) ее единиц в общем объеме статистической совокупности. Как и любая относительная величина, этот показатель может быть определен в виде коэффициентов, или в виде процентов:

или

Рассчитав такие доли для всех групп, мы получаем структуру изучаемой статистической совокупности, равную полному набору долей:

или

На основе анализа показателей структуры делаются соответствующие выводы. В выводах отражаются два положения:

Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

Каков характер изменения структуры явления в зависимости от изменения значения признака. Выводы должны быть сделаны обязательно, иначе пропадает смысл построения группировки.


studopedia.ru

/ теория статистики Шмойлова

СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ

2.3. Точность статистического наблюдения

Под точностью в статистике понимают степень соответствия данных, полученных

врезультате статистического наблюдения, реальным их значениям. Возникающие расхождения между данными статистического наблюдения и реальными значениями признака называются ошибками. Ошибки определяются как разность или как отношение между этими значениями. Как правило, ошибки возникают в результате следующих причин: ошибки при регистрации, ошибки при измерении. Следует отметить, что ошибки наблюдения наиболее опасны, поскольку их достаточно тяжело исправить, и они оказывают огромное влияние на дальнейшие расчеты.

Встатистике выделяют ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают вследствие неправильного установления фактов

впроцессе наблюдения, или ошибочной их записи, или того и другого вместе. Ошибки регистрации могут иметь место как при сплошном, так и при несплошном наблюдении. При несплошном наблюдении возникают так называемые ошибки репрезентативности, или как их еще называют ошибки представительности. Они заключаются в том, что значения признаков по отобранной выборочной совокупности не отражают реально существующей картины.

Взависимости от характера ошибки наблюдения бывают случайными и системати-

ческими.

Случайные ошибки возникают случайным образом, в результате опечаток, описок, оговорок и т.п. Например, при регистрации регистратор при записи даты рождения вместо 15 июня написал 15 июля. При достаточно большом числе наблюдений благодаря действию закона больших чисел эти ошибки более или менее взаимно погашаются.

Систематические ошибки наиболее опасны, поскольку действуют только в одном направлении и приводят к сильному искажению данных. Наиболее показательной систематической ошибкой являются ошибки при переписи населения, которые заключаются в том, что населению свойственно округлять свой возраст на цифры оканчивающиеся на 5 или 0. К этому же виду ошибок можно отнести сокрытие реальных размеров финансовых результатов производственно-хозяйственнойдеятельности экономическими субъектами, стремление респондентов указать заниженное значение своего возраста и т.п.

С целью выявления ошибок проводят контроль полученных материалов. С этой целью после проведения наблюдения весь собранный материал проверяют на полноту охвата объекта наблюдением и на качество заполнения формуляров и других документов наблюдения. В последнем случае используют два вида контроля: логический и арифметический.

При контроле полноты охвата объекта наблюдения устанавливается, от всех ли единиц совокупности, подлежащих наблюдению, получены данные. Если выявлена неполнота охвата объекта наблюдением, дальнейшие действия зависят от того, представляется возможным восполнение пробелов или нет.

Логический контроль состоит в сопоставлении между собой ответов на вопросы формуляра наблюдения и выяснения их логической совместимости. При обнаружении несовместимых ответов пытаются путем дальнейших сопоставлений с ответами на другие вопросы иликаким-либоиным путем установить, какой из ответов является неправильным.

Арифметический контроль состоит в проверке различных расчетов, результаты которых проведены в формуляре наблюдения, в частности, итогов, вычисления процентов, расчетов средних величин и т.п.

21

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Глава 3. Статистическая сводка и группировка

3.1. Задачи сводки и ее содержание

Важнейшим этапом исследования социально-экономическихявлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемогосоциально-экономическогоявления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают сводку простую и сложную. Простая сводка – это операция по подсчету общих итогов по совокупности еди-

ниц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка – это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Проведение сводки включает следующие этапы:

−выбор группировочного признака;

−определение порядка формирования групп;

−разработка системы статистических показателей для характеристики групп и объекта в целом;

−разработка макетов статистических таблиц для представления результатов сводки. По форме обработки материала сводка бывает:

−централизованная, когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца;

−децентрализованная, когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Госкомстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны.

3.2. Виды статистических группировок

Группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделитьсоциально-экономическиетипы, изучить структуру совокупности и проанализировать связи между отдельными признаками. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Спомощью метода группировок решаются следующие задачи:

•выделение социально-экономическихтипов явлений;

•изучение структуры явления и структурных сдвигов, происходящих в нем;

•выявление взаимосвязи и взаимозависимости между явлениями.

22

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основесоциально-экономическихтипов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемогосоциально-экономическогоявления.

Структурной называется группировка, которая предназначена для изучения состава однородной совокупности покакому-либоварьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и признаками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономическихявлений признаки необходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются другиерезультативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

•единицы статистической совокупности группируются по факторному признаку;

•каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные. Простой называется группировка, в которой группы образованы только по одному

признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

3.3. Принципы построения статистических группировок и классификаций

Построение статистических группировок осуществляется по следующим этапам:

1.Определение группировочного признака.

2.Определение числа групп.

3.Расчет ширины интервала группировки.

4.Определение признаков, которые в комбинации друг с другом будут характери-

зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

23

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.

Воснование группировки могут быть положены как количественные, так и качественные признаки. Количественные признаки – это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.).Качественные признаки отражают состояние единицы совокупности (пол, отраслевая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количестве групп, на которые небходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

Вслучае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупности и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака – максимальным (Xmax)

иминимальным (Xmin) и определяется по следующей формуле:

R=хmax-хmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизвести характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче-ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль- но-математическийспособ предполагает использование формулы Стерджесса:

n = 1 + 3,322 × lg N,

(3.1)

где:

n – число групп;

N – число единиц совокупности.

24

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ иσ, то совокупность делится, собственно, на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определенных гра-

ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале.Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

•равные и неравные;

•открытые и закрытые.

Взависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h =

R

=

xmax− xmin

(3.2)

n

n

где:

хmax, xmin – максимальное и минимальное значения признака в совокупности; n-числогрупп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

25

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до целого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающиеили прогрес-сивно-убывающиев арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi × q,

где:

а – константа: для прогрессивно-возрастающихинтервалов имеет знак «+», а припрогрессивно-убывающих– знак«-».

q – константа: для прогрессивно-возрастающих– больше «1»; для прогрессивноубывающих – меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000,1000-2000,2000-3500,т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50,50-100,100-150,150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень

26

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному,в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажныхработ, выполненных собственны-

ми силами (тыс. руб.): 1200-1400,1400-1600,1600-1800,1800-2000),то одно и то же зна-

чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. – соответственно второго и третьего и т.д., т.е. верхняя граница i – го интервала равна нижней границе (i+1) – го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажныхработ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объемустроительно-монтажныхработ преобразуются в следующие: до 1400,1400-1600,1600-1800,1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемомстроительно-монтажныхработ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-гоинтервала равна верхней границеi-1-гоинтервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид:100-150,151-200,201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами. Специализированные интервалы – это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономическихявлений на макроуровне часто применяют группировки, интервалы которых не будут нипрогрессивно-возрастающими,ни прогрес-сивно-убывающими.Такие интервалы называютсяпроизвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

27

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Пример.

Произведем группировку совокупности, включающей 30 банков Российской Феде-

рации (на 01.01.04 г.):

Номер

Капитал,

Рабочие активы,

Уставный фонд,

банка

млн. руб.

млн. руб.

млн. руб.

1

207,7

2,48

1,14

2

200,3

2,40

1,10

3

190,2

2,28

1,05

4

323,0

3,88

1,88

5

247,1

2,96

1,36

6

177,7

2,12

0,97

7

242,5

2,90

1,33

8

182,9

2,18

0,99

9

315,6

3,78

1,73

10

183,2

2,20

1,01

11

320,2

3,84

1,76

12

207,3

2,48

1,14

13

181,0

2,17

0,99

14

172,4

2,06

0,94

15

234,3

2,81

1,29

16

189,5

2,27

1,04

17

187,8

2,24

1,03

18

166,9

1,99

0,91

19

157,7

1,88

0,86

20

168,3

2,02

0,93

21

224,4

2,69

1,23

22

166,5

1,99

0,91

23

198,5

2,38

1,09

24

240,4

2,88

1,32

25

229,3

2,75

1,26

26

175,2

2,10

0,96

27

156,8

1,87

0,86

28

160,1

1,92

0,88

29

178,7

2,14

0,98

30

171,6

2,05

0,94

В качестве группировочного признака возьмем капитал банка. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле:

h =

X max− X min

=

323,0 −156,0

= 41,8

n

4

Обозначим границы групп:

1-ягруппа –156,0-197,8

2-ягруппа –197,8-239,6

3-ягруппа –239,6-281,4

4-ягруппа –281,4-323,2

28

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

После того, как определен группировочный признак – капитал, задано число групп

– 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.

Таблица 3.1.

Группировка коммерческих банков по величине капитала

Группы банков

Число

Капитал,

Активы,

Работающие

по величине капитала,

банков

млн. руб.

млн. руб.

активы,

млн. руб.

млн. руб.

А

1

2

3

4

156,0-197,8

17

2966,5

35,48

16,25

197,8-239,6

7

1501,8

17,99

8,25

239,6-281,4

3

730,0

8,74

4,01

281,4-323,2

3

958,8

11,5

5,37

Итого

30

6157,1

73,71

33,88

Структурная группировка коммерческих банков на основе данных таблицы 3.1 бу-

дет иметь вид:

Таблица 3.2.

Группировка коммерческих банков по величине капитала

(в %% к итогу)

Группы банков по величине

Число

Капитал

Активы

Работающие

капитала, млн. руб.

банков

активы

156,0-197,8

56,7

48,2

48,1

48,0

197,8-239,6

23,3

24,4

24,4

24,3

239,6-281,4

10,0

11,9

11,9

11,8

281,4-323,2

10,0

15,5

15,6

15,9

Итого

100,0

100,0

100,0

100,0

Из таблицы 3.2 видно, что в основном преобладают малые банки – 56,7%, на долю которых приходится 48,2% всего капитала. Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки.

Группировка коммерческих банков по величине капитала

Таблица 3.3.

Группы

Капитал,

Активы,

Работающие активы,

банков по

Число

млн. руб.

млн. руб.

млн. руб.

величине

капитала,

банков

всего

в среднем на

всего

в среднем на

всего

в среднем на

млн. руб.

один банк

один банк

один банк

156,0-197,8

17

2966,5

174,5

35,48

2,09

16,25

0,96

197,8-239,6

7

1501,8

214,5

17,99

2,57

8,25

1,18

239,6-281,4

3

730,0

243,3

8,74

2,91

4,01

1,34

281,4-323,2

3

958,8

319,6

11,5

3,83

5,37

1,79

Итого

30

6157,1

205,2

73,71

2,46

33,88

1,13

29

СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА

Величина капитала, все активы банка и работающие активы прямо зависят между собой, и чем крупнее банк, тем эффективнее управление работающими активами.

Мы рассмотрели примеры группировок по одному признаку. Однако в ряде случаев для решения поставленных задач такая группировка является недостаточной. В этих случаях переходят к группировке исследуемой совокупности по двум и более существенным признакам во взаимосвязи (комбинационной группировке).

Произведем группировку данных коммерческих банков по двум признакам: величине капитала и работающим активам.

Каждую группу и подгруппу охарактеризуем следующими показателями: число коммерческих банков, капитал, работающие активы.

Таблица 3.4.

Группировка коммерческих банков по величине капитала и работающим активам

Номер

Группы банков по

Подгруппы по величине

Число

Капитал,

Работающие

группы

величине капитала,

работающих активов, млн.

банков

млн. руб.

активы,

млн. руб.

руб.

млн. руб.

1

2

3

4

5

6

156,0-197,8

0,86-1,37

17

2966,5

16,25

1

1,37-1,88

-

-

-

Итого

17

2966,5

16,25

2

197,8-239,6

0,86-1,37

7

1501,8

8,25

1,37-1,88

-

-

-

Итого

7

1501,8

8,25

3

239,6-281,4

0,86-1,37

3

730,0

4,01

1,37-1,88

-

-

-

Итого

3

730,0

4,01

4

281,4-323,2

0,86-1,37

-

-

-

1,37-1,88

3

958,8

5,37

Итого

3

958,8

5,37

5

Всего по подгруппам

0,86-1,37

27

5198,3

28,51

1,37-1,88

3

958,8

5,37

Всего

30

6157,1

33,88

От группировок следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.

Отличительными чертами классификаций является:

•в их основе лежит качественный признак;

•классификации стандартны и устанавливаются органами государственной и международной статистики;

•классификации устойчивы, так как остаются неизменными в течение длительного периода времени.

Ряды распределения представляют собой простейшую группировку, в которой

каждая выделенная группа характеризуется только частотой.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, характеризующим состояние изучаемого явления и не имеющим числового выражения.

30

StudFiles.ru

Виды статистических группировок

Группировкой называется разбиение общей совокупности единиц объекта наблю­дения по одному или нескольким существенным признакам на однородные группы, раз­личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи­ровать связи между отдельными признаками. Группировки являются важнейшим стати­стическим методом обобщения статистических данных, основой для правильного исчис­ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

- выделение социально-экономических типов явлений;

- изучение структуры явления и структурных сдвигов, происходящих в нем;

- выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати­стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка - это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос­новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурной называется группировка, которая предназначена для изучения соста­ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна­ками, их характеризующими, называется аналитической группировкой.

В статистике при изучении связей социально-экономических явлений признаки не­обходимо делить на факторные и результативные.

Факторными называются признаки, под воздействием которых изменяются дру­гие результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе­ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

- единицы статистической совокупности группируются по факторному признаку;

- каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простой называется группировка, в которой группы образованы только по одному признаку.

Комбинационной называется группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на под­группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно­сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь­ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про­изводить группировку по атрибутивным признакам, значения которых имеют ярко выра­женные качественные различия.

Принципы построения статистических группировок и классификаций.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери­зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится раз­биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп­пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест­венные признаки. Количественные признаки - это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отрас­левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе­стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос­нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно­сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n

Часто группировка по количественному признаку имеет задачу отразить распреде­ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко­леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце­нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R = Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на­блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве­сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче­ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно­стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль­но-математический способ предполагает использование формулы Стерджесса:
n = 1 + 3,322 × lgN, (3.1)

где:

n – число групп;

N – число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово­купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред­него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп­ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп­ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето­дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал - это значения варьирующего признака, лежащие в определенных гра­ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

- равные и неравные;

- открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про­грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при­знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/n = Xmax – Xmin/n (3.2)

где:

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n - число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини­мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели­чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це­лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи­руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав­ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по­сле построения равных интервалов по изучаемому признаку образуются группы, содер­жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо­димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес­сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва­лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле­дующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi x q,

где:

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь­шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа­телю численности работающих, который варьирует от 500 человек до 3500 человек, неце­лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп­нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор ис­следователя в построении равных или неравных интервалов зависит от степени заполне­ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су­щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно­сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос­тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин­тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны­ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна­чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю­чать единицы наблюдения, значения признака у которых совпадают с границами интерва­лов. Например, во вторую или третью группу должна войти строительная фирма с объе­мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про­тивном случае - ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель­ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди­ниц совокупности, значения которых являются граничными, к той или иной группе реша­ется на основе анализа последнего открытого интервала.

Возможны два случая обозначе­ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин­тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интерва­лы - это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло­виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес­сивно-убывающими. Такие интервалы называются произвольнымии, как правило, ис­пользуются при группировке предприятий, например, по уровню рентабельности.

studopedia.ru

Читайте также