|
Сводка и группировка статистических данных, их роль в анализе информации
Понятие статистической сводки и группировки
В результате статистического исследования собирается статистическая информация, которая впоследствии систематизируется и обобщается, т.о. вторым этапом исследования является сводка и группировка данных.
Статистическая сводка – систематизация единичных фактов, позволяющая перейти к обобщающим показателям изучаемой совокупности и ее частям, а также осуществить анализ и прогнозирование изучаемых явлений и процессов.
Различают сводку в широком и узком смысле слова.
Сводка в узком смысле слова, т.е. в простом представляет собой ранжирование, т.е. упорядочение в порядке возрастания или убывания данных, а также суммирование по всем единицам наблюдения.
Сводка в широком смысле предполагает разделение на качественно однородные группы, для характеристики этих групп по ряду существенных признаков.
Элементами сводки в широком смысле являются:
программа сводки;
исчисление обобщающих показателей по каждой группе и по всей совокупности в целом;
оформление конечных результатов сводки в статистические таблицы или графики.
Группировка – объединение единицы совокупности в качественно однородные группы для изучения структуры совокупности, связи между признаками для характеристики различных типов изучаемых явлений.
Всякая группировка имеет основной группировочный признак – факторный, который служит основанием для распределения признаков по группам, а для характеристики по взаимосвязи между отдельными явлениями и процессами добавляются значения результативного признака, который зависит от факторного. От цели экономического анализа и от исходной информации – группировки делят:
по содержанию – на аналитические и типологические;
по структуре;
по строению – первичные и вторичные.
Аналитические группировки имеют количественно выраженный признак.
В типологических группировках признак не имеет количественного значения, а означает какое-то понятие, т.е. тип.
Структурные группировки исследуют цель определения структуры изучаемого явления и помогают выявить соответствие входящих в изучаемую совокупность составных частей. Например, структура затрат на производство. По строению первичные группировки представляют собой группировки по исходным данным, вторичные группировки – это перегруппировки, с целью выявить более четкие закономерности развития изучаемых явлений.
При построении группировки следует соблюдать:
в основу группировки необходимо положить наиболее существенные признаки, отвечающие задаче исследования и учитывающие особенности изучаемого явления;
необходимо брать не один, а несколько группировочных признаков, что позволяет глубже охарактеризовать сложные явления;
выбор числа групп определяется группировочным признаком с учетом степени его варьирования (изменения, колебания), но предпочтительно брать нечетное число.
Основные приемы построения и выполнения группировок
Если для построения группировки используется только один признак, то такую группировку называются простой, если группировка проводится по нескольким признакам, ее называют сложной. Сложная группировка бывает или комбинационная, или многомерная.
Комбинационная группировка выполняется последовательно: группы, выделенные по одному признаку, затем выделяются в подгруппы по другому признаку, которые, в свою очередь, могут выделяться по следующему другому признаку. В этом случае число групп будет равно произведению числа выделенных групп на число группировочных признаков. Процедура определения оптимального числа групп основана на применении формулы Стерджесса:
(1)
где n - число групп;
N - число единиц совокупности.
Из формулы видно, что выбор числа групп зависит от объема совокупности. Если групп оказывается много, и они включают малое число единиц, то групповые показатели могут стать ненадежными. Поэтому альтернативой комбинационной группировке является многомерная группировка, которая осуществляется по комплексу признаков одновременно. Ее применение требует использования электронной вычислительной техники. С помощью специально разработанных электронных программ формируются однородные группы на основании близости по всему комплексу признаков.
Определение числа групп тесно связано с понятием величина интервала: чем больше число групп, тем меньше величина интервала, и наоборот. Интервал - разница между максимальным и минимальным значениями признака в каждой группе. Он определяет количественные границы групп, что для статистической практики имеет большое значение, особенно когда нужно образовать качественно однородные группы.
Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала - разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница (у первого - верхняя, у последнего - нижняя), то речь идет об открытых интервалах. Если у интервала имеются и нижняя, и верхняя границы, то речь идет о закрытых интервалах. Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные.
Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Если можно заранее установить определенное количество групп, то величину равного интервала можно вычислить по формуле
(2)
где i - величина равного интервала;
xmax , xmin - наибольшее и наименьшее значения признака;
n - число групп.
Если не требуется предварительного установления числа групп, то используется другой способ определения величины равного интервала - по формуле Стерджесса:
(3)
Если величина равного интервала рассчитывается по данной формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом.
В статистической практике чаще применяются неравные интервалы (постепенно возрастающие или постепенно убывающие). При этом исследуемая совокупность делится на группы примерно равного заполнения с большим числом единиц. Неравные интервалы могут использоваться, например, в таких случаях:
при исследовании группировки с применением нескольких признаков, дающих возможность составить несколько подгрупп, где требуются уже и более длинные и более короткие интервалы;
при образовании крупных групп с новым качеством на базе мелких групп при условии сохранения их однородности, что приводит к увеличению интервалов.
В статистической практике используются также специализированные интервалы. Интервалы называют специализированными, если речь идет об установлении границ интервала в группах, схожих по типу и по признаку, но имеющих отношение, скажем, к разным отраслям производства.
|