Вариационный ряд. Статистическое распределение выборки. Основные характеристики вариационного ряда

Различные выборочные значения назовемвариантами ряда значений и обозначим: х 1 , х 2 , …. Прежде всего произведем ранжирование вариантов, т.е. расположение их в порядке возрастания или убывания. Для каждого варианта указывается свой вес, т.е. число, которое характеризует вклад данного варианта в общую совокупность. В качестве весов выступают частоты или частости.

Частотой n i варианта х i называется число, показывающее сколько раз встречается данный вариант в рассматриваемой выборочной совокупности.

Частостью или относительной частотой w i варианта х i называется число, равное отношению частоты варианта к сумме частот всех вариантов. Частость показывает, какая часть единиц выборочной совокупности имеет данный вариант.

Последовательность вариантов с соответствующими им весами (частотами или частостями), записанная в порядке возрастания (или убывания), называется вариационным рядом .

Вариационные ряды бывают дискретными и интервальными.

Для дискретного вариационного ряда задаются точечные значения признака, для интервального – значения признака задаются в виде интервалов. Вариационные ряды могут показывать распределение частот или относительных частот (частостей), в зависимости от того, какая величина указывается для каждого варианта – частота или частость.

Дискретный вариационный ряд распределения частот имеет вид:

Частости находятся по формуле , i = 1, 2, …, m .

w 1 + w 2 + … + w m = 1.

Пример 4.1. Для данной совокупности чисел

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

построить дискретные вариационные ряды распределения частот и частостей.

Решение . Объем совокупности равен n = 10. Дискретный ряд распределения частот имеет вид

Аналогичную форму записи имеют интервальные ряды.

Интервальный вариационный ряд распределения частот записывается в виде:

Сумма всех частот равна общему числу наблюдений, т.е. объему совокупности: n = n 1 + n 2 + … + n m .

Интервальный вариационный ряд распределения относительных частот (частостей) имеет вид:

Частость находится по формуле , i = 1, 2, …, m .

Сумма всех частостей равна единице: w 1 + w 2 + … + w m = 1.

Наиболее часто на практике применяются интервальные ряды. Если статистических выборочных данных очень много и их значения отличаются друг от друга на сколь угодно малую величину, то дискретный ряд для этих данных будет достаточно громоздким и неудобным для дальнейшего исследования. В этом случае применяют группировку данных, т.е. промежуток, содержащий все значения признака, разбивают на несколько частичных интервалов и, подсчитав частоту для каждого интервала, получают интервальный ряд. Запишем более подробно схему построения интервального ряда, предположив, что длины частичных интервалов будут одинаковыми.

2.2 Построение интервального ряда

Для построения интервального ряда нужно:

Определить число интервалов;

Определить длину интервалов;

Определить расположение интервалов на оси.

Для определения числа интервалов k существует формула Стерджеса, по которой

где n - объем всей совокупности.

Например, если имеется 100 значений признака (вариант), то рекомендуется для построения интервального ряда взять число интервалов равным интервалам.

Однако очень часто на практике число интервалов выбирает сам исследователь, учитывая, что это число не должно быть очень большим, чтобы ряд не был громоздким, но и не очень маленьким, чтобы не потерять некоторых свойств распределения.

Длина интервала h определяется по следующей формуле:

где x max и x min - это соответственно самое большое и самое маленькое значения вариантов.

Величину называют размахом ряда.

Для построения самих интервалов поступают по-разному. Один из самых простых способов заключается в следующем. За начало первого интервала принимают величину
. Тогда остальные границы интервалов находятся по формуле . Очевидно, что конец последнего интервала a m+1 должен удовлетворять условию

После того как найдены все границы интервалов, определяют частоты (или частости) этих интервалов. Для решения этой задачи просматривают все варианты и определяют число вариант, попавших в тот или иной интервал. Полное построение интервального ряда рассмотрим на примере.

Пример 4.2. Для следующих статистических данных, записанных в порядке возрастания, построить интервальный ряд с числом интервалов, равным 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Решение. Всего n =50 значений вариантов.

Число интервалов задано в условии задачи, т.е. k =5.

Длина интервалов равна
.

Определим границы интервалов:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Для определения частоты интервалов посчитываем число вариантов, попавших в данный интервал. Например, в первый интервал от 2,5 до 19,5 попадают варианты 11, 12, 12, 14, 14, 15. Их число равно 6, следовательно, частота первого интервала равна n 1 =6. Частость первого интервала равна . Во второй интервал от 19,5 до 36,5 попадают варианты 21, 21, 22, 23, 25, число которых равно 5. Следовательно, частота второго интервала равна n 2 =5, а частость . Найдя аналогичным образом частоты и частости для всех интервалов, получим следующие интервальные ряды.

Интервальный ряд распределения частот имеет вид:

Сумма частот равна 6+5+9+11+8+11=50.

Интервальный ряд распределения частостей имеет вид:

Сумма частостей равна 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

При построении интервальных рядов, в зависимости от конкретных условий рассматриваемой задачи, могут применяться и другие правила, а именно

1. Интервальные вариационные ряды могут состоять из частичных интервалов разной длины. Неравные длины интервалов позволяют выделить свойства статистической совокупности с неравномерным распределением признака. Например, если границы интервалов определяют численность жителей в городах, то целесообразно в данной задаче использовать неравные по длине интервалы. Очевидно, что для небольших городов имеет значение и небольшая разница в числе жителей, а для больших городов разница в десятки и сотни жителей не имеет существенного значения. Интервальные ряды с неравными длинами частичных интервалов исследуются, в основном, в общей теории статистики и их рассмотрение выходит за рамки данного пособия.

2. В математической статистике иногда рассматривают интервальные ряды, для которых левую границу первого интервала полагают равной –∞, а правую границу последнего интервала +∞. Это делается для того, чтобы приблизить статистическое распределение к теоретическому.

3. При построении интервальных рядов может оказаться, что значение какого-то варианта совпадает в точности с границей интервала. Лучше всего в этом случае поступить следующим образом. Если такое совпадение только одно, то считать, что рассматриваемый вариант со своей частотой попал в интервал, находящийся ближе к середине интервального ряда, если таких вариантов несколько, то либо все их отнести к правым от этих вариант интервалам, либо все – к левым.

4. После определения числа интервалов и их длины, расположение интервалов можно производить и по другому способу. Находят среднее арифметическое всех рассматриваемых значений вариантов х ср. и строят первый интервал таким образом, чтобы это среднее выборочное находилось бы внутри какого-то интервала. Таким образом, получаем интервал от х ср. – 0,5h до х ср.. + 0,5h . Затем влево и вправо, прибавляя длину интервала, строим остальные интервалы до тех пор, пока x min и x max не попадут соответственно в первый и последний интервалы.

5. Интервальные ряды при большом числе интервалов удобно записывать вертикально, т.е. интервалы записывать не в первой строке, а в первом столбце, а частоты (или частости) во втором столбце.

Выборочные данные могут рассматриваться как значения некоторой случайной величины Х . Случайная величина имеет свой закон распределения. Из теории вероятностей известно, что закон распределения дискретной случайной величины можно задать в виде ряда распределения, а непрерывной – с помощью функции плотности распределения. Однако существует универсальный закон распределения, который имеет место и для дискретной и для непрерывной случайных величин. Этот закон распределения задается в виде функции распределения F (x ) = P (X <x ). Для выборочных данных можно указать аналог функции распределения – эмпирическую функцию распределения.

Похожая информация.

Ряды, построенные по количественному признаку , называются вариационным .

Ряды распределений состоят из вариантов (значений признака) и частот (численности групп). Частоты, выраженные в виде относительных величин (долей, процентов) называются частостями . Сумма всех частот называется объёмом ряда распределения.

По виду ряды распределения делятся на дискретные (построены по прерывным значениям признака) и интервальные (построены на непрерывных значениях признака).

Вариационный ряд представляет собой две колонки (или строки); в одной из которых приводятся отдельные значения варьирующего признака, именуемые вариантами и обозначаемые Х; а в другой – абсолютные числа, показывающие сколько раз (как часто) встречается каждый вариант. Показатели второй колонки называются частотами и условно обозначают через f. Еще раз заметим, что во второй колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуются частостями и условно обозначают через ω Сумма всех частостей в этом случае равна единице. Однако частоты можно выражать и в процентах, и тогда сумма всех частостей дает 100%.

Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд именуют дискретным.

Для непрерывных признаков вариационные ряды строятся как интервальные , то есть значения признака в них выражаются «от… до …». При этом минимальны значения признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей.

Интервальные вариационные ряды строят и для дискретных признаков, варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.

Рассмотрим как определяется величина равных интервалов. Введем следующие обозначения:

i – величина интервала;

- максимальное значение признака у единиц совокупности;

– минимальное значение признака у единиц совокупности;

n – число выделяемых групп.

, если n известно.

Если число выделяемых групп трудно заранее определить, то для расчета оптимальной величины интервала при достаточном объеме совокупности может быть рекомендована формула, предложенная Стерджессом в 1926 году:

n = 1+ 3.322 lg N, где N – число единиц в совокупности.

Величина неравных интервалов определяется в каждом отдельном случае с учетом особенностей объекта изучения.

Статистическим распределением выборки называют перечень вариант и соответствующих им частот (или относительных частот).

Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты, а во второй - соответствующие этим вариантам частоты ni , или относительные частоты Pi .

Статистическое распределение выборки

Интервальными называются вариационные ряды, в которых значения признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

Интервальные ряды распределения строятся по непрерывным количественным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

Интервальный ряд можно представить статистическим распределением выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, попавших в этот интервал.

При группировке по количественным непрерывным признакам важное значение имеет определение размера интервала.

Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.

Модой называют варианту, которая имеет наибольшую частоту.

Вариационные ряды, их элементы.

Исследователь, интересующийся тариф-ным разрядом рабочих механиче-
ского цеха, провел опрос 100 рабочих. Рас-положим наблюдавшиеся значения
приз-нака в порядке возрастания. Эта операция называется ранжированием ста-
тистичес-ких данных. В результате получим сле-дующий ряд, который называет-
ся ран-жированным:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

Из ранжированного ряда следует, что ис-следуемый признак (тарифный
разряд) принял шесть различных значений: 1, 2, 3, 4, 5 и 6.

В дальнейшем различные значения приз-нака будем называть варианта-
ми, а под варьированием - понимать изменение значений признака.

В зависимости от принимаемых призна-ком значений, признаки делятся
на диск-ретно варьирующие и непрерывно ва-рьирующие.

Тарифный разряд - это дискретно ва-рьирующий признак. Число, показы-
ваю-щее, сколько раз встречается вариант х в ряде наблюдений, называется час-
тотой варианта m x .

Вместо частоты варианта х можно рас-сматривать её отношение к общему
числу наблюдений n, которое называется часто-стью варианта и ее отношение обоз-начается w x .

w x =m x /n=m x /åm x

Таблица, позволяющая судить о распре-делении частот (или частостей) между вариантами, называется дискретным вариационным рядом.

Наряду с понятием частоты использу-ют понятие накопленной частоты,
кото-рую обозначают т x нак. Накопленная час-тота показывает, во скольких на-
блюдени-ях признак принял значения, меньшие за-данного значения х. Отноше-
ние накоп-ленной частоты к общему числу наблю-дений n, называют накоплен-
ной часто-стью и обозначают w x нак . Очевидно, что

w x нак =m x нак /n=m x нак /åm x .

Накопленные частоты (частости_ для дискретного вариационного ряда, вычес-лены в следующей таблице:

Х	m x	m x нак	w x нак
		0+4=4	0,04
		4+6=10	0,10
		10+12=22	0,22
		22+16=38	0,38
		38+44=82	0,82
		82+18=100	1,00
Выше 6

Пусть необходимо исследовать выработку на одного рабочего – станоч-ника механического цеха в отчётном году в процентах к предыдущему году. Здесь исследуемым признаком х является выработка в отчётном году в процентах к предыдущему. Это непрерывно варьиру-ющий признак. Для выяления характерных черт варьирования значений признака обьединим в группы рабочих, у которых величина выработки колеблется в пределах 10%. Сгруппированные данные представим в таблице:

Иссл. Признак х	Кол-во рабочих m	Доля рабочих w	Накоплен. частота m x нак	w x нак
80-90		8/117		8/117
90-100		15/117	8+15=23	23/117
100-110		46/117	23+46=69	69/117
110-120		29/117	69+29=98	98/117
120-130		13/117	98+13=111	111/117
130-140		3/117	111+3=114	114/117
140-150		3/117	114+3=117	117/117
å

В таблице частоты m показывают, во скольких наблюдениях признак принял значения, принадлежащие тому или иному интервалу. Такую частоту называют интервальной, а отношение её к общему числу наблюдений – интервальной частостью w. Таблицу, позволяющую судить о распределении частот между интервалами варьирования значений признака, называют интерва-льным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за не-
прерывно варьирующим признаком, а также за дис-кретно варьирующим, если
велико число наблюдавших вариантов. Дискретный ва-риационный ряд строят
только для дис-кретно варьирующего признака

Иногда интервальный вариационный ряд условно заменяют дискретным.
Тогда се-рединное значение интервала принимают за вариант х, а соответст-
вующую интер-вальную частоту - за т х.

Для определения оптимального постоян-ного интевала h часто используют формулу Стерджесса:

h =(x max – x min)/(1+3.322*lg n ).

Построение инт.вар.рядов

Частоты m показывают, во скольких наблюдениях признак принял значения, принадлежащие тому или иному интервалу. Такую частоту называют интервальной, а отношение ее к общему числу наблюдений - интервальной частостью w. Таблицу, позволяющую судить о распределении частот (или частостей) между интервалами варьирования значений признака, называют интервальным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за непрерывно варьирующим признаком, а также за дискретно варьирующим, если велико число наблюдавших вариантов. Дискретный вариационный ряд строят только для дискретно варьирующего признака.

Иногда интервальный вариационный ряд условно заменяют дискретным. Тогда серединное значение интервала принимают за вариант х, а соответствующую интервальную частоту – за mx

Для построения интервального вариационного ряда необходимо определить величину интервала, установить полную шкалу интервалов и в соответствии с ней сгруппировать результаты наблюдений.

Для определения оптимального постоянного интервала h часто используют формулу Стерджесса:

h = (xmax - xmin) /(1+ 3,322 lg n) .

где xmax xmin - соответственно максимальный и минимальный варианты. Если в результате расчетов h окажется дробным числом, то за величину интервала следует взять либо ближайшее целое число, либо ближайшую несложную дробь.

За начало первого интервала рекомендуется принять величину a1=xmin-h/2; начало второго интервала совпадает с концом первого и равно а2=а1 +h; начало третьего интервала совпадает с концом второго и равно a3=a2 + h. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет больше хmах. После установления шкалы интервалов следует сгруппировать результаты наблюдений.

5) Понятие, формы выражения и виды статитстических показателей.

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определённости. Качественная определё-нность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью.

Система статистических показателей – это совокупность взаимосвязанных пока-зателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи.

В отличие от признака статистический показатель получается расчётным путём. Это могут быть простой подсчёт единиц совокупности, суммирование их значений признака, сравнение 2 или нескольких величин или более сложные расчёты.

Различают конкретный статистический показатель и показатель-категорию.

Конкретный статистический показа-тель характеризует размер, величину изучаемого явления или процесса в дан-ном месте и в данное время. Однако в теоретических работах и на этапе проектирования статистического наблю-дения также оперируют и абсолютными показателями или показателями-катего-риями.

Показатели-категории отражают сущ-ность, общие отличительные свойства конкретных статистических показателей одного и того же вида без указания места, времени и числового значения. Все статистические показатели делятся по охвату единиц совокупности на индивидуальные и свободные, а по форме – на абсолютные, относительные и сред-ние.

Индивидуальные показатели хара-ктеризуют отдельный объект или отдельную единицу совокупности – предприятие, фирму, банк и т. п. Приме-ром может служить численность промы-шленно-производственного персонала предприятия. На сонове соотнесения двух индивидуальных абсолютных показателей, характеризующих один и тот же объект или единицу, получают индивидуальный относительный показа-тель.

Сводные показатели в отличие от индивидуальных характеризуют группу единиц, представляющую собой часть статистической совокупности или всю совокупность в целом. Эти показатели подразделяются на объемные и рас-чётные.

Объёмные показатели получают путём сложения значений признака отдельных единиц совокупности. Полученная величина, называемая объёмом признака, может выступать в качестве объёмного абсолютного показателя, а может сравниваться с другой объёмной абсолютной величиной или объёмом совокупности. В последних 2 случаях получают объёмный относительный и объёмный средний показатели.

Расчётные показатели , вычисляемые по различным формулам, служат для решения отдельных статистических задач анализа – измерение вариации, характе-ристики структурных сдвигов, оценки взаимосвязи и т. д. Они также делятся на абсолютные, относительные или средние.

В эту группу входят индексы, коэффиценты тесноты связи, ошибки выборки и прочие показатели.

Охват единиц совокупности и форма выражения являются основными, но не единственными классификационными признаками статистических показателей. Важным классификационным признаком также является временный фактор. Соц-экономические процессы и явления находят своё отражение в статистических показателях либо по состоянию на определённый момент времени, как правило, на определённую дату, начало или конец месяца, года, либо за определённый период – день, неделю, месяц, квартал, год. В первом случае показатели являются моментными, во втором – интервальными.

В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъек-тные показатели . Если первые характеризуют только один объект, то вторые получают в результате сопоставления двух величин, относящихся к разным объектам.

С точки зрения пространственной определённости статистические показатели подразделяются на общетерриториальные , характеризую-щие изучаемый объект или явление в це-лом по стране, региональные и мест-ные , относящиеся к какой-либо части территории или отдельному объекту.

6) Виды и взаимосвязь относительных показателей .

Относительный показатель представляет собой результат деления одного абсолют-ного показателя на другой и выражает соотношение между количественными характеристиками соц-экономических процессов и явлений. Поэтому пог отношению к абсолютным показателям относительные показатели или показатели в форме относительных величин являются производными.

При расчёте относительного показателя абсолютный показатель, находящийся в числителе получаемого отношения, назы-вается текущим или сравниваемым . Показатель же, с которым производится сравнение и который находится в знаменателе, называется основанием или базой сравнения. Относительные показатели могут выражаться в процентах, промилле, коэффицентах или могут быть именованными числами.

Все используемые на практике относительные показатели делятся на:

·динамики; ·плана; ·реализации плана; ·структуры; ·координации; ·интенсив-ности и уровня эк-го развития; ·сравнения.

Относительный показатель данамики пред-ет собой отношение уровня исследуемого процесса или явления за данный период времени к уровню этого же процесса или явления в прошлом.

ОПД=текущий показатель/предшеств. Или базисный показатель.

Рассчитанная таким образом величина показывает, во сколько раз текущий уровень превышает предшествующий или какую долю от последнего составля-ет. Если данный показатель выражен кратным соотношением, он называется коэффициентом роста , при домножении этого коэффициента на 100% получают темп роста.

Относительный показатель структуры представляет собой соотношение структурных частей изучаемого объекта и их целого. Относительный показатель структуры выражается в долях единицы или в процентах. Рассчитанные величины (d i), соответсвенно называемые долями или удельными весами, показывают, ка-каой долей обладает или каокй удельный вес имеет i-ая часть в общем итоге.

Относительные показатели координа-ции характеризуют соотношение отдель-ных частей целого между собой. При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-либо другой точки зрения. В результате получают, сколько единиц каждой структурной части приходится на 1 единицу базисной структурной части.

Относительный показатель интенсив-ности характеризует степень распро-странения изучаемого процесса или явления в присущей ему среде. Этот показатель исчисляется, когда абсолютная величина оказывается недостаточной для формулировки обоснованных выводов о масштабах явления, его размерах, насыщенности, плотности распространения. Он может выражаться в процентах, промилле или быть именованной величиной. Разновид-ностью относительных показателей инте-нсивности являются относительные показатели уровня эко-го развития, характеризующие производство продукции в расчёте на душу населения и играющие важную роль в оценке развития экономики государства. По форме выражения эти показатели близки средним показателям, что нередко приводит к их смешиванию или отждествлению. Разница между ними заключается лишь в том, что при расчётесреднего показателя мы имеем дело с совокупностью единиц, каждая из которых является носителем осредняе-мого признака.

Относительный показатель сравнения представляет собойсоотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, области, районы и т. д.)

Показатели вариации

Изучение вариации (изменение значений признака в пределах совокупности) имеет большое значение в статистике и социально-экономических исследованиях вообще. Абсолютные и относительные показатели вариации, характеризующие колеблемость значений варьирующего признака, позволяют, в частности, измерить степень связи и взаимосвязи, оценить степень однородности совокупности, типичности и устойчивости средней, определить величину возможной погрешности выборочного наблюдения.

К абсолютным показателям вариации относят размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и квартальное отклонение.

Размах вариации показывает, на какую величину изменяется значение количественно варьирующего признака

R=xmax-xmin, где xmax(xmin) -максимальное (минимальное) значение признака в совокупности (в ряду распределения).

Среднее линейное отклонение d определяется как средняя величина из отклонений вариантов признака от средней в первой степени, взятых по модулю:

Среднее линейное отклонение сравнительно редко применяется для оценки вариации признака. Обычно вычисляются дисперсия и среднее квадратическое отклонение .

Если необходимо сравнить колеблемость нескольких признаков в одной совокупности или же одного и того же признака в нескольких совокупностях с различными показателями центра распределения, то пользуются относительными показателями вариации.

К ним относятся следующие показатели:

1. Коэффициент осцилляции:

2. Относительное линейное отклонение:

3. Коэффициент вариации:

4. Относительный показатель квартильной вариации:

Наиболее часто применяемый показатель относительной вариации - это коэффициент вариации. Этот показатель используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Совокупность считается однородной, если <0,33.

Формы.

1. Стат. отчетность- это такая орг-я форма при которой единицы набл-я предост-т сведения о своей деят-ти в виде формуляров, регламентир-го аппарата.

Особенность отчетности сост-т в том, что она обязат-но обоснован, обяз-на в исполнении и юр-ки подтверждена подписью руководителя или ответственного лица.

2. Специально организованное наблюдение- наиболее яркий и простой пример этой формы набл-я явл. перепись. Перепись как правило проводится через равные промежутки времени, одновременно на всей исслед-й территории в одно и тоже время.

Росс-ми органами статистики проводятся переписи населения отдельных видов п/п и орг-ций, матер-ых ресурсов, многолетних насаждений, объектов НЗ строительства и т.д.

4. Регистровая форма наблюдения- основана на ведении стат-го регистра. В регистре каж. единица набл-я хар-ся рядом показателей. В отечественной статистической практике наиб-ее распространение получили регистры нас-я и регистры п/п.

Регистрация населения – ведется органами ЗАГСа

Регистрация п/п – ЕГРПО вед.орг. статистики.

Виды.

можно разбить на группы по след. признакам:

а) по времени регистрации

б) по охвату единиц сов-ти

По времени рег. они бывают:

Текущие (непрер-е)

Прерывное (периодические и единовременные)

При тек. набл. изменение явлений и процессов фиксируется по мере их поступления (регистрация рождения, смерти, брака, развода и т.д.)

Периодич. набл. проводится через опр. промежутки времени (N перепись населения каждые 10 лет)

Единоврем. набл. проводится либо не регулярно, либо всего один раз (референдум)

По охвату ед. сов-ти стат-е набл. бывают:

Сплошными

Несплошными

Сплошное набл. предст-ет собой обслед-е всех единиц сов-ти

Несплошное набл. предполагает ч. обсл-ю подлежит лишь часть исслед-ий сов-ти.

Сущ-ет несколько видов несплошного набл-я:

Метод осн. массива

Выборочное (самостоятельно)

Монографическое

Этот метод х-ся тем, что отбираются как правило самые существ-е, обычно самые крупные ед. сов-ти в кот. сосред-на значит. часть всех наблх признаков.

При монографическом набл-ии тчательному ан. подвергаются отд. ед. изуч-ой сов-ти или м.б. либо типичные для данной сов-ти ед. либо предст-е собой к-либо новые разновидности явлений.

Многогр-е набл. проводится с целью выявления либо намечающихся тенденции в развитии данного явления.

Способы

Непосредственное набл-е

Документарное набл.

Непосредственным наз. такое набл. при кот. сами регистраторы путем непоср-го замера, подсчета, сдерживания уст-т факт подлежащий рег-ии и на этом основании делают запись в формуляре.

Документарный способ набл. основан на исп-ии в качестве источников инф-ции разл-х док-ов как правило учетного х-ра (т.е. стат. отчетность)

Опрос- это способ убеждения при кот. необходимые сведения получ-т со слов респондента (т.е. опрашиваемого) (устный, корреспондентский, анкетный, явочный и т.д.)

Определение ошибок выборки.

В процессе проведения выборочного наблюдения выделяют два вида ошибок: регистрации и репрезентативности.

Ошибки регистрации – отклонения между значением показателя, получен-ного при проведении статистического наблюдения, и действительным его значением. Эти ошибки могут появляться и при сплошном, и при несплошном наблюдении. Ошибки регистрации возни-кают из-за неправильных или неточных сведений. Источниками этого вида оши-бок могут быть непонимание сущности вопроса, невнимательность регистратора, пропуск или повторный счёт отдельных единиц наблюдения. Ошибки регистра-ции подразделяются на систематичес-кие , обусловленные причинами, действу-ющими в каком-либо одном направлении и сглаживающими результаты обследова-ния (округление цифр), и случайные , яв-ляющиеся результатом действия различ-ных случайных факторов (перестановка местами соседних цифр). Случайные ошибки имеют разную направленность и при достаточно большом объёме обследуемой совокупности взаимно погашаются.

Ошибки репрезентативности – откло-нения значений показателя обследован-ной совокупности от его значения в ис-ходной совокупности. Эти ошибки также подразделяются на систематические , по-являющиеся вследствие нарушения принципов отбора подлежащих наблюде-нию единиц из исходной совокупности, и случайные , которые возникают, если отобранная совокупность неполно вос-производит всю совокупность в целом. Величина случайной ошибки может быть оценена.

Ошибка выборочного наблюдения – разность между значением признака в ге-неральной совокупности и его значением, рассчитанным по результатам выбороч-ного наблюдения. В практике выбороч-ных обследований наиболее часто опре-деляется средняя и предельная ошибки выборки.

Средняя ошибка выборки для различных спосбов отбора вычисляется по разному. Если случайный или мех-ий отбор, то

Для средней: m = s 2 / (n) 1/2

Для доли: m = (w(1-w)/n) 1/ 2 , где

m - средняя ошибка выборки

s 2 – генеральная дисперсия

n – объём выборочной совокупности

Если выборочная совокупность формируется на основе типической выборки и отбор единиц осуществляется пропорционально объёму типических групп, то средняя ошибка равна:

Для средней: m = (s i 2 / n) 1/2

Для доли: m = (w i (1-w i) / n) 1/2 , где

s i 2 – средняя из внутригрупп-х дисперсий

w i – доля единиц в итой группе, обладающих исследуемым признаком.

s i 2 = ås 2 n i / ån i

Cредняя ошибка серийной выборки рав-на:

Для средней: m = (d х 2 / r) 1/2

Для доли: m = (d 2 w / r) 1/2

d 2 w – межгрупповая дисперсия доли

d х 2 – межгрупповая дисперсия количес-твенного признака.

r– число отобранных серий/

d 2 x = å(x i -x) 2 / r

d 2 w = å(w i – w) 2 / r

Если отбор единиц из генеральной совокупности производится бесповторным способом, то в формулы средней ошибки вносится поправка: (1-n/N) 1/2

Предельная ошибка выборки D рас-считывается как произведение коэффици-ента доверия t и средней ошибки вы-борки: D = t*m. D связана с гарантирующим её уровнем доверия вероятности. Этот уровень определяет коэффициент доверия t, и наоборот. Значения t приводятся в специальных математических таблицах.

Определение объёма выборки.

Объём выборки рассчитывается, как правило, на стадии проектирования вы-борочного обследования. Формулы для определения численности выборки следуют из формул предельных ошибок выборки.

Объём собственно случайной и механической повторных выборок определяется по формулам:

Для средней n = t 2 s 2 / D 2

Для доли n = t 2 w(1-w) / D 2

В случае бесповторной выборки:

Для средней n = t 2 s 2 N / ND 2 +t 2 s 2

Для доли n = t 2 w(1-w)N / ND 2 +t 2 w(1-w) .

Величины s 2 и w до проведения выбо-рочного наблюдения неизвестны. Приб-лижённо их находят так:

1. берут из предыдущих обследований;

2. если известны максимально и минимальное значения признака, то среднеквадратическое отклонение определяют по правилу «трёх сигм»:

s = x max – x min / 6

3. при изучении альтернативного призна-ка, если нет никаких сведений о его доле в генеральной совокупности, берётся максимально возможная величина w=0,5

При типическом отборе, пропорциона-льном объёму типических групп, объём выборки по каждой группе определяется формулой: n i = n*N i / N , где

n i – объём выборки из i-той группы

N i – объём i –той группы в ген-ой сов-ти.

При выборке, пропорциональной вариа-ции признака, численность выборки из каждой группы находят так: n i = nN i s i /åN i s i .

При типической повторной выборке, пропорциональной объёму групп, общую численность выборки находят так:

Для средней n = t 2 s 2 i / D 2

Для доли n = t 2 w(1-w) / D 2

В случае бесповторной типической выборки:

Для средней n = t 2 s 2 i N / D 2 N+t 2 s 2 i

Для доли n = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

Основные понятия и предпосылки применения корреляционно-регрессион-ного анализа.

Корреляция – это статистическая зависи-мость между случайными величинами, не имеющими строго функционального ха-рактера, при которой изменение одной из случайных величин приводит к изме-нению матем-ского ожидания другой.

Корреляционный анализ – имеет своей за-дачей количественное определение тес-ноты связи между двумя признаками и между результативными и множеством факторных признаков. Теснота связи ко-личественно выражается величиной коэффициентов корреляции.

Корреляционно-регрессионный анализ как общее понятие включает в себя измере-ние тесноты, направления связи и уста-новление аналитического выражения (фо-рмы) связи (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной вели-чины (называемой зависимой или резуль-тативным признаком) обусловлено влия-нием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, прини-мается за постоянные и средние значе-ния. Регрессия может быть однофактор-ной (парной) и многофакторной (множес-твенной).

Целью регрессионного анализа являет-ся оценка функциональной зависимости условного среднего значения результа-тивного признака (У) от факторных (х 1 , х 2 , …х к) признаками.

Основной предпосылкой регрессионно-го анализа является то, что только резу-льтативный признак (У) подчиняется нормальному закону распределения, а факторные признаки х 1 , х 2 ,…,х к могут иметь произвольный закон распределе-ния. В анализе динамических рядов в качестве факторного признака выступает время t. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным (У) факторными (х 1 , х 2 ,…,х к) признаками. Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией У х =f(х 1 , х 2 ,…,х к), является достаточно адекватным реаль-ному моделируемому явлению или процессу в случае соблюдения следую-щих требований их построения .

1. Совокупность исследуемых исходных данных д/б однородной и математически описываеться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравне-ниями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выра-жение.

4. Наличие достаточно большого объёма исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами следует описы-вать линейной или приводимой к линей-ной формами зависимости.

6. Отсутствие количественных ограниче-ний на параметры модели связи.

7. Постоянство территориальной и вре-менной структуры изучаемой совокуп-ности.

Теоретическая обоснованность моде-лей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий .

1. Все признаки и их совместные распределения должны подчиняться нор-мальному закону распределения;

2. Дисперсия моделируемого признака (У) должна всё время оставаться постоян-ной при изменении величины (У) и зна-чений факторных признаков.

3. Отдельные наблюдения д/б независи-мыми, т. е. результаты, полученные в i - ом наблюдении, не должны быть связа-ны с предыдущими и содержать инфор-мацию о последующих наблюдениях, а также влиять на них.

ЗАДАЧИ СВОДКИ И ЕЕ СОДЕРЖАНИЕ

наблюдение дает сведения по каждой единице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных.

Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обобщающих статистических пок-лей.

Сводка - комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом всю совокупность

Стат-ая сводка должна вестись на основе предварительного теоретического анализа явлений и процессов, чтобы во время сводки не потерять информацию об исследуемом явлении и все статистические итоги отражали важнейшие характерные черты объекта.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой наз-ся операция по подсчету общих итогов по сов-ти единиц наблюдения.

Сложная сводка - комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических табл.

Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических пок-лей для характеристики групп и объекта в целом; разработка системы макетов статистических табл, в которых должны быть представлены результаты сводки.

По форме обработки материала сводка: децентрализованная и централизованная.

При децентрализованной сводке (именно она используется, как правило, при обработке стат-ой отчетности) разработка мат-ла производится последовательными этапами. Так, отчеты предприятий сводятся статистическими органами субъектов Российской Федерации, а уже итоги по региону поступают в Госкомстат России, и там определяются пок-ли в целом по народному хозяйству страны.

При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.

По технике выполнения статистическая сводка подразделяется на механизированную и ручную.

Механизированная сводка - при котором все операции осуществляются с помощью применения электронно-вычислительных машин. При ручной сводке все основные операции (подсчет групповых и общих итогов) осуществляются вручную.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической, печати.

Смыкание рядов дин-ки

При анализе рядов дин-ки возникает необходимость их смыкания-объединения двух и более рядов в один ряд. Смыкание необходимо в тех случаях, когда уровни рядов несопоставимы в связи с территориальными изменениями, в связи с изменением цен и в связи с изменением м-дики исчисления уровней ряда. необходимо сомкнуть (объединить) приведенные выше два ряда в один. Это можно сделать при помощи коэффициента сопоставимости. Умножая на полученный коэффициент данные за г., получим сомкнутый (сопоставимый) ряд дин-ки абсолютных величин 2 способ смыкания рядов дин-ки (способ приведения к одному основанию) заключается в том, что уровни года, в котором произошли изменения, как до изменения, так и после изме-й принимаются за 100%, а остальные пересчитываются в процентах по отн-ию к этим уровням соответственно.

30. М-ды выравнивания рядов дин-ки

Всякий ряд дин-ки теоретически может быть представлен в виде трех составляющих:

Тренда (основной тенд-и развития динамического ряда);

Циклических (периодических) колебаний, в том числе сезонных;

Случайных колебаний.

Одной из задач, возникающих при анализе рядов дин-ки, является установление изменения уровней изучаемого явления. В некоторых случаях закономерность изменения уровней ряда дин-ки вполне ясна, например, либо систематическое снижение уровней ряда, либо их повышение. иногда уровни ряда претерпевают самые различные изменения (то возрастают, го убывают). В этом случае можно говорить лишь об общей тенд-и разви-ия: либо к росту, либо к снижению.

Выявление основной тенд-и развития (тренда) наз-ся выравниванием временного ряда, а м-ды выявления основной тенден- м-ды выравнивания.

Непосредственное выделение тренда может быть произведено тремя ме-ми.

* М-д укрупнения интервалов. Этот м-д основан на укрупнении пер времени, к которым относятся уровни ряда. Например, ряд дин-ки

суточного выпуска продукции заменяется рядом месячного выпуска проекции и т.д.

* М-д скользящей средней. В этом м-де исходные уровни ряда заменяются средними величинами, к-ые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Интервал сглаживания может быть нечетным (3, 5, 7 и т.д. точек) и четным (2, 4, 6 и т.д. точек). Расчет средних ведется способом скольжения, то есть постепенным исключением из принятого периода скольжения первого уровня и включение следующего. При нечетном сглаживании полученное среднее арифметическое значение закрепляют за серединой расчетного интервала.

«-» м-дики сглаживания скользящими средними состоит в условности определения сглаженных уровней для точек в начале и конце ряда.

* Аналит-ое выравнивание- является наиболее эффективным способом выявления основной тенд-и развития. При этом уровни ряда дин-ки выражаются в виде функции времени: Yt=f(t)

Целью аналит-ого выравнивания дин-го ряда является определение аналит-ой зав-ти f(t). На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t), а затем анализируют поведение отклонений от тенд-и.

В экономике часто применяется функция вида: Уi = а0 +∑ аi +ti

Из функции вида (3.12) чаще всего при выравнивании используется линейная зав-ть /(*) = ао + а1 *t или параболическая f(t) = a0 +att + a2 t2.

Коэффициенты ао,а,а2,...,ар в формуле находятся МНК.

Согласно этому м-ду для нахождения параметров полинома р-ой степени необходимо решить систему так называемых нормальных уравнений:

nаo+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

Тренд показывает, как воздействуют систематические факторы на уро- ряда дин-ки. Колеблемость уровней около тренда служит мерой воздействия остаточных (случайных) факторов. Эту меру воздействия можно оценить

по формуле среднего квадратичного отклонения.

Основные понятия корреляционно-регрессионного анализа.

Совокупность значений изученного в данном эксперименте или наблюдении параметра, проранжированных по величине (возрастания или убывания) называется вариационным рядом.

Предположим, что мы измерили артериальное давление у десяти пациентов с целью получить верхний порог АД: систолическое давление, т.е. только одно число.

Представим, что серия наблюдений (статистическая совокупность) артериального систолического давления в 10-ти наблюдениях имеет следующий вид (табл. 1):

Таблица 1

Составляющие вариационного ряда называются вариантами. Варианты представляют собой числовое значение изучаемого признака.

Построение из статистической совокупности наблюдений вариационного ряда - только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (средний уровень белка крови, средний вес пациентов, среднее время наступления наркоза и т.д.)

Средний уровень измеряют с помощью критериев, которые носят название средних величин. Средняя величина - обобщающая числовая характеристика качественно однородных величин, характеризующая одним числом всю статистическую совокупность по одному признаку. Средняя величина выражает то общее, что характерно для признака в данной совокупности наблюдений.

Общеупотребительными являются три вида средних величин: мода (), медиана () и среднеарифметическая величина ().

Для определения любой средней величины необходимо использовать результаты индивидуальных наблюдений, записав их в виде вариационного ряда (табл. 2).

Мода - значение, наиболее часто встречающееся в серии наблюдений. В нашем примере мода = 120. Если в вариационном ряду нет повторяющихся значений, то говорят, что мода отсутствует. Если несколько значений повторяются одинаковое количество раз, то в качестве моды берут наименьшее из них.

Медиана - значение, делящее распределение на две равные части, центральное или срединное значение серии наблюдений, упорядоченных по возрастанию или убыванию. Так, если в вариационном ряду 5 значений, то его медиана равна третьему члену вариационного ряда, если в ряду четное количество членов, то медиана представляет собой среднее арифметическое двух его центральных наблюдений, т.е. если в ряду 10 наблюдений, то медиана равна среднему арифметическому 5 и 6 наблюдения. В нашем примере.

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Средняя арифметическая величина рассчитывается по формуле:

где - наблюденная величина в -том наблюдении, а - число наблюдений. Для нашего случая.

Средняя арифметическая величина обладает тремя свойствами:

Средняя занимает серединное положение в вариационном ряду. В строго симметричном ряду.

Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

Сумма отклонений всех вариант от средней равна нулю: . Отклонение вариант от средней обозначается.

Вариационный ряд состоит из вариант и соответствующих им частот. Из десяти полученных значений цифра 120 встретилась 6 раз, 115 - 3 раза, 125 - 1 раз. Частота () - абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.

Вариационный ряд может быть простым (частоты = 1) или сгруппированным укороченным, по 3-5 вариант. Простой ряд используется при малом числе наблюдений (), сгруппированный - при большом числе наблюдений ().

Наименование параметра	Значение
Тема статьи:	Вариационный ряд
Рубрика (тематическая категория)	Производство

Наблюдаемые значения случайной величины х 1 , х 2 , …, х k называются вариантами .

Частотой варианты х i принято называть число n i (i =1,…,k ), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты х i (i =1,…,k ) принято называть отношение ее частоты n i к объёму выборки n .

Частоты и частости называютвесами .

Накопленной частотой принято называть количество вариант, значения которых меньше данного х :

Накопленной частостью принято называть отношение накопленной частоты к объёму выборки:

Вариационным рядом (статистическим рядом) – принято называть последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд должна быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

			…
			…

Когда число вариант велико или признак является непрерывным (случайная величина может принимать любые значения в некотором интервале), составляют интервальный вариационный ряд.

Для построения интервального вариационного ряда проводят группировку вариант – их разбивают на отдельные интервалы:

Число интервалов иногда определяют с помощью формулы Стерджеса :

Затем подсчитывается число вариант, попавших в каждый интервал – частоты n i (или частости n i /n ). В случае если варианта находится на границе интервала, то ее присоединяют к правому интервалу.

Интервальный вариационный ряд имеет вид :

Варианты			…
Частоты			…

Эмпирической (статистической) функцией распределения принято называть функция, значение которой в точке х равно относительной частоте того, что варианта примет значение, меньшее х (накопительной частости для х ):

Полигоном частот называют ломанную, отрезки которой соединяют точки с координатами (х 1 ; n 1), (х 2 ; n 2), …, (х k ; n k ). Аналогично строится полигон частостей , который является статистическим аналогом многоугольника распределений.

Стоит сказать, что для непрерывного вариационного ряда полигон можно построить, в случае если в качестве значений х 1 , х 2 , …, х k взять середины интервалов.

Интервальный вариационный ряд графически обычно изображают с помощью гистограммы .

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длины h = x i +1 – x i , i = 0,…,k -1, а высоты равны частотам (или частостям) интервалов n i (w i ).

Кумулята (кумулятивная кривая) – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломанную, соединяющую точки или , . Для интервального ряда кумулята начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломанной соответствуют концам интервалов.

Вариационный ряд - понятие и виды. Классификация и особенности категории "Вариационный ряд" 2017, 2018.

- Вариационный ряд распределения

Распределение розничного товарооборота Российской Федерации в 1995 году по формам собственности, млн. руб. Виды рядов распределения Лекция VIII. Ряды распределения В результате обработки и систематизации первичных статистических данных получают... .

- Вариационный ряд

Простейшее преобразование статистических данных является их упорядочивание по величине. Выборка объёма из генеральной совокупности, упорядоченная в порядке неубывания элементов, т.е. , называется вариационным рядом: . В том случае, когда объем наблюдений... .

- Задание 2. Интервальный вариационный ряд

1. По заданной выборке, соответствующей варианту задания построить интервальный вариационный ряд; построить гистограмму и кумуляту (используйте два способа: вставку диаграммы Excel и режим «Гистограмма» пакета «Анализ данных»). 2. Проанализировать полученную гистограмму. ... .

- Составить вариационный ряд изменчивости признака семян фасоли или листьев какого-либо растения одного возраста. Выявить закономерности изменчивости признака.

Популяция - структурная единица вида. Численность популяций. Причины колебания численности популяций. Взаимоотношения особей в популяциях и между различными популяциями одного и разных видов. 1. Важный признак вида - расселение его группами, популяциями в...