Средние статистические величины. Средние величины

Средние величины

В процессе обработки и обобщения статистических данных возникает необходимость определения средних величин. Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности.

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности могут колебаться в ту или иную сторону под влиянием множества факторов, среди которых как основные, так и случайные. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей. Так там, где возникает потребность обобщения, расчет таких характеристик приводит к замене множества различных индивидуальных значений признака средним показателем, характеризующим всю совокупность явлений, что позволяет выявить закономерности, присущие массовым общественным явлениям. Типичность средней непосредственным образом связана с однородностью статистической совокупности. Средняя величина только тогда будет отражать типичный уровень признака, когда она рассчитана по качественно однородной совокупности.

Каждая средняя характеризует изучаемую совокупность по какому-либо одному признаку, но для характеристики любой совокупности, описания ее типических черт и качественных особенностей нужна система средних показателей.

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. В каждом конкретном случае применяется одна из средних величин: арифметическая, гармоническая, геометрическая, квадратическая, кубическая и т.д. Перечисленные средние относятся к классу степенных средних и объединяются общей формулой (при разных значениях ш):

где * - среднее значение исследуемого явления; ш - показатель степени средней; х - текущее значение признака; п - число признаков.

В зависимости от значения показателя степени ш различают следующие виды степенных средних:

  • при ш = - 1 - средняя гармоническая х гар;
  • при ш = 0 - средняя геометрическая х г ;
  • при ш =1 - средняя арифметическая х ;
  • при ш =2 - средняя квадратическая х кв ;
  • при ш =3 - средняя кубическая х куб .

Это свойство степенных средних возрастает с повышением показателя степени определяющей функции и называется в статистике правилом мажорантности средних.

Наиболее распространенным видом является средняя арифметическая. Средней арифметической величиной называется такое значение признака в расчете на единицу совокупности, при вычислении которого общий объем признака в совокупности сохраняется неизменным. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значении признаков отдельных ее единиц. Чтобы исчислить среднюю арифметическую, нужно сумму всех значений признаков разделить на их число.

Средняя арифметическая применяется в форме простой средней и взвешенной средней. Исходной, определяющей формой служит простая средняя.

Средняя арифметическая простая равна простой сумме отдельных значений осредняемого признака, деленной на общее число этих значений (она применяется в тех случаях, когда имеются несгруппиро- ванные индивидуальные значения признака):

где - индивидуальные значения варьирующего признака;

п - число единиц совокупности.

Средняя из вариантов, которые повторяются различное число раз, или имеют различный вес, называется взвешенной. В качестве весов выступают численности единиц разных группах совокупности (в группу объединяют одинаковые варианты). Средняя арифметическая

взвешенная - средняя сгруппированных величин Х 1 ,Х 2 ,Х 3 ...Х П - вычисляется по формуле:


где - веса (частоты повторения одинаковых признаков);

- сумма произведений величины признаков на их частоты;

- общая численность единиц совокупности.

Вычисление средней арифметической часто сопряжено с большими затратами времени и труда. Однако в ряде случаев процедуру расчета средней можно упростить и облегчить, если воспользоваться ее свойствами. К основным свойствам относится:

  • 1. Если все индивидуальные значения признака уменьшить или увеличить в i раз, то среднее значение нового признака соответственно уменьшится или увеличится в i раз.
  • 2. Если все варианты признака уменьшить или увеличить на число А, то средняя арифметическая соответственно уменьшится или увеличится на это же число А.
  • 3. Если веса всех вариантов уменьшить или увеличить в К раз, то средняя арифметическая не изменится.

В качестве весов средней вместо абсолютных показателей можно использовать удельные веса в общем итоге. Тем самым достигается упрощение расчетов средней.

При расчете статистических показателей помимо средней арифметической могут использоваться и другие виды средних. Однако в каждом конкретном случае в зависимости от характера имеющихся данных существует только одно истинное среднее значение показателя, являющееся следствием реализации его исходного соотношения.

Отметим, что средняя арифметическая применяется в тех случаях, когда известны варианты варьирующего признака х и их частоты f, когда статистическая информация не содержит частот f по отдельным вариантам х совокупности, а представлена как их произведением xf ,

применяется формула средней гармонической. Она используется, когда известен числитель исходного соотношения средней, но неизвестен его знаменатель.


Средняя геометрическая применяется в тех случаях, когда индивидуальные значения признака представляют собой относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики, т.е. характеризует средний коэффициент роста.

Средняя геометрическая исчисляется извлечением корня степени п из произведений отдельных значений - вариантов признака х:

где п - число вариантов;

П - знак произведения.

Наиболее широкое применение средняя геометрическая получила для определения средних темпов изменения в рядах динамики, а также в рядах распределения.

В ряде случаев в экономической практике возникает потребность расчета среднего размера признака, выраженного в квадратных и кубических единицах измерения. Тогда применяется средняя квадратическая и средняя кубическая.

Формулы для расчета средней квадратической:

Средняя квадратическая простая является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратическая взвешенная:


Формулы для расчета средней кубической аналогичны:

Средняя кубическая простая:


Средняя кубическая взвешенная:


Средняя квадратическая и кубическая имеют ограниченное применение в практике статистики. Широко используется статистика средней квадратической.

Наиболее часто используемыми в экономической практике структурными средними являются мода и медиана. Модой распределения (°) называется такая величина изучаемого признака, которая в

данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие.

Рассмотрим определение моды по несгруппированным данным. Например: 10 студентов имеют следующие экзаменационные оценки: 5, 4, 3, 4, 5, 5, 3, 4, 4, 4. Так как в данной группе больше всего студентов получили 4, то это значение и будет модальным.

Для упорядоченного дискретного ряда распределения мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариантов и соответствует варианту с наибольшей частотой.

Модальный интервал в случае интервального распределения с равными интервалами определяется по наибольшей частоте; с неравными интервалами - по наибольшей плотности, а определение моды требует проведения расчетов на основе следующей формуле:

где х т0 - нижняя граница модального интервала;

i m0 - величина модального интервала;

fmo ~ частота модального интервала;

fmo-i - частота интервала, предшествующего модальному;

fmo+i ~ частота интервала, следующего за модальным.

Медиана - вариант, который находится в середине вариационного ряда. Медиана делит ряд на две равные части. Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда. В ранжированных рядах несгруппирован- ных данных нахождение медианы сводится к отысканию порядкового номера медианы.

Значение медианы для нечетного объема вычисляется по формуле:

где п - число членов ряда.

В интервальном ряду распределения сразу можно указать только интервал, в котором будет находиться медиана. Для определения ее величины используется специальная формула:

где х ие - нижняя граница интервала, который содержит медиану; i ие - медианный интервал;

- половина от общего числа наблюдений;

F m _ 1 - накопленная частота в интервале, предшествующему медианному;

fме " числ0 наблюдений в медианном интервале.

Таким образом, мода и медиана являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения.

Контрольные вопросы и задания

  • 1. Назовите виды статистических показателей. Приведите примеры.
  • 2. Что понимается под абсолютными статистическими величинами и каково их значение? Приведите примеры абсолютных величин.
  • 3. Всегда ли для анализа изучаемого явления достаточно одних абсолютных показателей?
  • 4. Что называется относительными показателями?
  • 5. Каковы основные условия правильного расчета относительной величины?
  • 6. Какие виды относительных величин Вы знаете? Приведите примеры.
  • 7. Дайте определение средней величины.
  • 8. Какие виды средних величин применяются в статистике? Какие виды средних величин используются чаще всего?
  • 9. Как исчисляется средняя арифметическая простая и в каких случаях она применяется?
  • 10. Как исчисляется средняя арифметическая взвешенная и в каких случаях она применяется?
  • 11. Как исчисляется средняя арифметическая из вариационного
  • 12. Каковы основные свойства средней арифметической?
  • 13. Для чего служит средняя гармоническая? Чем она отличается от средней арифметической?

Анализ данных правовой статистики невозможен без использования средних величин и связанных с ними показателей вариации. Только при помощи средних величин можно охарактеризовать совокупности по количественному варьирующему признаку, по которому их принято сравнивать.

Средней величиной в статистике называется обобщенная характеристика совокупности однородных явлений по какому-либо одному количественно варьирующему признаку в условиях места и времени.

Она обычно обобщает количественную вариацию признака. За любой средней величиной скрывается ряд распределения единиц совокупности по изучаемому признаку, т. е. вариационный ряд.

Одним из важных условий расчета средних величин является качественная однородность единиц совокупности в отношении осредняемого признака. Средние величины, которые вычислены для явлений разного типа, представляют собой фикцию. Они могут искажать или стирать различия разнородных совокупностей.

Практически и теоретически в криминологии, социологии права и других юридических дисциплинах допустимы в основном групповые средние, т. е. средние, которые вычислены на основе адекватных статистических группировок.

Средние величины базируются на массовом обобщении фактов. Только так они способны выявлять те или иные тенденции, которые лежат в основе наблюдаемого процесса. Средние величины отражают самую общую закономерность, которая присуща всей массе изучаемых явлений. Она видна в типичной количественной характеристике, так называемой средней величине всех варьирующих показателей.

Средние статистические величины имеют несколько видов, но все они входят в класс степенных средних, т. е. средних, построенных из различных степеней вариантов: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая и т. д.

При расчете различных степенных средних все основные показатели, на основе которых осуществляется расчет, не изменяются.

Разные виды средних при одних и тех же исходных показателях имеют



в связи с различными значениями степени далеко не одинаковые численные значения.

Чем меньше степень средней, тем меньше значение, соответствующее средней – это закономерность. Поэтому каждая средняя приведенного ряда мажорантна в отношении средних, которые стоят справа от нее. Все это называется правилом мажорантности средних.

Выбор обычной средней или взвешенной осуществляется статистическим материалом, а выбор вида степенной – целью исследования.

Кроме средних степенных, в правовой статистике применяются средние структурные, в качестве которых выступают мода и медиана.

Самым распространенным видом средней величины является средняя арифметическая. Она рассчитывается очень просто: сумму величин всех вариантов делят на общее число единиц вариантов.

Средняя арифметическая при дискретном вариационном ряде исчисляется по формуле средней арифметической взвешенной. Она не имеет принципиальных отличий от простой средней арифметической. В ней лишь суммирование одного и того же значения заменено умножением этого значения на его частоту. Таким образом, каждое значение взвешивается по частоте встречаемости. Когда частоты исчисляются сотнями и тысячами, то использование средней взвешенной намного упрощает расчет.

При расчете средней арифметической совсем не обязательно знать величину каждого индивидуального значения или иметь в своем распоряжении построенный на основе этих вариант вариационный ряд.

В официальной отчетности юридических учреждений обычно уже имеются многие суммарные величины. Суммирование происходит последовательно

в районах, городах, субъектах Федерации и в центре при сводке и группировке данных, которые получены из документов первичного учета.

Расчет средней на основе обобщенных в отчете данных осуществим, когда каждое отдельное значение варианты вообще не фиксируется. Поэтому можно сказать, что между средними и относительными величинами иногда

не существует строгих границ. Все они являются обобщающими. Кроме того, любая средняя величина представляет собой своеобразное отношение

двух абсолютных величин, т. е. она одновременно является определенной относительной величиной. Но, с другой стороны, любая относительная величина дает своеобразную усредненную характеристику процесса.

Существуют некоторые особенности и трудности для расчета средней арифметической при интервальном ряде статистических показателей, т. е. когда индивидуальные численные варианты сгруппированы в интервалы.

Правовая статистика использует интервальные ряды чаще, чем дискретные. Таким образом, учитываются сроки наказания, сроки следствия, сроки рассмотрения уголовных и гражданских дел, возраст правонаруши-телей и т. д.

С целью упрощения расчета средней арифметической можно использо-вать некоторые ее свойства, которые здесь приводятся без доказательств.

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты.

2. Если от каждой варианты отнять или прибавить одно и то же число, то новая средняя уменьшится или увеличится на то же число.

3. Если каждую варианту разделить или умножить на какое-либо число, то средняя арифметическая уменьшится или увеличится во столько же раз.

4. Если все частоты разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится.

5. Сумма отклонений вариант от средней арифметической всегда равна нулю.

6. Общая средняя равна средней из частных средних, взвешенной по численности соответствующих частей совокупности.

Следующая средняя – средняя геометрическая – используется для вычисления средних темпов роста и прироста (снижения) наблюдаемых процессов. Исследование этих параметров в динамике преступности, выявленных правонарушителей, раскрываемости, судимости, общего числа заключенных, оправданных, освобожденных от уголовной ответственности, рассмотренных гражданских дел, удовлетворенных и неудовлетворенных исков и других меняющихся во времени юридически значимых процессов и явлений имеет важное значение в науке и практике.

Динамика юридически значимых явлений характеризуется многими показателями, среди которых – средние арифметические и геометрические. Средние арифметические показатели используются для расчета среднегодового абсолютного прироста или снижения, выраженного

в именованных числах. Они важны, но их недостаточно, особенно

в сравнительных целях, для достижения которых большую помощь оказывают темпы роста, прироста и снижения, выраженные в процентах. Расчет этих параметров производится по формуле средней геометрической, но на основе все тех же абсолютных показателей.

Для того, чтобы рассчитать среднегодовые темпы роста и прироста, необходимы абсолютные показатели первого и последнего годов, на базе которых рассчитывается относительная величина динамики в процентах и количество лет. В статистических сборниках и официальной отчетности уже имеются подсчитанные общие итоги и даже проценты роста или снижения наблюдаемого процесса. На основе их и числа лет можно легко найти искомые среднегодовые темпы роста и прироста интересующих процессов.

Мода и медиана. Модой в статистике именуется значение варианта, которое чаще всего встречается в данной совокупности. Иногда могут быть распределения, где все варианты встречаются примерно одинаково часто.

В подобных случаях мода не определяется, так как она практически отсутствует. В других распределениях мода может быть не единственной.

Моду применяют в тех случаях, когда нужно охарактеризовать более часто встречающуюся величину признака.

Определение моды для интервального ряда несколько сложнее, так как, чтобы определить моду, требуется определить модальный интервал данных рядов.

Медианой в статистике называется варианта, которая расположена

в середине ранжированного ряда. Она разделяет упорядоченный ряд пополам. По обе стороны от медианы находится одинаковое число единиц совокупности. При определении значения медианы предполагают, что значение признака в интервале расположено равномерно.

Медиана, которая рассчитана для вариационного ряда с существенно различающимися интервалами, отличается от медианы, исчисленной для того же ряда, но с равными интервалами.

В практике мода и медиана порой используются вместо средней арифметической или вместе с ней. При применении вместе они дополняют друг друга, особенно при совокупности небольшого числа единиц с очень малыми значениями исследуемого признака. Как дополнение к средней арифметической также лучше исчислять моду и медиану, которые, в отличие от средней, не зависят от крайних и характерных для совокупности значений признака. Медиану можно использовать в качестве приближенной средней арифметической, когда совокупность ранжирована и упорядочена, тогда медиана определяется по серединному значению варианты. Поэтому значения других вариант можно и не изменять.

Кроме медианного деления вариационного ряда на две равные части,

в статистике используются и более дробные деления: квартили, которые делят вариационный ряд по сумме частот на 4 равные части, децили – на

10 равных частей и центили – на 100 равных частей. Они употребляются для более выразительных и компактных описаний исследуемого процесса, но

в правовой статистике практически не применяются.

Показатели вариации признака. Средние величины представляют собой важную обобщающую характеристику совокупности по изменяющемуся признаку. Подсчитав их, необходимо уяснить, насколько они показательны, типичны или однородны, ведь одинаковые средние могут характеризировать совершенно разнородные совокупности.

Для того чтобы наши суждения о различиях вариационных рядов были статистически точными, нужно прибегать к показателям отклонений различных вариант от средней.

Первый и наиболее простой показатель вариации – это размах вариации, который исчисляется в виде разности между наибольшими и наименьшими значениями варьирующего признака.

Среднее арифметическое отклонение является второй мерой измерения вариаций признака. В статистическом анализе оно применяется довольно редко. Обычно применяют третий показатель вариации – дисперсию, или средний квадрат отклонений.

Путем извлечения квадратного корня из дисперсии мы получим следующий, четвертый, показатель вариации – среднее квадратическое отклонение.

Дисперсия и среднее квадратическое отклонение являются самыми распространенными показателями вариации изучаемого признака. В правовой статистике их используют при сравнительных статистических исследованиях, для обоснования ошибки репрезентативности выборочного наблюдения,

а также при изучении корреляционных и других статистических связей между признаками фактора и признаками следствия или между причиной и следствием.

Коэффициент вариации является пятым по счету показателем вариации. Он, в отличие от размаха вариации, среднего линейного, среднего квадратического отклонения и дисперсии, выражающихся в абсолютных и именованных числах, является показателем относительным. Коэффициент вариации предоставляет много возможностей для сравнительных изучений, потому что сравнивать, например, средние квадратические отклонения вариационных рядов с разными уровнями непосредственно нельзя. Коэффициент вариации в некоторой мере представляется критерием типичности средней. Если он относительно большой, это значит, что типичность этой средней очень невысока, а если, наоборот, – его значение мало, то средняя является типической и надежной.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Относительные величины структуры - это отношение между размерами части и целого. Они характеризуют состав, структуру совокупности. Форма представления - удельный вес или проценты. Сумма относительных величин структуры равняется 1 или 100%. Разницу между соответствующими долями двух совокупностей называют процентным пунктом.

Абсолютными величинами в статистике называются численности единиц и суммы по группам и в целом по совокупности, которые являются непосредственным результатом сводки и группировки данных.

Абсолютные величины - это именованные числа, то есть они имеют свои единицы измерения (например, штуки, тонны, гривны). В составе абсолютных показателей выделяют показатели численности совокупности (численность предприятий) и объема признаков (продукция, прибыль). Различают три группы измерителей признаков - натуральные, трудовые и стоимостные .

Натуральные измерители отражают присущие явлениям физические свойства (меры веса, длины, времени). Иногда используют комбинированные единицы измерения, которые представляют собой произведение величин разной размерности (производство электроэнергии в кВт-часах).

Не всегда абсолютные величины можно получить непосредственно суммируя значения признака у отдельных единиц. В этом случае отдельные слагаемые, входящие в абсолютную величину, приводят к соизмеримому выражению. Для этого часто используют условно-натуральные измерители . Так, например, при расчете количества потребленного топлива, разные его виды в соответствии с их теплотворной способностью выражают в единицах условного топлива, теплотворная способность которого 7000 кал/кг.

Трудовые измерители (человеко-час, человеко-смена) используются при измерении затрат труда на производство продукции или на выполнение отдельных работ, для определения производительности труда, а также для измерения трудовых ресурсов.

Стоимостные измерители дают возможность обобщить и сопоставить разнообразные явления. Их используют при определении таких важнейших показателей, как товарооборот, прибыль, капитальные вложения.

Зачастую абсолютная величина показателя рассчитывается по определенному правилу на основании других показателей. Например, валовая прибыль рассчитывается как разница между валовым доходом и валовыми издержками.

Многие абсолютные величины представляются в форме баланса, который предусматривает расчет показателя по двум разделам: по источникам формирования (приходная часть баланса) и по направлениям использования (расходная часть). Возможно представление абсолютных показателей и в динамической балансовой форме. Например, прирост количества единиц оборудования на предприятии за год можно представить как разность числа единиц оборудования на конец и начало года, а можно - как разность между числом единиц вновь введенного и выбывшего оборудования.



Глава 4.3. Относительные величины.

Относительные величины отображают количественные отношения социально-экономических явлений. Алгебраическая форма их - это частное от деления двух одноименных или разноименных величин. Знаменатель отношения рассматривается как база сравнения или основа относительной величины.

Базой сравнения могут быть 100, 1000, 10 000 или 100 000 единиц. Тогда относительная величина будет выражена соответственно в процентах (%), в промилле (%о), продецимилле (%оо), просантимилле (%ооо).

Применяют различные по содержанию и природе относительные величины.

Отношение между разноименными абсолютными величинами дает относительную величину интенсивности . Это именованная величина, в которой объединяются единицы измерения числителя и знаменателя. Например, производство продукции на душу населения. Относительные величины интенсивности характеризуют степень распространения или развития явления в определенной среде. В их состав также входят демографические коэффициенты (рождаемости, смертности, интенсивности миграционных потоков), которые исчисляются отношением числа событий (смерть, рождение)за определенный промежуток времени к средней численности населения за тот же период.

Сравнение одноименных величин позволяет выделить следующие виды относительных величин: структуры, координации, динамики, планового задания, выполнения плана, сравнения характеристик объектов.

Относительные величины координации - это соотношения между отдельными частями целого или отношения отдельных частей совокупности к одной из них, принятой за базу сравнения. Пример, число городских жителей, приходящихся на 100 сельских; число женщин, приходящихся на 100 мужчин. Эти величины выражаются в процентах, промилле или кратных отношениях (например, на 100 мужчин приходится 114 женщин).

Для оценки интенсивности развития используют относительную величину динамики , которая исчисляется отношением уровней изучаемого явления за два периода.

Относительные величины сравнения исчисляются как отношения одноименных показателей, характеризующих разные объекты или территории и имеющих одинаковую временную определенность.

Некоторые процессы планируются и для показателей, которые их отражают, устанавливают плановые задания. Путем сравнения плановых и фактических значений показателей исчисляют относительные величины: планового задания и выполнения плана .

Если обозначить фактический уровень текущего периода y1 , базового y0 и плановый уровень yпл , то относительную величину:

Кд= y1 / y0 ,

2) планового задания

Кпз =yпл / y0,

3) выполнения плана

Квп =y1 / yпл .

Глава 4.4. Виды и формы средних величин.

Средней величиной называется статистический показатель, который дает обобщенную характеристику варьирующего признака однородных единиц совокупности в конкретных условиях места и времени. Величина средней дает характеристику всей совокупности и характеризует ее в отношении одного, данного признака.

Средняя величина отражает то общее, что присуще всем единицам исследуемой совокупности.

Так, например, средняя заработная плата дает обобщающую количественную характеристику состояния оплаты труда рассматриваемой совокупности работников.

Сущность средней заключается в том, что в ней взаимопогашаются случайные отклонения значений признака и учитываются изменения, вызванные основным фактором.

Статистическая обработка методом средних величин заключается в замене индивидуальных значений варьирующего признака некоторой уравновешенной средней величиной Х.

Например, индивидуальная выработка у 5 операционистов коммерческого банка за день составила 136, 140, 154 и 162 операции. Чтобы получить среднее число операций за день, выполненных одним операционистом, необходимо сложить эти индивидуальные показатели и полученную сумму разделить на количество операционистов:

Как видно из приведенного примера, среднее число операций не совпадает ни с одним из индивидуальных, так как ни один операционист не сделал 150 операций. Но если мы представим себе, что каждый операционист сделал по 150 операций, то их общая сумма не изменится, а будет также равна 750. Таким образом, мы пришли к основному свойству средних величин: сумма индивидуальных значений признака равна сумме средних величин.

Это свойство еще раз подчеркивает, что средняя величина является обобщающей характеристикой всей статистической совокупности.

Средние величины делятся на два больших класса:

Степенные средние:

Арифметическая

Гармоническая

Геометрическая

Квадратическая

Структурные средние:

Мода

Медиана

Самым распространенным видом средней является средняя арифметическая:

Средняя арифметическая простая

Средняя арифметическая взвешенная

Средняя арифметическая для интервального ряда.

Простая среднеарифметическая величина представляет собой среднее слагаемое, при определении которого общий объем данного признака в совокупности данных поровну распределяется между всеми единицами, входящими в данную.

Так, среднегодовая выработка продукции на одного работающего - это такая величина объема продукции, которая приходилась бы на каждого работника, если бы весь объем выпущенной продукции в одинаковой степени распределялся между всеми сотрудниками организации. Среднеарифметическая простая величина исчисляется по формуле.

Средние величины представляют собой второй тип производных величин, находящих широкое применение в медицинской статистике. Средняя величина является сводной, обобщающей характеристикой статистической совокупности по определенному изменяющемуся количественному признаку (средний рост, средний вес, средний возраст умерших). Средняя величина отражает общее определяющее свойство всей статистической совокупности в целом, заменяя его одним числом с типичным значением данного признака. Средняя величина нивелирует, ослабляет случайные отклонения индивидуальных наблюдений в ту или иную сторону и характеризует постоянное свойство явлений.

В медицине средние величины могут использоваться для характеристики физического развития, основных антропометрических признаков (морфологических и функциональных: рост, вес, динамометрия и др.) и их динамики (средние величины прироста или убыли признака). Разработка этих показателей и их сочетаний в виде стандартов имеет большое практическое значение для анализа здоровья населения (в особенности детей, спортсменов). Эпидемиологи рассчитывают среднее число заболеваний в очаге, распределение очагов по срокам и средние сроки производства дезинфекции.

В демографических и медико-социальных исследованиях рассчитываются: средняя продолжительность предстоящей жизни, средний возраст умерших, средняя численность населения и т.д.

В экспериментально-лабораторных исследованиях также используются средние величины: температура, число ударов пульса в минуту, уровень артериального давления, средняя скорость или среднее время реакции на тот или иной раздражитель, средние уровни содержания биохимических элементов в крови и др.

И статистические коэффициенты, и средние величины представляют собой вероятностные величины, однако между ними существуют значительные различия:

  • 1) Статистические коэффициенты характеризуют признак, встречающийся только у некоторой части совокупности (так называемый альтернативный признак), который может наступить, но может и не наступить (рождение, смерть, заболевание). Средние величины характеризуют, признаки, присущие всей совокупности, но в разной степени (вес, рост, дни лечения).
  • 2) Статистические коэффициенты применяются для измерения качественных (атрибутивных или описательных) признаков, а средние - для варьирующих количественных признаков, где речь идет об отличиях в числовых размерах признака, а не о факте его наличия или отсутствия.

Основное достоинство средних величин их типичность - средняя сразу дает общую характеристику явления. В связи с этим можно выделить два основных требования для вычисления средних величин:

  • - однородность совокупности;
  • - достаточное число наблюдений.

Любое распределение случайной величины, не обязательно подчиняющееся определенному закону распределения вероятностей, характеризуется параметрами распределения: средняя величина (М), среднее квадратическое отклонение (), коэффициент вариации (Сv) и др.

Например, при изучении распределения 10 больных по срокам лечения, мы получим ряд числовых значений: 38, 13, 17, 20, 14, 18, 25, 32, 23, 25 - неупорядоченный ряд.

Рассчитать параметры распределения можно, пользуясь и таким рядом. Однако охарактеризовать ряд несколькими параметрами еще недостаточно, необходимо исследовать, есть ли в статистическом ряду какая-либо устойчивая закономерность. Но, пользуясь неупорядоченным рядом, возможную закономерность обнаружить сложно, поэтому строят ранжированные ряды.

Ряд, в котором дается распределение единиц изучаемой совокупности по значениям варьирующего признака, называется вариационным. Другими словами - вариационный ряд - ряд однородных величин, расположенных в возрастающем или убывающем порядке, где варианты (группы вариант) отличаются друг от друга на определенную величину, называемую интервалом (i).

Таким образом, ряд распределения больных по срокам лечения можно представить следующим образом:

13 14 17 18 20 22 23 25 32 38

1 1 1 1 1 1 1 1 1 1

Меняющийся, варьирующий признак изучаемого явления (рост, вес и др.), его числовое значение называется вариантой (V).

Числа случаев наблюдения данного признака, указывающие сколько раз встречается данная варианта, называются частотами (р).

Вариационные ряды могут быть:

  • 1) в зависимости от изучаемого явления:
    • - дискретные (прерывные) - образуются на основе прерывно меняющихся признаков, значения которых выражаются только в целых числах (частота пульса, количество студентов в группе и т.д.);
    • - интервальные (непрерывные) - образуются обычно на основе признаков, которые могут принимать любые значения и выражаются любым числом (рост, вес и т.д.)
  • 2) в зависимости от числа наблюдений:
    • - простые - варианта представлена одним числовым значением;
    • - сгруппированные - варианты группируются по определенному признаку. Например, при изучении физического развития может производиться группировка по весу: 40-44 кг; 45-49 кг. и т.д.
  • 3) в зависимости от порядка расположения вариант:
    • - возрастающие - варианты располагаются в порядке возрастания;
    • - убывающие - варианты располагаются в порядке убывания.

Отдельный вариационный ряд может одновременно включать в себя несколько характеристик. Например, простой, убывающий, прерывный; или - сгруппированный, возрастающий, непрерывный.

Виды средних величин, которые обычно используются в медицинской статистике, - это медиана, мода, средняя арифметическая. Другие виды средних: средняя гармоническая, средняя квадратическая, средняя кубическая, средняя геометрическая и другие - применяются лишь в специальных исследованиях.

Медиана (Me) - это серединная, центральная варианта, делящая вариационный ряд пополам на две равные части.

Например, если число наблюдений составляет 33, медианой будет варианта, занимающая 17-е ранговое место, так как в обе стороны от нее находится по 16 наблюдений.

В ряде с четным числом наблюдений в центре находятся две величины. Если они одинаковы по своему значению, не возникает затруднений в приближенном определении медианы, если же числовые значения двух величин различны, то за медиану принимается их полусумма.

Мода (Мо) - это чаще всего встречающаяся или наиболее часто повторяющаяся величина признака. При приближенном нахождении моды в простом (не сгруппированном) ряде, она определяется как варианта с наибольшим количеством частот.

Отличие медианы и моды от средней арифметической заключается в том, что при упрощенном, ориентировочном определении эти величины легко и быстро найти по их положению в вариационном ряду (позиционные средние), кроме того, они не зависят от значений крайних вариант или от степени рассеяния ряда.

Чаще всего используется в медицинской статистике средняя арифметическая величина (М - от латинского Media). Средняя арифметическая может быть простая и взвешенная.

Примером средней арифметической простой может служить результат измерения веса, например, 6 человек:

59 60 61 62 63 64 = 369

1 1 1 1 1 1 р = n = 6

Таким образом, средняя арифметическая простая получается как сумма величин (вариант), деленная на их число. Среднюю арифметическую простую можно вычислить лишь в тех случаях, когда каждая величина (варианта) представлена единичным наблюдением, т. е. когда частоты равны единице.

Если частоты вариант больше единицы, простая средняя неприменима - здесь надо вычислять среднюю арифметическую взвешенную, которая получается как сумма произведений вариант на соответствующие частоты, деленная на общее число наблюдений.

Например: частота пульса (число ударов в минуту) у 18 студентов после проведения атропиновой пробы составила: 86, 92, 100, 96, 90, 102, 88, 92, 80, 92, 96, 100, 86, 84, 102, 90, 86, 92.

80 84 86 88 90 92 96 100 102

1 1 3 1 2 4 2 2 2 р = n = 18

80 84 258 88 180 358 192 200 204 Vp = 1644

Средняя арифметическая простая - это частный случай средней арифметической взвешенной, поэтому формула средней арифметической взвешенной может использоваться и для расчета средней арифметической простой. В последнем случае частоты равны единице и умножение излишне.

Все три средние величины (Мо, Ме, М) совпадают (либо практически очень близки) в симметричном вариационном ряду: средняя арифметическая соответствует середине ряда (в симметричном ряду отклонения в сторону увеличения и в сторону уменьшения вариант соответственно уравновешиваются); медиана (как центральная величина) также соответствует середине ряда; мода (как наиболее насыщенная величина) приходится на наивысшую точку ряда, также находящуюся в его центре. Поэтому для всех симметричных рядов нет необходимости вычислять другие средние величины, кроме средней арифметической.

Свойства средней арифметической величины:

  • 1. Средняя величина является обобщающей характеристикой статистической совокупности по определенному изменяющемуся количественному признаку, отражает общее определяющее свойство всей статистической совокупности в целом, заменяя его одним числом с типичным значением данного признака. Средняя величина нивелирует, ослабляет случайные отклонения индивидуальных наблюдений в ту или иную сторону и характеризует постоянное свойство явлений.
  • 2. Сумма отклонений вариант от средней арифметической величины равна 0.
  • 3. В строго симметричном вариационном ряду средняя арифметическая занимает срединное положение и равна Мо, Ме.

Средние арифметические величины, взятые сами по себе без дополнительных приемов оценки, часто имеют ограниченное значение, так как они не отражают степени рассеяния (разнообразия) ряда. Одинаковые по размеру средние величины могут быть получены из рядов с различной степенью рассеяния. Средние - это величины, вокруг которых рассеяны различные варианты, и чем ближе друг к другу отдельные варианты, чем меньше рассеяние ряда, тем типичнее средняя величина.

Приближенным методом оценки разнообразия ряда может служить определение амплитуды. Амплитуда - разность между наибольшим и наименьшим значением вариант:

А = Vmax - Vmin

Но амплитуда не учитывает промежуточные значения вариант внутри ряда, кроме того, ее размеры могут зависеть и от числа наблюдений.

Основной мерой оценки разнообразия ряда является среднее квадратическое отклонение ().

Для вычисления сигмы необходимо:

определить отклонения (d) от средней (V - M);

возвести отклонения в квадрат (d 2);

  • 3) перемножить квадраты отклонений на частоты (d 2р);
  • 4) суммировать произведения квадратов отклонений на частоты;
  • 5) разделить эту сумму на число наблюдений;
  • 6) извлечь из частного квадратный корень.

При помощи сигмы можно установить степень типичности средней, пределы рассеяния ряда, пределы колебаний вокруг средней отдельных вариант. Чем меньше сигма, тем меньше рассеяние ряда, тем точнее и типичнее получается вычисленная для этого ряда средняя величина.

Применение сигмы дает возможность оценки и сравнения разнообразия нескольких однородных рядов распределения, так как - величина именная, выражается абсолютным числом в единицах изучаемой совокупности (см, кг, мг/л и т.д.). В этом случае принимаются во внимание абсолютные размеры сигмы. Например, при сравнении двух рядов распределения по признаку веса, при условии, что средние будут близки по уровню, но сигма в одном ряду будет ± 5,6 кг., а в другом ± 2,1 кг. - второй ряд менее рассеян, и его средняя более типична.

При оценке разнообразия неоднородных рядов (например, таких признаков как вес и рост), непосредственное сравнение размеров сигмы невозможно. В этом случае, для установления степени относительного разнообразия рядов, прибегают к производной величине - коэффициенту изменчивости (вариации), который является относительной величиной, выражается в % и обозначаемому буквой Сv (V).

Например, при изучении физического развития студентов - мужчин 1 курса получены следующие показатели: М (вес) = 67,5 кг.; М (рост) = 178,1 см. Соответственно = ± 2,8 кг. и ± 6,2 см. Среднее квадратическое отклонение по росту более чем в 2 раза превышает сигму по весу.

Коэффициент вариации по росту меньше, чем по весу, то есть рост оказался более устойчивым признаком, чем вес.

Различают три степени разнообразия коэффициентов вариации:

до 10% - слабое разнообразие;

10 - 20 % - среднее разнообразие;

более 20 % - сильное разнообразие.

Этот же метод вычисления коэффициента разнообразия пригоден и при анализе однородных рядов, у которых средние величины очень разнятся по размеру, а также для оценки изолированного, единичного ряда.

Пример вычисления средней арифметической (М); среднего квадратического отклонения (); коэффициента вариации (Cv).

Длительность лечения ангины у 45 больных составила: 20, 20, 19, 16, 19, 16, 14, 13, 15, 13, 12, 13, 13, 3, 12, 11, 12, 11, 10, 12, 11, 10, 11, 8, 7, 11, 11, 10, 10, 10, 9, 8, 8, 9, 5, 5, 6, 9, 5, 5, 9, 6, 7, 7, 14, и 15 дней.

Первый этап: Строим вариационный ряд, с учетом частоты встречаемости каждой варианты; даем характеристику ряда; находим произведения вариант на соответствующую частоту, суммируем полученные произведения и рассчитываем среднюю арифметическую:

Первый этап

Второй этап

Длительность лечения (в днях) V

Число больных p

Ряд простой, убывающий, прерывный

Второй этап: рассчитываем d (V-M); d 2; d 2p.

Заключение: Средняя длительность лечения ангины в поликлинике составила 11 дней. Средняя является недостаточно типичной для данного ряда, о чем свидетельствует коэффициент вариации, равный 36,5% (большая степень разнообразия признака).

Загрузка...
Top