Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики

Библиографическое описание статьи для цитирования:
Жукова Г. Н. Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики // Научно-методический электронный журнал «Концепт». – 2015. – № 8 (август). – С. 56–60. – URL: http://e-koncept.ru/2015/15268.htm.
Аннотация. Предлагается наглядный способ определения типа вероятностного распределения по выборочным коэффициентам асимметрии и эксцесса. На координатной плоскости «коэффициент асимметрии – коэффициент эксцесса» отмечены точки, линии и области, соответствующие наиболее употребительным вероятностным распределениям. Эта карта позволяет легко ориентироваться в многообразии вероятностных распределений, подбирать для анализируемых экспериментальных данных наиболее подходящие типы распределений, а также сразу исключать из рассмотрения целые семейства распределений со значениями коэффициентов асимметрии и эксцесса, далекими от выборочных.
Комментарии
Нет комментариев
Оставить комментарий
Войдите или зарегистрируйтесь, чтобы комментировать.
Текст статьи
Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 1

ART15268УДК 372.851

Жукова Галина Николаевна,кандидат физикоматематических наук, доцент кафедры прикладной математики и моделирования систем ФГБОУ ВПО Московский государственный университет печати имени Ивана Федорова», г. Москваgnzh@mail.ru

Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики

Аннотация. Предлагается наглядный способ определения типа вероятностного распределения по выборочным коэффициентам асимметрии и эксцесса. На координатной плоскости коэффициент асимметрии–коэффициентэксцесса» отмечены точки, линии и области, соответствующие наиболее употребительным вероятностным распределениям. Эта карта позволяет легко ориентироваться в многообразии вероятностных распределений, подбирать для анализируемых экспериментальных данных наиболее подходящие типы распределений, а также сразу исключать из рассмотрения целые семейства распределений со значениями коэффициентов асимметрии и эксцесса, далекими от выборочных.Ключевые слова: коэффициент асимметрии, коэффициент эксцесса, дискретные распределения, непрерывные распределения, теория вероятностей, математическая статистика.Раздел:01 педагогика; история педагогики и образования; теория и методика обучения и воспитания по предметным областям.

Изучая теорию вероятностей, студенты знакомятся с наиболее известными дискретными и непрерывными распределениями, в их число традиционно входит нормальное распределение, равномерное непрерывное и дискретное и некоторые другие. В курсе математической статистики приходится решать вопрос о том, к какому типу относится распределение данной выборки. По виду гистограммы может показаться, что распределение нормальное, а при подборе параметров по выборочным среднему и дисперсии проверка тестом Колмогорова –Смирнова или по критерию Пирсона даст отрицательный результат. Для более глубокого изучения вероятностных распределений и их взаимосвязи предлагается широко использовать такие характеристики распределений, как коэффициенты асимметрии и эксцесса см. 1 и2. Сразу оговоримся, что всѐдальнейшее изложение будет касаться только таких распределений, которые имеют конечные моменты четвертого порядка это необходимо для существования коэффициентов асимметрии и эксцесса. Идея идентификации типа распределения по коэффициентам асимметрии и эксцесса восходит к работам Карла Пирсона 3, делившего вероятностные распределения на типы в зависимости от соотношения значений коэффициента эксцесса и квадрата коэффициента асимметрии.Выборочные коэффициенты асимметрии и эксцесса, вычисленные по экспериментальным данным, определяют точку на координатной плоскости с коэффициентами асимметрии и эксцесса в качестве координатных осей. Эта точка может оказаться в области, соответствующей какомулибо классическому распределению, может быть вблизи или же достаточно далеко от областей, соответствующих рассматриваемым в работе классическим распределениям. В последнем случае предлагаемый метод не позволяет подобрать классическое распределение. Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 2

В ситуации, когда значения коэффициентов асимметрии и эксцесса принимают значения такие же или близкие к допустимым значениям для некоторого классического распределения, выдвигается гипотеза о том, что наблюдаемая случайная величина имеет такое распределение. По коэффициентам асимметрии и эксцесса можно восстановить параметры распределения один или несколько. Если вычисленные с этими параметрами математическое ожидание и дисперсия значимо отличаются от выборочных, то производятся нормировка и сдвиг наблюдаемой случайной величины таким образом, чтобы у полученной случайной величины математическое ожидание и дисперсия оказались равными значениям, соответствующим выбранному классическому распределению с параметрами, восстановленными по коэффициентам асимметрии и эксцесса. Заметим, что у построенной с помощью линейного преобразования случайной величины коэффициенты асимметрии и эксцесса точно такие же, как и у исходной. Если у классического распределения лишь один параметр, его рекомендуется восстанавливать по коэффициенту асимметрии.Пустьнаблюдается случайная величина, линейным преобразованием сдвига и масштаба построим по ней случайную величину:.(1)Выразим моменты и коэффициенты асимметрии и эксцесса случайной величины через соответствующие характеристики случайной величины.Математическое ожидание

Дисперсия

Третий центральный момент

Четвертый центральный момент

Коэффициент асимметрии

Коэффициентэксцесса

Как видно, коэффициенты асимметрии и эксцесса не изменяются при линейном преобразовании, что позволяет подбирать вид распределения по выборочным коэффициентам асимметрии и эксцесса случайной величины.В соответствии с подобранным распределением вычисляются математическое ожиданиеи дисперсия, что дает возможность вычислить параметры сдвига и масштаба вформуле 1: , .(2)Заметим, что по значениям выборочных коэффициентов асимметрии и эксцесса не всегда возможно подобрать хотя бы одно классическое» распределение. Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 3

Возможна и такая ситуация, когда одному набору значений можетсоответствовать два и более известных распределений. Так, в точке обнаруживаются все нормальные распределения , так что получается некоторая неопределенность , . В этом случае можно просто положить , что соответствует нулевому сдвигу и единичному масштабу, а параметры нормального распределения взять равными выборочному среднему и выборочному среднеквадратическому отклонению. Впрочем, все семействонормальных распределений сдвигом и масштабом сводится к стандартному нормальному распределению, так что именно к нему будем сводить выборку со значениями коэффициентов асимметрии и эксцесса, близкими к нулю. Более интересен случай, когда точка попадает в область возможных значений бетараспределения, поскольку в ней обнаруживаются, помимо бетараспределения,еще и биномиальное, пуассоновское, отрицательное биномиальное и некоторые другие распределения. К этому вопросу мы вернемся чуть позже. Подбор распределения по выборочным коэффициентам асимметрии и эксцесса удобно проводить с помощью карты, на которой в общей системе координат горизонтальная ось –коэффициент асимметрии, вертикальная –коэффициент эксцесса представлены области точки, кривые, области, ограниченные кривыми, соответствующие известным распределениям. На рис. 1 изображен фрагмент такой карты.

Рис.1. Коэффициенты асимметрии и эксцесса основных распределений

Равномерное непрерывное распределение заслоняет красный кружочек полукругового распределения, а логистическое распределение попадает на красный треугольник распределения Стьюдента. На рис. 2 эти маркеры видны лучше.Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 4

Область между зеленой и красной параболами соответствует бетараспределению. В эту область кроме бетараспределения попадают также:отрицательное биномиальное распределение;биномиальное распределение;распределение Пуассона черная линия между биномиальным и отрицательным биномиальным распределением.Заметим, что систему координат можно выбрать и иначе:вместо коэффициента асимметрии взять его квадрат. Это позволит превратить» параболы в прямые, вид карты станет проще. К сожалению, при этом склеиваются» точки, отличающиеся только знаком коэффициента асимметрии. Отделить» друг от друга распределения с положительным и отрицательным коэффициентом асимметрии можно, откладывая по горизонтальной оси значения квадрат коэффициента асимметрии с учетом знака. Вблизи начала координат получается примерно такая картина:

Рис.2. Основные распределения в системе координат

На рис.2 лучше видны точки, соответствующие симметричным распределениям;параболы превратились в графики модуля.Приведем несколько примеров расчета параметров распределения по коэффициентам асимметрии и эксцесса. При изучении характеристик распределений студентам будет полезно самостоятельно проделать соответствующие расчеты для простых случаев.Распределение БернуллиРаспределение Бернулли имеет один параметр Коэффициенты асимметрии и эксцесса равнысоответственно и,где Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 5

Возведем в квадрат коэффициент асимметрии, вычтем 2 и получим коэффициент эксцесса:.Так что забегая вперед, заметим, что это недостижимая нижняя граница бетараспределения.Параметр выражается через коэффициенты асимметрии и эксцесса так:

Биномиальное распределениеУ этого распределения два параметра –

и. Коэффициенты асимметрии и эксцесса равнысоответственно и, , отсюда.Преобразование квадрата коэффициента асимметрии к видус учетом дает.Окончательно получим , этосемейство парабол, сдвинутых вниз на .Параметр выражается так:.Отрицательное биномиальное распределениераспределение ПаскаляЭто распределение дискретной случайной величины, равной количеству произошедших неудач в последовательности испытаний Бернулли с вероятностью успеха p, проводимой до rго успеха. Как обычно, обозначим .Коэффициенты асимметрии и эксцесса равнысоответственно и.Заметим, что.Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 6

Ввиду тогочто для положительных чисел выполняется неравенство , получаем , следовательно .Придадим коэффициенту эксцесса вид.

–семейство частей правых ветвей парабол, сдвинутых вверх на .Параметр выражается так:

ГаммараспределениеКак известно, у гаммараспределения два параметра, и, матожидание и дисперсия зависят от них обоих:, . А вот коэффициенты асимметрии и эксцесса выражаются только черезпараметр :, . Легко видеть, что , и по коэффициентам асимметрии и эксцесса можно найти параметр :, .Заметим, что при целых значениях параметра гаммараспределение называется распределением Эрланга, при и четных –распределением.Приведем для вышеописанных и некоторых других классических распределений таблицу коэффициентов асимметрии и эксцесса, включающую также матожидание и дисперсию.Формулы 3 и 4 выпишем отдельно ввиду их громоздкости:

(3)Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 7

(4)Таблица 1Коэффициенты асимметрии и эксцесса

Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 8

биномиальное, при распределение Бернулли



отрицательное биномиальное, при геометрическое



, Пуассона



Еще раз отметим, что одному набору значений коэффициентов асимметрии и эксцесса могут соответствовать несколько распределений. Так, у распределения Вейбулла с параметрами ии у бетараспределения с и одинаковый набор коэффициентов асимметрии и эксцесса, ).Сгенерированные при помощи Mt 7.1 выборки объема 10000 были центрированы своими выборочными средними и нормированы выборочными среднеквадратическими отклонениями. Получились две выборки с одинаковыми выборочными средними и выборочными дисперсиями, коэффициенты асимметрии и эксцесса были близки к теоретическим значениям, азначит, идруг к другу. Тест Колмогорова–Смирнова при уровнях от 1% до 5%показал, что нет оснований считать эти выборки представляющими разные распределения. Полученный результат позволяет предположить, что при подборе распределения реальных данных в аналогичном случае решение может быть не единственным если в качестве критерия качества использовать тест Колмогорова–Смирнова.При обработке данных о времени работы программы, реализующей сортировку массива равномерно распределенных случайных чисел, были получены следующие результаты.Таблица 2Данные о времени работы алгоритмов 1 и 2

АлгоритмОбъем массиваКт асимметрииКт эксцессаJBtestKStest11000.03170.01460012000.01270.02290021000.25390.21881

22000.23280.20481

Время работы первого алгоритма, судя по коэффициентам асимметрии и эксцесса, имеет нормальное распределение, что и подтверждается тестами Jrue –Ber и Колмогорова –Смирнова.Для анализа времени работы второго алгоритма рассмотрим карту коэффициентов асимметрии и эксцесса вблизи начала координат.



Файлы с данными о трудоемкости алгоритмов при фиксированных длинах входов в элементарных операциях любезно предоставлены М.В. Ульяновым и получены в ходе экспериментальных исследований алгоритмов, проведенных в процессе написания книги 4.Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 9











Рис.3. Распределения вблизи начала координат в системе

Как видно, набору коэффициентовасимметрии и эксцесса выборок, соответствующих второму алгоритму, не соответствует никакое классическое распределение. Ближе всего к точкам, соответствующим этим выборкам,находится линия логнормального распределения. Достаточно близки к выборочным значениям точки, соответствующие логнормальному распределению с и. Проверка тестом Колмогорова –Смирнова показала, что первая выборка касающаяся сортировки вторым методом массива из 100 элементов не согласуется с гипотезой о логнормальном распределении. А вот вторая выборка массив из 200 чисел согласуется с гипотезой о логнормальном распределении и с параметрами и.Предлагаемый способ определения типа распределения по выборочным коэффициентам асимметрии и эксцесса прост в использовании, с его помощью подбирать распределение обрабатываемых данных произвольной природы может даже пользователь, обладающий лишь минимальными знаниями теории вероятностей и статистики. К достоинствам метода можно отнести наглядность: карта распределений позволяет легко ориентироваться в многообразии распределений, подбирать наиболее подходящие распределения и сразу исключать из рассмотрения семейства распределений со значениями коэффициентов асимметрии и эксцесса, далекими от выборочных. Наглядность метода и его простота в использовании могут служить дополнительным стимулом для студентов при изучении курса теории вероятности и математической статистики 5,6.Недостатком метода является то, что даже у больших порядка 10000 последовательностей, полученных генератором случайных чисел, значения коэффициентов асимметрии и эксцесса могут значительно отличаться от теоретических.Для использования метода на практике можно рекомендовать проверять тестомКолмогорова–Смирнова гипотезу о непрерывном распределении с параметрами, восстановленными по коэффициентам асимметрии и эксцесса. При этом нужно подставлять значения параметров распределения, отступая на некоторую величину от значений, вычисленных по выборке. Величина отступа зависит от распределения и от задаваемого уровня критерия. Для дискретных распределений можно использовать критерий Пирсона ).Жукова Г. Н.Карта коэффициентов асимметрии и эксцесса в преподавании теории вероятностей и математической статистики// Концепт. –2015. –№ 08(август).–ART15268. –0,4п.л. –URL: http://ekoncept.ru/2015/15268.htm.–ISSN 2304120X. 10

Ссылки на источники1.Лоэв М. Теория вероятностей. –М.: Издво иностранной литературы, 1962. –719 с.2.КрамерГ. Математическиеметодыстатистики.–М.:Мир,1975. –648 с.3.Pearson K. Mathematical Contributions to the Theory of Evolution. III. Regression, Heredity and Panmixia. Philosophical Transactions of the Royal Society of London, 1896. 187, pp. 253–318.4.Петрушин В.Н., Ульянов М.В. Информационная чувствительность компьютерных алгоритмов. –М.: ФИЗМАТЛИТ, 2010. –224 с. 5.Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники? // Концепт. –2014. –№ 10 октябрь.–URL: http://ekoncept.ru/2014/14268.htm. 6.Жукова Г. Н. Преподавание математики студентам экономических специальностей: от практики к теории // Концепт. –2014. –№ 07 июль. –URL: http://ekoncept.ru/2014/14182.htm.

Galina Zhukova,Candidate of PhysicsMathematical Sciences, Associate Professor at the chair of Applied Mathematics and System Modeling, Moscow State University of Printing Arts, MoscowSkewnesskurtosis map as a probability theory and mathematical statistics tool (educational aspect)Abstract.The paper deals with a new approach to probability distributions identification, which is based on skewness and kurtosis of some wellknown ditriution. Thee ditriution’ kewne, nd kurtoi deterine urve, or point on the oordinte pne “kewness –kurtoi”. The pe kewne, nd kurtoi although determine a point on this plane. If this point belongs to the curve or the set of points, or places near them, we need to verify the hypothesis that the sample belongs to the corresponding distribution. The approach proposed is adapted to educational use in probability theory and statistics.Keywords: skewness, kurtosis, discrete distribution, continuous distribution, probability theory, statistics.References1.Lojev,M. (1962) Teorijaverojatnostej,Izdvoinostrannojliteratury, Moscow,719 p.(in Russian).2.Kramer,G. (1975) Matematicheskiemetodystatistiki,Mir, Moscow,648 p.(in English).3.Pearson,K. (1896) Mathematical Contributions to the Theory of Evolution. III. Regression, Heredityand Panmixia. Philosophical Transactions of the Royal Society of London,187, pp. 253–318 (in Russian).4.Petrushin, V. N. &Ul'janov,M. V. (2010) Informacionnajachuvstvitel'nost' komp'juternyhalgoritmov,FIZMATLIT, Moscow, 224 p. (in Russian).5.Zhukova,G. N. (2014 “Diskretnyeinepreryvnyeraspredelenij: ntipodyiirodtvenniki?”,Koncept,№ 10 (oktjabr').Available at: http://ekoncept.ru/2014/14268.htm (in Russian).6.Zhukova,G. N. (2014 “Prepodavaniematematikistudentamjekonomicheskihspecial'nostej: otpraktiki k teorii”,Koncept,№ 07 iju'.Available at: http://ekoncept.ru/2014/14182.htm (in Russian).

Рекомендованокпубликации:ГоревымП. М., кандидатомпедагогическихнаук, главнымредакторомжурнала