Введение / Introduction
Современная эпоха характеризуется интенсивной интеграцией искусственного интеллекта (далее – ИИ) в различные сферы человеческой деятельности. Интеллектуальные программы и приложения, включая системы распознавания речи, становятся неотъемлемой частью повседневной жизни. Согласно исследованию, проведённому профессорами С. А. Шомовым и А. Г. Качкаевым [1], на 2024 г. уровень осведомленности об ИИ в России значительно высок: 84% респондентов положительно ответили на вопрос о знании ИИ. При этом около четверти опрошенных (24%) используют генеративные технологии ИИ для личных или профессиональных нужд. Особый интерес вызывает предпочтение респондентами российских решений: почти половина (47%) из числа использующих ИИ отдают предпочтение отечественным разработкам, таким как GigaChat и Kandinsky от «Сбера», а также YandexGPT и «Шедеврум» от компании «Яндекс».
Одним из наиболее распространенных примеров применения ИИ в повседневной жизни является распознавание человека по лицу. Сегодня практически в каждом магазине у покупателя есть возможность совершить оплату посредством биометрической идентификации. Так называемая «оплата улыбкой» представляет собой сервис, позволяющий оплачивать товары в магазинах, кафе и других торговых точках с помощью автоматизированной системы распознавания лиц. Для завершения транзакции пользователю больше не требуется доставать банковскую карту, использовать смартфон или вводить PIN-код: достаточно краткого взгляда в камеру терминала. Как отмечается в публикации «Оплата улыбкой: что важно знать о новой возможности?» [2], подобные сервисы демонстрируют растущую интеграцию нейросетевых алгоритмов в бытовые практики и существенно упрощают взаимодействие человека с цифровой инфраструктурой.
В основе ИИ лежит огромный объем математических теорий и методик, одними из которых являются теория вероятностей и математическая статистика, используемые во всех аспектах машинного обучения.
Теория вероятностей и математическая статистика – это раздел математики, изучающий случайные явления и их статистические закономерности. Данный курс играет важную роль в развитии у студентов статистических представлений, способностей к логическому мышлению, аналитическим суждениям и практическому применению методов обработки данных, отмечают Н. Тинтли и Б. Чанс в учебной программе «Борьба с антистатистическим мышлением с использованием методов, основанных на моделировании, на протяжении всего обучения в бакалавриате» [3]. Однако данный курс математики в вузе студенты считают «абстрактным, скучным и бесполезным». Такая оценка обусловлена отсутствием очевидной связи между теоретическими положениями и реальными педагогическими ситуациями, в которых будущим учителям предстоит применять математические знания. Как отмечают Ч. Чжао и Л. Шэнг, в процессе обучения студентов педагогических направлений часто возникают типичные затруднения: «непонимание теории, малое количество практико-ориентированных задач и отсутствие вовлечённости в процесс обучения» [4]. По мнению исследователей, подобные факторы снижают мотивацию к изучению математики и формируют устойчивое ощущение ее оторванности от профессиональных потребностей.
Одним из перспективных подходов решения данной проблемы является интеграция языка программирования Python [5] и его аналитических библиотек (NumPy [6], Pandas [7], SciPy [8], Scikit-learn [9] и др.) в содержание курса теории вероятностей и статистики. Применение вычислительных средств позволяет перейти от абстрактных теоретических понятий к интерактивной, наглядной и практико-ориентированной форме обучения, способствующей формированию прикладных компетенций, востребованных в современном научно-техническом и образовательном пространстве.
В статье проводится анализ актуальности внедрения практических заданий с использованием инструментов Python в образовательный процесс по теории вероятностей и статистике, а также рассматривается зарубежный и отечественный опыт реализации такого подхода. Кроме того, оцениваются педагогические результаты внедрения элементов ИИ в учебный процесс, выявляются ключевые методологические и дидактические аспекты эффективной интеграции цифровых технологий в структуру математических дисциплин.
Обзор литературы / Literature review
В последние годы наблюдается интенсивное обновление подходов к преподаванию математических дисциплин в вузах, включая теорию вероятностей и математическую статистику. Р. Дамар и С. Чжао [10] связывают данную тенденцию как с цифровизацией сфер науки и экономики, так и с необходимостью формирования у студентов универсальных цифровых компетенций, особенно актуальных в эпоху искусственного интеллекта и анализа данных.
В первую очередь стоит отметить, что сейчас существует множество факторов, способствующих проблемам в обучении студентов. Доктор Вавилонского университета Р. Х. Абдулсахиб [11] в своей работе выделяет следующие: недостаточное понимание основ математики, нарушения визуального и символического познания, языковые препятствия и короткое время удержания информации в памяти. Кроме того, по его мнению, распространенные проблемы, такие как снижение мотивации, недостаточная математическая подготовка, неправильные представления о сложности математики, чрезмерная зависимость от смартфонов во время дистанционного обучения, пассивная вовлеченность во время уроков и трудности с расшифровкой математических символов, еще больше осложняют условия обучения.
О том, что призывы к трансформации бакалаврского образования получили резонанс на национальном уровне, отмечают в своей работе профессора Гарвардского университета Дж. П. Холдрен и Э. Лендер [12]. Профессор математики П. Зорн и другие авторы книги «Гениальный проект: Математика, статистика и подготовка к ХХI веку» делают вывод: «Традиционная программа по статистике с математическими основами не поспевает за растущим спросом на студентов, которые могут осмысливать данные» [13].
В книге «Важнейшая статистика: изучение мира с помощью данных» [14] профессор Р. Гулд и соавторы подчеркивают, что преподавание статистики не может ограничиваться абстрактными формулами, что должна происходить замена традиционных подходов современными методами, включая программирование и анализ данных. Изучение математики должно подкрепляться анализом реальных данных и визуализацией результатов.
Необходимость включения элементов анализа данных и программирования в традиционные курсы статистики была отмечена и в рамках инициативы Data Science Education, поддерживаемой NSF (Национальный научный фонд США).
Современное образование в области статистики и математики должно учитывать растущую роль науки о данных и искусственного интеллекта, интегрируя практико-ориентированные навыки, востребованные в реальной профессиональной среде.
Одним из таких направлений стала инициатива EducateAI [15], в рамках которой NSF опубликовал обращение к преподавателям (Dear Colleague Letter), призывающее к разработке инклюзивных образовательных программ по ИИ. Эти программы предполагают включение анализа данных и программирования в подготовку учащихся — начиная с уровня K–12 (школьное образование) и до уровня бакалавриата. Основной акцент делается на развитии инфраструктуры, создании современных учебных материалов и формировании сообществ преподавателей.
В рамках программы TRIPODS (Transdisciplinary Research in Principles of Data Science) [16] NSF также поддерживает пятилетнюю инициативу, направленную на развитие инноваций в области науки о данных. По программе TRIPODS университеты и исследовательские центры реализуют как научные, так и образовательные проекты, предоставляя студентам возможность получать практический опыт в решении междисциплинарных задач, объединяющих математику, компьютерные науки и статистику.
Обе инициативы отражают общее стремление трансформировать традиционные подходы к обучению, делая акцент на прикладной и междисциплинарный характер современной статистики и анализа данных.
В России идея интеграции цифровых технологий в математическое образование нашла отражение в докладах, представленных академиками РАН (доклад «Основания математического образования в цифровой век» [17]). В настоящее время цифровая трансформация математической учебной деятельности учащихся идет и в России, и во всем мире. В системе инженерной подготовки речь должна идти о приобретении опыта использования всех инструментов компьютерных вычислений, в том числе – алгебраических, аналитических; математики, лежащей в основе систем моделирования и проектирования для соответствующей инженерной области. Для реализации принципов современного математического образования в России, а именно цифровой трансформации, должны быть внедрены цифровые технологий в образовательном процессе, в том числе – в процессе государственной итоговой аттестации, а также изменен процесс подготовки учителей математики, информатики.
Согласно мнению Б. Хунцюань и соавторов [18], программирование на Python может стать инструментом решения основных проблем обучения и изучения математических дисциплин в вузах, так как оно активизирует познавательную деятельность студентов, развивает критическое мышление, формирует межпредметные связи и поддерживает персонализированное обучение.
К. Завез и О. Харель в статье «Преподавание статистических концепций с использованием компьютерных инструментов: обзор литературы» [19] провели анализ более двух тысяч статей базы данных Scopus в поисках ответа на вопрос, какие вычислительные инструменты уже созданы и используются для оказания помощи студентам бакалавриата и магистратуры в развитии их концептуального или теоретического понимания и для каких статистических концепций. Из большого исходного количества всех работ, используя стратегию систематического поиска, они определили 70 исследований и обобщили их по образовательным условиям, вычислительному инструменту и статистической концепции. Результат работы – почти в половине статей использовался язык программирования R. Кроме того, большинство статей были посвящены статистическим концепциям начального уровня, не требовали от студентов написания или запуска кода, и их авторы не проводили исследований для оценки влияния инструмента на понимание учащимися. Это исследование чрезвычайно важно, потому что многие студенты бакалавриата и магистратуры должны пройти вводный курс статистики, и эти методы могут быть распространены на курсы более высокого уровня.
Х. Уикхем — известный автор и один из лидеров сообщества языка R. Его работы часто подчёркивают необходимость перехода от классической «бумажной» статистики к цифровой практической работе с данными. В материале курса Stats337: Readings in Applied Data Science для Стэнфорда Уикхем объединяет статистику и программирование, утверждая, что современный курс статистики должен включать «компьютерное вычисление» и «мышление, ориентированное на работу с данными» [20]. Он утверждает, что «программирование является языком современного статистического мышления», и предлагает интеграцию анализа данных с помощью Python, R и SQL в базовые курсы теории вероятностей.
Python как язык программирования для анализа данных стал стандартом в научной и инженерной среде. Это связано с его синтаксической простотой и богатой экосистемой библиотек: NumPy и SciPy для численных вычислений, Pandas для работы с данными, Matplotlib и Seaborn для визуализации, Statsmodels для статистического анализа и Scikit-learn для построения моделей машинного обучения.
Консультант по машинному обучению, преподаватель О. Жерон в книге «Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow» [21] подчеркивает, что обучение основам машинного обучения и вероятностным моделям невозможно без практического программирования, где Python занимает центральное место.
Исследование разработчика в Shopify К. Дэвидсон-Пайлона в книге «Вероятностное программирование на Python: байесовский вывод и алгоритмы» [22] показывает, как сложные концепции байесовской статистики становятся доступными студентам с помощью визуального моделирования и интерактивных симуляций на Python. Такой подход позволяет студентам не только решать задачи, но и глубже понимать закономерности поведение вероятностных систем.
В отечественной литературе также отмечается значимость использования Python в преподавании статистики. В частности, в статье «Теория вероятностей и ее применение в информационных технологиях» [23] авторы Р. Р. Ойчуева, А. Ж. Кудуев и А. Т. Ажибекова подчеркивают, что для повышения качества знаний студентов при изучении теории вероятностей важно определить, какие информационные технологии целесообразно использовать в процессе обучения математике. Они отмечают, что широкое распространение и применение информационных технологий оказывает значительное влияние на систему образования и требует постоянных реформ.
Многие российские вузы начали внедрение курсов по анализу данных на Python как в рамках основной образовательной программы, так и в виде элективных дисциплин. Отмечается также, что Python имеет низкий порог вхождения по сравнению с другими языками (например, R или MATLAB), что делает его особенно удобным для студентов гуманитарных специальностей.
Кроме того, сейчас уже созданы готовые учебные пособия по изучению теории вероятностей и математической статистики на Python, рассмотрим некоторые из них.
«Задачи математической статистики и их решение с использованием языка программирования Python» [24]. Авторы данного пособия Е. А. Буровский и Ю. Б. Гришунина приводят теоретические сведения и практические задачи, решаемые с помощью Python. Сборник содержит задачи и методы их решения с подробными комментариями, а также перечислены функции и методы языка Python, которые рекомендуется применять при проведении вычислений. Это пособие предназначено для студентов всех специальностей и направлений подготовки, изучающих дисциплину «Теория вероятностей и математическая статистика».
«Использование языка Python в теории вероятностей» [25] и «Статистические вычисления на платформе Jupyter Notebook с использованием Python» [26] С. Я. Криволапова. В этих трудах автор подчеркивает, что Python и Jupyter‑ноутбуки позволяют интегрировать теорию и практику, проводить моделирование дискретных и непрерывных процессов, строить статистические оценки и тесты в одной среде, что снижает порог входа для студентов нехимико-математических направлений.
«Решение задач теории вероятностей и математической статистики в Python» А. Н. Титова (КНИТУ) [27]. Представлены задачи по теории вероятностей и математической статистике, и их реализация на языке Python. Описана технология работы с модулями scipy.stats и statistics, приведены необходимые теоретические сведения и формулы для решения рассмотренных задач.
«Теория вероятностей и математическая статистика: учебник для вузов» В. Н. Калинина [28]. Цель учебника – внести вклад в формирование у студентов следующих общекультурных и профессиональных компетенций:
‒ владение культурой мышления, способность логически мыслить, анализировать и обобщать информацию;
‒ способность, руководствуясь содержанием конкретной задачи, выбрать из арсенала вероятностных и математико-статистических методов наиболее эффективные методы ее решения;
‒ способность использовать при решении задач современные технические средства и пакеты прикладных задач.
Исходя из многих соответствующих исследований, становится очевидным, что интеграция программирования на Python в учебные курсы повышает математические знания студентов, независимо от их предварительного знакомства с языком программирования.
Методологическая база исследования / Methodological base of the research
Цель статьи — обосновать и разработать методические подходы для интеграции практико-ориентированных заданий с использованием инструментов искусственного интеллекта и программирования (в частности, Python) в курс теории вероятностей и статистики в вузе.
В рамках данного исследования были применены теоретические методы: анализ базовых понятий, анализ отечественной и зарубежной научной и методической литературы (научные статьи, монографии, учебные, методические пособия) и анализ государственных и международных документов. В основе методологии исследования:
‒ деятельностный подход (Л. С. Выготский [29], А. Н. Леонтьев [30]), акцентирующий внимание на активной субъектной роли обучающегося в процессе усвоения знаний;
‒ компетентностный подход, зафиксированный в положениях Федеральных государственных образовательных стандартов высшего образования (ФГОС ВО [31]), а также представленный в трудах отечественных исследователей (И. А. Зимняя [32], А. В. Хуторской [33]);
‒ конструктивистская педагогика (Ж. Пиаже [34], Дж. Брунер [35]), в соответствии с которой обучение рассматривается как процесс активного построения знаний на основе личного опыта обучающегося;
‒ принципы цифровой дидактики (И. Г. Алехина [36], Л. Ю. Монахова [37]), определяющие методологические и технологические аспекты интеграции цифровых ресурсов и платформ в образовательную среду.
Эмпирическая основа исследования включает:
‒ анализ содержания и структуры учебных курсов ведущих российских вузов (МГУ, ВШЭ, КФУ, МФТИ), реализующих преподавание теории вероятностей и статистики с элементами цифровых технологий;
‒ изучение практик внедрения программирования и ИИ-инструментов в образовательный процесс, зафиксированных в современных научных публикациях (М. С. Долинский [38], а также указанные работы С. Я. Криволапова);
‒ проведение педагогического эксперимента, направленного на апробацию практико-ориентированных заданий с использованием Python и инструментов искусственного интеллекта в рамках лабораторных работ студентов.
Методология исследования предполагает использование междисциплинарного подхода, совмещающего элементы педагогики, прикладной математики и информационных технологий. Это позволяет оценивать не только освоение содержания учебной дисциплины, но и изменение уровня профессиональных и цифровых компетенций обучающихся.
Результаты исследования / Research results
В рамках данного исследования были разработаны материалы практических и проверочных заданий, а также проведены занятия по курсу «Теория вероятностей и статистика» со студентами 2-го курса Вологодского государственного университета (ВоГУ). Курс состоял из двух больших разделов: теория вероятностей и математическая статистика.
В первом разделе, посвященном теории вероятностей, студенты познакомились с основными понятиями, такими как комбинаторика, правила суммы и произведения, размещения, перестановки, сочетания, случайные события, вероятности, независимость событий, условные вероятности, теорема Байеса, законы распределения случайных величин и основные методы их анализа. Особое внимание уделялось различным типам случайных величин: дискретным и непрерывным, а также их характеристикам, таким как математическое ожидание, дисперсия, коэффициент вариации и другие.
В ходе курса активно использовались практические задания, направленные на закрепление теоретических знаний и развитие навыков самостоятельной работы с реальными данными. В примере практического задания (рис. 1) студентам предлагается:
- найти все перестановки элементов множества {1,2,3};
- найти все сочетания по 2 элемента из множества {1,2,3};
- найти все сочетания с повторениями из множества {1,2,3} по 2 элемента;
- найти все перестановки из множества {1,1,2}.
Рис. 1. Код решения практического задания
Результат:
- Перестановки: [(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)];
- Сочетания: [(1, 2), (1, 3), (2, 3)];
- Сочетания с повторениями: [(1, 1), (1, 2), (1, 3), (2, 2), (2, 3), (3, 3)];
- Перестановки с повторениями: {(1, 2, 1), (2, 1, 1), (1, 1, 2)}.
После каждого раздела студентам были предложены теоретические и практические проверочные задания, позволившие оценить уровень усвоения пройденного материала и способность применять полученные знания для решения прикладных задач. Примеры заданий: «Решите задачу: вероятность появления события A — 0.6, события B — 0.4, их совместное появление — 0.3. Найдите вероятность наступления хотя бы одного из событий. Постройте функцию распределения заданной дискретной случайной величины. Постройте доверительный интервал для среднего значения при неизвестной дисперсии. Найдите коэффициент корреляции Пирсона между двумя переменными».
Код решения:
- Найдем вероятность наступления хотя бы одного из событий A или B (рис. 2).
Рис. 2. Код нахождения вероятности события
- Функция распределения дискретной случайной величины (рис. 3);
Рис. 3. Код построения функции распределения
- Доверительный интервал при неизвестной дисперсии (используется t-распределение, см. рис. 4);
Рис. 4. Код нахождения доверительного интервала при неизвестной дисперсии
- Корреляция Пирсона между двумя переменными (рис. 5);
Рис. 5. Код нахождения корреляции Пирсона
Второй раздел, посвященный математической статистике, включал в себя методы сбора и анализа данных, построение выборочных характеристик, проверку гипотез и оценку параметров распределений. Студенты ознакомились с принципами статистической обработки данных, применением статистических критериев и методов оценки. Основное внимание было уделено важности правильного анализа данных и интерпретации результатов.
Содержание практических заданий было подготовлено на основе реальных датасетов, одним из которых был датасет о качестве воды.
В этом наборе данных были представлены измерения и оценки качества воды, связанные с ее пригодностью для питья. На основе анализа набора данных можно составить представление о параметрах качества воды, провести учебные исследования, помочь определить, пригодна ли вода для питья или нет. Каждая строка в наборе данных представляет образец воды с определенными характеристиками, такими, как: pH (уровень pH воды); жесткость (жесткость воды, мера содержания минералов); твердые вещества (общее количество растворенных твердых веществ в воде); хлорамины (концентрация хлораминов в воде); сульфат (концентрация сульфатов в воде); проводимость (электропроводность воды); оrganic carbon (содержание органического углерода в воде); тригалометаны (концентрация тригалометанов в воде); мутность (уровень мутности, показатель прозрачности воды); питьевая способность (целевая переменная, указывает на пригодность воды для питья со значениями 1 – «питьевая» и 0 – «не питьевая»).
Целью работы студентов являлось научиться применять модель линейной регрессии для обработки данных о качестве воды.
Задание:
«Решить задачу регрессии для данных: жесткость воды и хлорамины, жесткость воды и содержание органического углерода в воде; построить гистограммы распределения.
Процесс выполнения работы включал ряд этапов:
- Создать блокнот в среде Google Colab.
- Загрузить библиотеки, необходимые для решения задачи.
- Построить точечную диаграмму по исходным данным.
- Добавить подписи осей, изменить внешний вид маркеров.
- Модель линейной регрессии натренировать для наших данных.
- Определить коэффициенты модели линейной регрессии.
- Построить диаграмму с графиком линейной регрессии.
- Построить гистограмму распределения изучаемой характеристики качества воды.
Рис. 6. Код визуализации линейной регрессии жесткости воды и содержания хлораминов
Рис. 7. Гистограмма распределения хлораминов в пробах воды
Работая с данными о качестве воды, студенты знакомились с алгоритмом решения задачи контролируемой бинарной классификации, в которой модели машинного обучения можно обучить прогнозированию пригодности воды для питья на основе предоставленных атрибутов качества воды (см. результаты выполнения задания на рис. 6 и 7).
В конце курса по теории вероятностей и математической статистике было проведено итоговое тестирование студентов. Для оценки эффективности данных методических изменений результаты текущего тестирования были сопоставлены с аналогичными показателями предыдущего учебного года, полученными от контрольной группы студентов того же направления, обучавшихся без внедрения цифровых инструментов (табл. 1).
Таблица 1
Сравнение результатов тестирования
|
Показатель |
Контрольная группа |
Экспериментальная группа |
Разница |
|
Средний % правильных ответов |
70% |
80% |
+10% |
|
Среднее время выполнения, мин |
85 мин |
70 мин |
–15 мин |
Повышение точности ответов на 10% свидетельствует об улучшении понимания теоретического материала и способности применять его на практике, а сокращение времени выполнения заданий связано с ростом практических Навыков работы с инструментами анализа данных и моделирования, а также более высокой степенью автоматизации вычислений с использованием Python.
По окончании курса был проведен анонимный опрос в электронном виде студентов экспериментальной группы, целью которого было выявить уровень освоения содержания курса, мотивации, удовлетворенности обучением и восприятие современных технологий в учебном процессе.
Таблица 2
Примеры вопросов и процент положительных ответов анонимного опроса
|
Вопрос |
% положительных ответов |
|
Использование Python помогло лучше понять материал курса? |
78% |
|
Лабораторные работы были интересными и мотивирующими? |
82% |
|
Хотелось бы использовать такие технологии и в других дисциплинах? |
85% |
|
Уровень вовлеченности в обучение увеличился? |
78% |
Результаты опроса демонстрируют высокий уровень удовлетворенности студентов новым форматом обучения. Студенты:
‒ лучше понимают материал благодаря визуализации и программированию;
‒ становятся более мотивированными за счет прикладной направленности курса;
‒ отмечают рост практических навыков, в том числе цифровых компетенций;
‒ проявляют инициативу в использовании таких подходов за пределами одной дисциплины.
Опрос подтвердил, что использование современных цифровых инструментов не только улучшает учебные результаты, но и существенно влияет на образовательную мотивацию и осознанность обучающихся.
Заключение / Conclusion
Проведённое исследование подтвердило обоснованность включения практико-ориентированных заданий на основе инструментов ИИ и программирования (в частности, Python) в курс теории вероятностей и статистики в вузе. Такой подход позволяет актуализировать содержание учебной дисциплины, повысить мотивацию студентов и обеспечить формирование как предметных, так и междисциплинарных компетенций.
Интеграция программирования на Python способствует переходу от абстрактного изучения теоретического материала к его осмысленному применению в прикладных задачах, что, в свою очередь, активизирует познавательную деятельность обучающихся. Полученные данные подтверждают, что внедрение элементов анализа данных, автоматизации вычислений и визуализации способствует более глубокому пониманию вероятностных моделей, развитию критического мышления и исследовательских навыков.
Разработанные методические подходы, опирающиеся на деятельностный, компетентностный и конструктивистский подходы, а также принципы цифровой дидактики, продемонстрировали свою эффективность в условиях педагогического эксперимента. Студенты, участвовавшие в эксперименте, показали более высокий уровень вовлечённости, устойчивой учебной мотивации и уверенного применения цифровых инструментов в решении учебных и профессиональных задач.
Дальнейшие перспективы работы связаны с разработкой типовых модулей для курсов теории вероятностей и статистики с акцентом на практическое использование ИИ, а также с оценкой долгосрочного влияния подобных подходов на профессиональное становление обучающихся.

Maxim S. Belov