Full text

Введение / Introduction

 

Последние годы характеризовались не только количественным развитием процессов цифровизации образования [1], но и существенными, поистине революционными качественными изменениями, связанными с технологиями искусственного интеллекта. Речь идет о нейронных сетях, обрабатывающих графическую и текстовую информацию. Их стремительное появление уже оказало существенное влияние на течение образовательного процесса и, несомненно, окажет еще большее влияние в ближайшем будущем.

В рамках настоящего исследования мы остановимся на одной составляющей этой информационной революции – нейросетях для генерации изображений. Применительно к педагогической сфере можно отметить несколько «запаздывающий», на наш взгляд, характер научной рефлексии проблемы выявления и анализа педагогического потенциала этой технологии искусственного интеллекта. Как таковая технология уже существует и используется в той или иной мере всеми субъектами образовательного процесса, но осмысление ее возможных педагогических приложений еще далеко не завершено. Существует ряд вопросов, которые представляются, с одной стороны, весьма актуальными, а с другой стороны, не являются в полной мере раскрытыми к настоящему моменту: какова специфика современного уровня развития нейронных сетей применительно к возможным педагогическим приложениям? В частности, каковы возможности нейросетей для генерации изображений? Каковы основные направления применения в педагогическом процессе нейросетей для генерации изображений? Какова степень готовности обучающихся как субъектов образовательного процесса к работе с этой технологией?

Поиск ответов на поставленные вопросы является целью нашего исследования. Также цель нашего исследования – выявление уровня информированности студентов о работе нейросетей, отношения к их использованию, определение возникших трудностей, определение наиболее доступных и удобных нейросетей для использования в обучении, обоснование необходимости включения в содержание образования работы с такими приложениями.

 

Обзор литературы / Literature review

 

Спектр исследований как отечественных, так и зарубежных авторов, посвященных разнообразным практическим приложениям нейросетей (в том числе нейросетей для генерации изображений), весьма обширен.

В. В. Руанет и А. К. Хетагурова [2] в своей статье делают основной акцент на повышении уровня качества подготовки специалистов в результате внедрения новых инструментов в образовательный процесс. Они отмечают принципиально большую гибкость нейросетей в педагогическом плане, основанную на следующих факторах:

использовании параллельной обработки всего массива данных вместо детерминированного, пошагового и строго алгоритмизированного анализа информации; «замене программирования на обучение» [3].

Отметим, что педагогически обоснованная интеграция систем искусственного интеллекта в учебный процесс позволяет ставить вопрос о дальнейшем повышении качества обучения по сравнению с возможностями, которые давали информационные системы предыдущего поколения [4].

По мнению рассматриваемых авторов, особенно эффективными будут нейросетевые технологии при решении такой значимой педагогической задачи, как передача обучающимся эмпирических знаний.

Авторы полагают, что при этом будут разрешены следующие противоречия, характерные для современной педагогики:

̶          между актуальным достигнутым уровнем развития обучающегося и учебной задачей, ставящейся в процессе обучения;

̶          индивидуальной познавательной деятельностью обучающегося (теми формами, методами познания, которыми он владеет) и общественно-историческим познанием (теми формами, методами, которыми обучающемуся необходимо овладеть);

̶                   между общим накопленным в результате общественно-исторического развития объемом знаний и объемом тех знаний, которые непосредственно усваиваются обучающимся.

Значительный интерес представляет, на наш взгляд, исследование Ф. Петроски Сач с соавторами [5]. Рассматриваемые авторы концентрируются на проблеме создания алгоритмов обучения, которые позволяют автоматически генерировать «обучающие данные», среду обучения и учебные программы, чтобы повысить скорость обучения агентов «искусственного интеллекта». Ф. Петроски Сач с соавторами убедительно показывают, что реализация подобных алгоритмов возможна на основе использования «генеративных обучающих сетей» (GTN). Они отмечают, что основное преимущество GTN в рассматриваемом контексте состоит в возможности генерировать данные любого типа или среду обучения с любыми заданными свойствами. Рассматриваемые авторы отмечают, что эти возможности можно использовать как для «контролируемого», «неконтролируемого» обучения, так и для обучения с подкреплением.

Таким образом, мы можем констатировать существенную роль нейросетей в генерации обучающего контента для самих нейросетей. Возникает вопрос: могут ли нейронные сети, в частности генерирующие изображения, быть источником учебного контента применительно к педагогическому процессу? Ответ на этот вопрос является, безусловно, положительным.

Необходимо отметить, что исторически самым первым и до сих пор ведущим направлением применения нейросетей для генерации изображений в рамках педагогического процесса является генерация фотореалистических изображений как основы для отработки навыков диагностики студентов медицинских направлений подготовки.

К. Кокомото с соавторами [6] рассматривают достаточно локальную, но допускающую, по нашему мнению, существенные обобщения задачу генерации реалистичных «внутриротовых» изображений для обучения стоматологов. Будущие стоматологи нуждаются в опыте работы с клиническими случаями для отработки специальных навыков. При этом необходимость защиты личной информации реальных пациентов ограничивает возможности использования интраоральных изображений, полученных в клинических случаях. Соответственно, актуальной является генерация фотореалистичных изображений с помощью нейросетей.

М. Джанг с соавторами [7] рассматривают перспективы применения «генеративно-состязательных сетей» (GAN) для создания высокореалистичных рентгенограмм грудной клетки с высоким разрешением для их последующего использования в обучении студентов медицинских направлений подготовки. Данные авторы также выделяют следующие перспективные, на их взгляд, направления применения методов глубокого обучения в «медицинской визуализации» [8]:

̶          обнаружение повреждений;

̶          сегментация изображений;

̶          классификация изображений;

̶          реконструкция изображений.

К. Лао и Дж. Янг в своей работе [9] на примере обучения математике рассматривали режим обучения в «интеллектуальном классе», основанный на искусственном интеллекте, а также преимущества и недостатки обучения с использованием современных сетевых технологий. Данные авторы отмечают значительный потенциал систем распознавания изображения на основе искусственного интеллекта в образовательной деятельности. В качестве наиболее характерных примеров они рассматривают следующие:

̶          виртуальная обучающая среда – система обучения разговорному английскому языку, ориентированная на отработку произношения и артикуляции (поддерживающая распознавание артикуляции обучающегося);

̶          модель нейронной сети для нечеткой классификации размытых изображений жестов по четырем категориям (движение, расфокусировка, гауссово размытие и размытие по квадрату).

К. Лао и Дж. Янг анализируют использование различных нейросетей для решения задачи классификации учебных заданий (на примере курса математики).

Также они отмечают изменение роли преподавателя в учебном процессе в новых условиях: «Функция преподавателей будет все больше склоняться к роли наставника. Преподаватель будет концентрироваться на обучении методам, а не фактам, направлять учащихся к самостоятельному обучению, обучению учащихся жизненным принципам и развитию эмоционального интеллекта учащихся, индивидуальности и командного духа» [10].

Т. С. Буторина, Е. В. Ширшов и А. А. Иванченко [11] в своем исследовании концентрируются на нейронных сетях как инструменте интеллектуального анализа информации. Они отмечают, что «цель нейропедагогики – на практике оптимально и творчески решать педагогические задачи, используя знания об индивидуальных особенностях мозговой организации высших психических функций» [12]. Мы полагаем, что данное утверждение сохраняет актуальность до настоящего времени. В рамках такого подхода нейропедагогика рассматривается как результат синтеза педагогики и кибернетики, в рамках которого возникают предпосылки для реализации личностно ориентированного подхода [13].

В. В. Бова и А. Н. Дуккардт [14] основываются на имеющемся опыте применения нейросетей для решения задач поддержки принятия решений в рамках разнообразных предметных областей, в том числе педагогики. Они отмечают, что нейросетевые технологии позволяют эффективно решать задачи, которые характеризуются:

̶          индетерминированным характером процедуры поиска решения;

̶          значительной с вычислительной точки зрения сложностью получения конечного результата;

̶                   неточностью и неполнотой исходной информации, описывающей решаемую задачу.

В рамках своего исследования В. В. Бова и А. Н. Дуккардт предлагают «двухуровневую процедуру коллективного решения интеллектуальных задач», обладающую значительным потенциалом применительно к возможным педагогическим приложениям. Реализация такой процедуры позволяет интерпретировать решение, получаемое на выходе нейросети, как «средневзвешенное решение коллектива» [15].

Ю. А. Волочек с соавторами [16] рассматривают применение нейронных сетей для решения задач интеллектуального анализа данных и расширения спектра возможностей экспертных систем. Они отмечают, что «в прогнозировании заболеваний используется все большее число диагностически значимых маркеров, обработка которых в совокупности с другими данными становится более трудоемкой» [17].

В. В. Бова в своей статье [18] рассматривает и анализирует алгоритмы, повышающие эффективность обучения нейросети для решения задачи извлечения неявных знаний из данных, полученных эмпирическим путем. Применение таких алгоритмов позволяет повысить достоверность, надежность и объективность полученных результатов. В полной мере этот вывод относится и к возможным педагогическим приложениям рассматриваемых алгоритмов.

Х. Хуанг с соавторами [19] осуществляют обзор и анализ методов, используемых при синтезе изображений с помощью нейросетей. Они выделяют среди методов синтеза изображений три основные группы:

̶          прямые методы;

̶          иерархические методы;

̶          итерационные методы.

Анализ осуществляется применительно к двум основным задачам синтеза изображений:

̶          преобразование текста в изображение;

̶          перевод изображения в изображение.

Мы также предлагаем один из возможных способов повышения производительности нейросетей применительно к решению этой задачи, состоящий в одновременном обучении различных моделей, которые хорошо генерируют один определенный объект и обучают другую модель, которая учится комбинировать разные предметы по их текстовым описаниям.

Основной вывод Х. Хуанга с соавторами состоит в том, что использование нейросетей при синтезе изображений позволяет модели лучше работать с задачами, выходные данные которых трудно оценить, составив явное математическое уравнение [20]. Собственно, задачи подобного рода составляют основу задач классификации в учебной сфере, что придает рассматриваемой работе особое значение применительно к содержанию нашего исследования.

К. Грегор с соавторами [21] анализируют «метод глубокого рекуррентного внимания» для генерации изображений. Данный метод объединяет новый механизм восприятия пространства, имитирующий движения человеческого глаза с последовательными вариационными структурами автоматического кодирования, что позволяет осуществлять итеративное построение сложных изображений. Отметим, что данный подход, описанный в 2015 году, в настоящее время является основой функционирования нейросетей, генерирующих фотореалистичные изображения. Как отмечает К. Грегор с соавторами, такой подход «представляет собой сдвиг в сторону более естественной формы построения изображения», при которой отдельные части изображения создаются независимо от других, а предварительные эскизы последовательно уточняются».

Д. Ульянов [22] рассматривает проблемы генерации изображения применительно к задаче обработки неструктурированных данных, в рамках которой «каждый объект представлен как вектор независимых признаков». Такие задачи не могут быть решены с помощью стандартных методов машинного обучения и соответствующих им моделей нейронных сетей. К таким задачам относятся в частности, следующие [23]:

̶          Каким образом при наличии набора данных (выборки из неизвестного распределения) можно сгенерировать другие выборки из того же самого распределения?

̶          Каким образом возможно осуществление «передачи стиля»?

̶          Каким образом можно на основе имеющегося изображения, характеризующегося определенным стилем, сгенерировать новое изображение «с ощущением» того же самого стиля?

В своем исследовании Д. Ульянов описывает авторские подходы к использованию нейронных сетей для осуществления фотореалистичной визуализации в реальном времени [24].

Б. Менар [25] анализирует возможности и ограничения современных нейронных сетей в распознавании изображения. Особое внимание он уделяет проблеме разметки изображений, используемых при обучении нейросети в контексте машинного зрения. «Ручная» разметка таких изображений существенно усложняется тем, что в определенных случаях необходимы «сотни или даже тысячи классифицированных вручную изображений», трудоемкость их обработки служит существенным препятствием для внедрения глубокого обучения в основные системы машинного зрения. Соответственно, актуальными являются системы автоматической разметки изображений.

С. Хе и Л. Денг [26] в своем исследовании концентрируются на проблеме генерации описания на естественном языке на основе обработки изображения («создание или визуальных субтитров»). Эта задача возникает на стыке компьютерного зрения, обработки естественного языка и искусственного интеллекта. Решение отмеченной проблемы дает основания для создания систем, обеспечивающих [27]:

̶          семантический визуальный поиск;

̶          визуальный интеллект в чат-роботах;

̶          обмен фотографиями и видео в социальных сетях;

̶          помощь лицам с нарушениями зрения в восприятии окружающего мира.

К. О. Стенли и Дж. Клуне [28] рассматривают предметную область, на первый взгляд весьма отдаленную от педагогической специфики, – функционирование компании Uber. Однако основной акцент в своем исследовании авторы делают на создании алгоритмов обучения, «которые автоматически генерируют обучающие данные, среду обучения и учебные программы» [29]. К. О. Стенли и Дж. Клуне показывают и обосновывают, что реализация таких алгоритмов возможна с помощью «генеративных обучающих сетей» (GTN). При этом возможно создание алгоритмов, которые будут генерировать как реалистичные, так и нереалистичные данные (изображения), которые, как отмечают К. О. Стенли  и Дж. Клуне, «также могут быть полезны в обучении» [30]. При этом, согласно данным, приводимым рассматриваемыми авторами, возможно повышение общей скорости обучения.

Отметим, что можно констатировать наличие консенсуса у современных исследователей по вопросу о перспективности применения нейросетей в образовании. Взгляды на наиболее перспективные направления их применения варьируются у различных авторов, однако можно сделать вывод о том, что в настоящее время наиболее востребованной сферой является генерация учебного контента. При этом исторически так сложилось, что создание учебного контента осуществляется преимущественно нейросетями для генерации изображений. Отметим, что на предыдущем этапе информатизации образования [31] генерация образовательного контента информационными системами осуществлялась в первую очередь применительно к информации в текстовой форме.

 

Обзор нейросетей для генерации изображений

Нейросеть для генерации изображений – это тип искусственной нейронной сети, которая способна создавать новые изображения, основываясь на обучающем наборе данных. Этот тип нейросети популярен в области искусственного интеллекта и компьютерного зрения, и он обладает большим потенциалом для создания уникальных и креативных изображений. Источником для генерации изображений чаще всего является текстовое описание, в некоторых случаях можно использовать изображение (картинку) и текст. По ключевым словам подобные нейросети способны генерировать картинки, фотографии, текстуры и графические изображения других видов. Бурное развитие подобных программных средств за последний год привело к тому, что их возможности уже сейчас широко применяются в разных областях, связанных с компьютерной графикой.

Нейросети для генерации изображений имеют множество применений в дизайне и изобразительном искусстве, они предоставляют художникам и дизайнерам уникальные инструменты и возможности для создания новых, креативных и привлекательных визуальных элементов.

Возможность задавать стили известных направлений в искусстве позволяет дизайнерам создавать изображения в определенном художественном стиле или применять внешний вид известных произведений искусства к своим собственным творениям. Ряд нейросетей позволяет смешивать изображения, преобразовывать их в заданной манере и цветовой гамме, увеличивать разрешение, заполнять недостающие части, восстанавливать поврежденные изображения, удалять нежелательные объекты.

Нейросети можно использовать для создания персонажей, аватаров и других визуальных ресурсов для использования в видеоиграх, анимации, рекламе, дизайне, виртуальной реальности и других цифровых медиа.

Нейросети могут использоваться для создания разнообразных текстур и узоров для применения в дизайне одежды, интерьера, упаковки и других областях. Это позволяет дизайнерам получать уникальные и интересные текстурные элементы, которые трудно или даже невозможно создать вручную. Способности нейросетей по генерации дизайнерских элементов: логотипов, иконок, фонов и шрифтов – могут быть использованы в веб-дизайне, рекламе или брендинге. Нейросети можно использовать для создания иллюстраций на основе текстового описания или заранее заданного стиля, что может быть полезно в оформлении книг, комиксов или веб-дизайна.

Способность нейросетей генерировать изображения делает их удобным инструментом для дизайна и творчества. Плагины нейронных сетей для генерации изображений уже сейчас постепенно интегрируются в программное обеспечение для дизайна и компьютерной графики, чтобы помочь дизайнерам ускорить и облегчить разработку проектов.

Область применения нейронных сетей для создания изображений продолжает расширяться по мере того, как исследователи разрабатывают более совершенные алгоритмы и модели. Эти методы на основе ИИ предлагают мощные инструменты для творческих профессионалов и улучшают различные отрасли, которые производят визуальный контент.

Важно отметить, что нейросети могут использоваться как самостоятельный инструмент для создания изображений, так и в сочетании с творческими способностями художников и дизайнеров. Они не заменят творческий процесс, но могут значительно обогатить его и предоставить новые возможности для творчества и вдохновения.

Одной из самых известных нейросетей для генерации изображений является сеть Midjourney [32]. Для работы используется чат-бот в сети Discord. Пользователь пишет текстовый запрос и получает несколько картинок-результатов, которые затем можно доработать, получить вариации. Midjourney обладает весьма мощными возможностями генерации, позволяет создавать изображения в заданных стилях, изменять загруженные изображения, смешивать их.

В качестве недостатков можно отметить ограничение бесплатной версии: пользователю доступно бесплатно только 25 запросов. Для доступа требуется аккаунт в сети Discord [33, 34]. Для составления запросов предпочтителен английский язык.

Неплохой бесплатной альтернативой является нейросеть Lexica [35]. Данное приложение работает в окне браузера, использует английский язык для создания текстовых запросов. Приложение Lexica имеет ограничение на количество картинок, которое можно создать бесплатно: 100 изображений в месяц. 

Еще одна нейросеть, Craiyon,также позволяет нарисовать картину по текстовому запросу [36]. Для работы необходима регистрация на сайте, система поддерживает английский язык запросов. Нейронную сеть можно использовать бесплатно, в этом случае функционал будет несколько ограничен и обработка происходит дольше.

Еще одна нейросеть, Playground AI, обладает расширенным набором инструментов, позволяет не только генерировать картинки, но и затем редактировать их, удалять части изображения, заменять детали, применять фильтры, обрабатывать фото в заданной стилистике [37]. Нейросеть Playground AI ближе всего к разработке Midjourney. Ежедневно нейросеть дает возможность бесплатно сделать до 50 изображений.

Существуют и другие нейросети для генерации изображений, они обладают похожими свойствами, общими качествами таких приложений являются доступ в браузере, необходимость регистрации, ограниченное количество изображений в бесплатном аккаунте, англоязычный интерфейс и язык запросов.

Среди наиболее известных российских нейросетей следует отметить Kandinsky от Сбера и Шедеврум от Яндекса.

Kandinsky ― генеративная нейросеть для создания картинок, российский аналог Midjourney [38]. Работать с нейросетью Kandinsky можно бесплатно без регистрации прямо в окне браузера. Kandinsky хорошо понимает русскоязычные запросы, поддерживает и другие языки (около 100 по заявлению разработчиков).

Сейчас Kandinsky 2.2 может:

̶          генерировать изображения по текстовому запросу; на официальном сайте даже имеются инструкции о правильном составлении таких запросов;

̶          поддерживать разнообразные техники (цифровая живопись, рисунок карандашом, картина маслом и пр.) и стили известных художников и направления (классицизм, ренессанс, аниме и проч.);

̶          редактировать картинки, дорисовывать изображения, соединять два изображения в одно.

Нейросеть постоянно обновляется и дорабатывается, на настоящий момент доступна версия 2.2.

Другая российская разработка – нейросеть Шедеврум от Яндекса – доступна только в виде мобильного приложения для устройств на базе Android и iOS [39]. Нейросеть генерирует изображения по запросу на русском языке, предоставляет четыре варианта картинки, которые затем можно сохранить. Качество получаемых изображений и детализация значительно уступают остальным нейросетям.

Таким образом, можно отметить, что существуют нейросети для генерации изображений, которые можно использовать в образовательном процессе для знакомства студентов с их возможностями, принципами работы, достоинствами и недостатками.

Обучение студентов работе с нейронными сетями и их приложениями, включая создание изображений, может быть ценным и полезным дополнением к их образованию. Нейронные сети, особенно те, которые используются для генерации изображений, получают все большее распространение в различных сферах и отраслях. Мы считаем, что обучение студентов основам работы с нейронными сетями для создания изображений может быть весьма полезным по ряду причин.

  1. Актуальность навыков работы с нейросетями. Поскольку искусственный интеллект (ИИ) и машинное обучение продолжают формировать различные отрасли, понимание нейронных сетей и их возможностей будет иметь важное значение для студентов как будущих специалистов в дальнейшей работе. Знакомство с методами создания изображений с использованием нейронных сетей может дать студентам конкурентное преимущество в их карьере.
  2. Возможности для творческого самовыражения. Нейронные сети для создания изображений предлагают уникальные инструменты для творческого самовыражения. Обучение студентов этим технологиям может открыть новые возможности в искусстве, дизайне и других областях творчества. Это позволяет молодым специалистам изучать генеративное искусство и экспериментировать с инновационными способами визуального выражения.
  3. Междисциплинарные приложения. Генерация изображений с использованием нейронных сетей находит применение во многих дисциплинах, таких как компьютерное зрение, робототехника, медицинская визуализация и графический дизайн. Знакомство студентов с этими концепциями позволит им понять, как можно использовать ИИ в различных областях.
  4. Развитие критического мышления. Работа с нейронными сетями для создания изображений требует навыков решения проблем и критического мышления. Студенты могут научиться анализировать данные, настраивать модели и оптимизировать результаты, что может способствовать более глубокому пониманию алгоритмов ИИ и их ограничений.
  5. Этические соображения: включение дискуссий об этике и предвзятости ИИ в учебную программу поможет студентам сформировать всестороннее представление об ответственном использовании технологий ИИ, в том числе тех, которые используются для создания изображений.
  6. Предпринимательство и инновации. Понимание нейронных сетей и их приложений может вдохновить студентов на разработку инновационных проектов и предпринимательских инициатив, которые используют эти технологии для решения реальных проблем или создания новых продуктов и услуг.
  7. Развитие навыков сотрудничества и командной работы. Проекты ИИ, в том числе создание изображений, часто требуют совместной работы участников с разными наборами навыков. Обучение студентов работе в междисциплинарных командах способствует сотрудничеству, общению и поиску решений проблем.
  8. Повышение инклюзивности учебного процесса. Одновременная генерация системами искусственного интеллекта образовательного контента, ориентированного на обучающихся с различными образовательными потребностями и возможностями, может способствовать их совместному обучению [40].

Однако важно учитывать уровень подготовки студентов, багаж предшествующих знаний и конкретный контекст учебной программы при внедрении нейронных сетей для создания изображений. Интеграция таких сложных тем должна осуществляться вдумчиво, постепенно и при соответствующей поддержке со стороны преподавателей и образовательных ресурсов.

В целом предоставление студентам понимания нейронных сетей и их приложений для создания изображений может вооружить их ценными навыками и знаниями для будущего и дать им возможность стать ответственными пользователями и создателями технологий искусственного интеллекта.

 

Методологическая база исследования / Methodological base of the research

 

Методологическую базу исследования составили теоретические и эмпирические методы. Были использованы комплексные аналитико-синтетические теоретические методы, методы сравнения, обобщения и систематизации. Авторами были проведены изучение и анализ педагогических исследований в области цифровых инструментов в математическом образовании.

К использованным в исследовании методам относились: наблюдение, изучение и обобщение опыта использования цифровых инструментов в математическом образовании, опросные методы.

В 2023 году среди студентов физико-математического факультета Смоленского государственного университета (г. Смоленск), обучающихся по направлениям подготовки «Педагогическое образование» (профиль «Изобразительная деятельность») и «Менеджмент» (профиль «Цифровой маркетинг и бренд-менеджмент»), был проведен опрос в форме анкетирования, ориентированный на анализ восприятия нейросетей для генерации изображений, отношения к ним, специфики работы с ними и типовых затруднений.

 

Результаты исследования / Research results

 

В 2023 году было проведено анкетирование среди студентов Смоленского государственного университета с целью выяснения уровня осведомленности и владения нейросетями для генерации изображений.

В опросе приняли участие студенты направлений подготовки «Педагогическое образование» по профилю «Изобразительная деятельность» и «Менеджмент» по профилю «Цифровой маркетинг и бренд-менеджмент». Причиной выбора послужило предположение о том, что деятельность специалистов по выбранным направлениям будет связана с изобразительной деятельностью, дизайном, созданием и обработкой изображений и студенты должны иметь представление о новых цифровых технологиях в данной области. Всего в опросе приняло участие 40 человек.

В ходе занятия студенты получили задание познакомиться с некоторыми популярными нейросетями для генерации изображений по текстовому запросу. Необходимо было получить несколько изображений с заданными качествами: сюжетом, стилем, цветами, предметами.

В качестве примеров были использованы следующие нейросети:

  1. Kandinsky 2.1 – российская нейросеть от Сбера.
  2. Lexica art.
  3. Мобильное приложение Шедеврум от Яндекса.
  4. Dream by Wombo.
  5. Craiyon.
  6. Playground AI.

Затем студенты ответили на вопросы анкеты.

 

Рис. 1. Результаты опроса

 

Студенты указали, с какими из нейросетей для генерации изображений им удалось поработать. Первое место заняла российская нейросеть Кандинский 2.1, с ней работали 70% респондентов. Второе место заняли сервисы Lexica Art, Crayon и Midjourney. Нейросеть Midjourney заняла только 2е место (несмотря на свою огромную популярность), вероятно, потому, что более сложна в использовании (требует наличия аккаунта в Discord) и имеет ограничения в бесплатном использовании. Российская разработка Шедеврум от компании Яндекс заняла только 4-е место, возможно, из-за невысокого качества результатов и необходимости установки мобильного приложения (рис. 2).

 

Рис. 2. Результаты опроса

 

Некоторые студенты факультета искусства и дизайна были уже ранее знакомы с технологией генерации изображений и указали другие сервисы – Artbreeder, Remini, это говорит о том, что студенты интересуются новыми цифровыми технологиями и прилагают самостоятельные усилия для их изучения.

Среди рассмотренных сервисов наиболее удобными для студентов оказались Кандинский 2.1, Lexica art и Midjourney (рис. 3).

 

Рис. 3. Результаты опроса. Предпочитаемые нейросети для генерации изображений

 

В ответы на вопрос о целях использования нейросетей получились следующими (опрашиваемые могли выбрать несколько вариантов) (рис. 4).

 

Рис. 4. Результаты опроса (общие результаты)

 

Большинство студентов предпочло использовать ИИ в качестве источника идей для своих работ. Второе место заняла функция генерации фотографий, третье место – генерация дизайнов. Интересно, что студенты по профилю «Изобразительная деятельность» предпочитают использовать нейросети в основном для генерации идей для своих работ, а студенты по профилю «Цифровой маркетинг и бренд-менеджмент» – для создания логотипов, графических изображений и дизайна, что согласуется с профессиональной направленностью обучающихся.

 

Рис. 5. Результаты опроса (сравнительные результаты)

 

В качестве плюсов в использовании нейросетей для генерации изображений студенты указали скорость работы, оригинальность, уникальность и вариативность получаемых картинок, легкость и простоту использования, новые идеи и необычные решения.

В качестве недостатков опрашиваемые назвали несоответствие ожидаемым результатам и описанию, шаблонность и однотипность, ошибки и неточности в полученных изображениях. 30% студентов отметили, что часто изображение-результат не соответствует текстовому запросу,

В вопросе об оценке трудности получения необходимого изображения с заданными качествами с использованием нейросетей ответы распределились следующим образом (рис. 6), средний балл составил 2,8 по 5-балльной шкале.

 

Рис. 6. Результаты опроса

В вопросе о необходимости доработки получаемых изображений мнения были схожими: студенты ответили, что, как правило, доработка требуется (рис. 7). Это означает, что у них появилось понимание того факта, что нейросети полностью не смогут заменить работу человека.

 

 

Рис. 7. Результаты опроса

 

Далее студенты ответили на вопрос о возникших трудностях при работе с нейросетями для генерации изображений (опрашиваемые могли выбрать несколько вариантов ответов).

Большая часть испытала трудности с правильной формулировкой текстовых запросов (62,5%) и несоответствием запроса и результата (47,5%). Часть студентов испытывала затруднения при использовании английского языка: англоязычный  интерфейс приложений (45%) и использование английского языка в запросах (45%). Некоторая часть студентов (37,5%) отметила в качестве трудности необходимость регистрации на сайтах рассмотренных приложений (см. рис. 8).

 

Рис. 8. Результаты опроса

 

В завершение опроса студенты отметили, что будут использовать нейросети в дальнейшем, результаты незначительно отличались у студентов обоих направлений.

 

 

Рис. 9. Результаты опроса

 

95% студентов указали, что навыки работы с нейросетями необходимы специалистам своего профиля, также 77,5% опрошенных отметили, что необходимо включить изучение нейросетей для обработки изображений в программу обучения в вузе по своим направлениям.

 

Заключение / Conclusion

 

Результаты опроса показали, что применение нейросетей для генерации изображений в педагогической практике в настоящее время в наибольшей степени востребовано применительно к решению задачи генерации учебного контента. С другой стороны, подобные нейросети достаточно интенсивно используются самими обучающимися. При этом можно отметить, что обучающиеся в целом высоко оценивают потенциал таких нейросетей.

Как показывает проведенный нами анализ, для того, чтобы использование нейросетей для генерации изображений в педагогическом процессе было более эффективным, необходимо обучать потенциальных пользователей (как обучающихся, так и преподавателей) интерфейсу и основным принципам работы нейросетей, а также процедурам взаимодействия с ними, прежде всего правилам формулировки текстовых запросов (промптов).

Мы полагаем, что выявленная в ходе анкетирования студентов ведущая тенденция – стремление рассматривать и использовать системы искусственного интеллекта (в частности, нейросети для генерации изображений) в качестве «источника идей» – является существенной «зоной риска». В такой ситуации возникают предпосылки для потери студентами субъектности в рамках учебного процесса (и за этими рамками), что представляется нам неприемлемым. Для того чтобы купировать отмеченный риск, нам представляется перспективным при проектировании и организации учебного процесса вводить в него соревновательные элементы, в рамках которых студенты должны будут критически взаимодействовать с системами искусственного интеллекта.