Введение / Introduction
В современных условиях все более востребованным становится специалист, обладающий как профессионально значимыми компетенциями, так и иноязычной коммуникативной компетенцией. Языковое образование в высшей школе является актуальным направлением подготовки студентов на всех уровнях высшего образования. В процессе такой подготовки будущему специалисту необходимо прививать интерес к проведению научно-исследовательской работы.
В настоящее время область цифровых гуманитарных наук объединяет в себе различные аспекты традиционных гуманитарных дисциплин, таких как анализ, интерпретация, исследования и классификация, включая использование цифровых технологий. Этот подход позволяет более динамично и всесторонне подходить к изучению и взаимодействию ценностей гуманитарных наук и культуры [1, 2].
Одной из основных целей подготовки магистров по направлению 45.04.01 «Филология» (профиль «Европейские языки и мировая литература») является развитие научно-исследовательских навыков, что невозможно без овладения навыком анализа научных текстов на иностранном языке как ключевым инструментом для решения научных задач. Овладение навыком анализа научных текстов способствует повышению конкурентоспособности специалистов в области иноязычного образования в условиях международного взаимодействия среди участников научного сообщества. Развитие интернет-технологий облегчило доступ к электронным образовательным ресурсам в обучении иностранному языку и способствовало совершенствованию научно-исследовательских навыков магистров.
Обзор литературы / Literature review
В настоящее время Х. Лю и соавт. [3] выявлено, что существует прямая связь между использованием академической лексики и уровнем сложности языка. Эти результаты представляют собой эмпирическую основу для исследования академических английских тестов в Китае и других регионах мира, а также способствуют улучшению методов преподавания и тестирования по программе EAP для развития академической грамотности студентов.
ИсследователиИ. Костка, Р. Тончелли[4]отмечают, что при использовании обширного корпуса текстовых данных большие языковые модели могут генерировать уникальные человекоподобные ответы на вопросы и взаимодействовать с пользователями естественным образом в разговорной форме.
В статье Н. Х. Транг и соавт.[5]исследуют различия в уровне лексической сложности в академической устной речи между тремя основными научными областями: биологическими науками, естественными науками и общественными науками, используя Academic Word List (AWL) и British National Corpus/Corpus of Contemporary American English (BNC/COCA). Проведенное исследование также выявило связь между Academic Word List (AWL) и British National Corpus/Corpus of Contemporary American English (BNC/COCA). Студенты с ограниченным словарным запасом могут расширить свой словарный запас для понимания академических текстов с помощью Academic Word List (AWL).
Т. Хиксон [6]отмечает роль информационной грамотности обучаемых в учебных программах университетского уровня. Л. Белло и другие ученые [7]акцентируют внимание на возрастающей роли бесплатных инструментов анализа текстов для развития цифровых гуманитарных наук. Х. Хендриган [8]анализирует потенциал инструмента Voyant Tools. Данное веб-приложение широко используется среди исследователей цифровых гуманитарных наук для выявления словесных шаблонов в научных текстах.
К. Грегори и соавт. подчеркивают важность изучения инструмента Voyant Tools, поскольку, отправив оцифрованный, обработанный методом распознавания текста корпус с помощью множества аналитических инструментов Voyant Tools, цифровые гуманитарии могут определить и проверить, о чем идет речь в тексте, и извлечь набор ключевых слов, который поможет создать метаданные и тематические заголовки для анализа текста [9].
Другие ученые, например Г. Хетеньи, указывают на необходимость изучения возможностей, предлагаемых инструментами Voyant, для количественного анализа качественных данных [10]; М. Шорт, описывая эксперименты по анализу текста в Университете Северного Иллинойса, основное внимание уделяет тематическому анализу дешевых романов, формата недорогой художественной литературы. Для исследователя представляет интерес классификация, извлечение ключевых слов, распознавание именованных объектов, кластеризация и тематическое моделирование [11].
А. М. Пуляевская и другие отечественные ученые [12] описали опыт применения информационных технологий в обучении иноязычному общению, использования корпусных технологий и инструментария программы Voyant Tools в процессе подготовки обучающихся к восприятию иноязычного текста.
С. В. Боголеповой [13] проанализированы трудности, с которыми обучающиеся встречаются при овладении иноязычной письменной речью в курсе английского языка для академических целей в контексте специфики курса. Автор раскрывает методические подходы к обучению иноязычной письменной речи в курсе академического письма. Ученый подчеркивает важность учета следующих аспектов при составлении глоссария по дисциплине: различия в использовании коллокаций и лексических связок авторами, для которых английский не является родным языком, и носителями языка; большая вариативность языкового выражения у носителей языка; ограниченное использование фраз не у носителей; отражение особенностей культуры автора в структуре текста; ожидания носителей английского языка от текста, такие как последовательная организация, логическая связность идей, оригинальное и понятное содержание, которое не требует дополнительных размышлений от читателя; ответственность автора на английском языке за понимание читателем, в то время как на русском языке тексты могут иметь менее четкую структуру, требующую от читателя дополнительного восприятия замысла.
П. В. Сысоев [14] описывает корпусы в Интернете, которые студенты могут анализировать и использовать для проведения своих научных исследований: Британский национальный корпус (http://www.natcorp.ox.ac.uk); Банк английского языка (http://www.collins.co.uk/Corpus/CorpusSearch.aspx); Американский национальный корпус (АНК) (http://americannationalcorpus.org); Мичиганский корпус академического разговорного английского языка: MiCASE (http://quod.lib.umich.edu/rn/micase).
Отечественные авторы особое внимание уделяют изучению теоретических основ использования IT-технологий для анализа текста в рамках цифровизации образования. Так, характеризуя возможности и ценности инструментов Voyant в качестве средства для анализа художественного текста, T. Швецова и соавт. рассматривают Voyant Tools как продуктивный метод для работы цифровых гуманитариев, полезный для сбора метаданных и построения корпусных исследований, для подготовки к восприятию, чтению и переводу текстов на иностранных языках, для составления фреймовой модели конкретной предметной области [15].
Д. Прокудиным предлагается возможность применения разработанной авторами научной методики на информационных ресурсах текстовой модальности. Методика основана на интегрированном подходе (синтетическом методе) к отбору цифровых информационных ресурсов, извлечению и анализу контекстуальных знаний и позволяет конкретизировать терминологическую базу сформированного междисциплинарного научного направления «Цифровая экономика: электронное управление и интеллектуальные технологии». Русскоязычная распределенная среда научных исследований T-Libra и многоязычные Voyant-инструменты используются в качестве инструментов поиска, экспликации и анализа контекстов [16].
Особое внимание уделено вопросам использования инструментов цифровых гуманитарных наук в обучении англоязычной научной лексике в трудах отечественных и зарубежных авторов.
Среди трудов отечественных ученых следует, прежде всего, назвать исследования Л. М. Гальчук [17], М. П. Голенок и Н. О. Осиповой [18], Д. В. Грамма [19],
Ю. Б. Кузьменковой [20], Е. В. Луганской [21], Е. Э. Ляпуновой [22], Р. И. Маминой [23], И. А. Пильщикова [24], Н. Б. Самойленко [25, 26]. Среди работ зарубежных авторов можно выделить труды таких авторов, как Т. Кобб [27], Э. Коксхед и П. Нейшн [28], Дж. Дженкинс [29], А. Мауранен [30], Т. Хиксон [31]. В исследованиях основное внимание уделяется раскрытию показателей развития терминологической компетенции магистрантов языковых направлений подготовки в процессе изучения английского языка для научных целей, теоретическим и практическим аспектам обучения магистрантов англоязычной научной лексике.
Данное исследование посвящено описанию проведения сбора корпуса лексических единиц с помощью приложения для интеллектуального анализа текста и визуализации данных. Этот метод аналогичен методу У. Гао и Л. Уоллес [32] с использованием инструментов Voyant в качестве приложения для интеллектуального анализа текста и визуализации данных. Выбор приложения Voyant Tools обусловлен тем, что веб-приложение бесплатное с открытым исходным кодом с многочисленными функциями интеллектуального анализа текста и визуализации данных. Эти функции включают в себя словосочетания (которые приближены к возможностям тематического моделирования Mallet) в дополнение к описанию частотности слов. Voyant Tools не требует дополнительных навыков программирования.
По мнению Э. Бекиари, М. Ксестерну [33], цифровые гуманитарные науки способствуют не только проведению академических исследований, для которых они уже предназначены, но и обновлению организации образовательного процесса и получению ожидаемых результатов обучения. Авторы предлагают преподавателям полезные рекомендации по эффективному применению цифровых инструментов, указывая на возможности и сложности включения цифровых инструментов для гуманитарных наук в программу среднего образования.
С. Зайди, Ш. Аллахдад [34] подчеркивают, что вычислительный текстовый анализ (ВTA) – это эффективный способ анализа больших текстов с использованием вычислительных инструментов, таких как Voyant. Voyant-инструменты, среди которых Cirrus, Trend и Summary, показывают результаты, основанные на количественных и качественных показателях. Эти наборы инструментов просты в использовании, не предусматривают каких-либо навыков программирования и являются лучшими для исследователей социальных и гуманитарных наук, которые работают в области цифровых гуманитарных наук. Исследователи также рекомендуют Voyant в качестве оперативного инструмента для компьютерных лингвистов, для текстового анализа постмодернизма, критического анализа текстов английской литературы, истории, социологии, теологии и любой другой области знаний, относящихся к сфере цифровых гуманитарных наук.
Как видно из анализа актуальных научных исследований, инструменты Voyant Tools в качестве приложения для интеллектуального анализа текста и визуализации данных активно используются при подготовке специалистов разного уровня.
Разработчиками онлайн-программы Voyant являются С. Синклер, доцент кафедры цифровых гуманитарных наук Университета Макгилла, и Д. Роквелл, профессор философии и гуманитарных вычислений в Университете Альберты, Канада [35].
В 2016 году С. Синклер и Д. Роквелл опубликовали книгу «Герменевтика: компьютерная интерпретация в гуманитарных науках», демонстрирующую различные подходы к анализу текста с использованием Voyant. Hermeneuti.ca – это совместный проект С. Синклера и Д. Роквелла, целью которого является компьютерный анализ текста для гуманистов. Этот сайт – дополнение к книге «Герменевтика» (MIT, 2016) и Voyant Tools, также включает онлайн-версии практических интерлюдий из книги с динамическими панелями от Voyant (https://voyanttools.github.io/hermeneutica/).
Таким образом, проведенное теоретическое исследование показало, что подготовка магистрантов для анализа научных текстов на иностранном языке с использованием инструмента Voyant Tools обусловлена актуальностью сферы профессиональной деятельности цифровых гуманитариев, необходимости применения ими как научной терминологии, так и цифровых технологий в их профессиональной и практической деятельности.
Методологическая база исследования / Methodological base of the research
Целью исследования является уточнение содержания подготовки магистрантов по направлению подготовки 45.04.01 Филология, рассмотрение особенностей и возможностей применения интернет-ресурсов и электронных образовательных ресурсов в обучении англоязычной научной лексике при профессиональной направленности изучения английского языка; использование инструментов цифровых гуманитарных наук (приложение для анализа текста и визуализации данных Voyant Tools (https://voyant-tools.org/) для Digital Humanities/магистрантов гуманитарного направления подготовки).
Для исследования этих вопросов данная статья состоит из следующих частей. В обзоре литературы проанализирован опыт применения цифровых ресурсов в образовательной практике. В следующем разделе представлен метод разработки корпуса для анализа в Voyant Tools. В разделе «Результаты» описаны атрибуты Voyant Tools, которые использованы для составления магистрантами глоссария по научному исследованию, представлен опыт использования программы онлайн-анализа текста Voyant Tools для подготовки магистрантами магистерских диссертаций. В заключении обсуждается, почему необходимо использовать этот ресурс в подготовке магистрантов для анализа научного дискурса на иностранном языке.
Обзор научно-исследовательской литературы, касающейся использования инструментов и методологии исследования цифровых гуманитарных наук, приводит нас к вопросу исследования: каков вклад инструментов цифровых гуманитарных наук в обучение иностранным языкам в высшем языковом образовании?
На сегодняшний день Voyant Tools активно используется в университетах. Это веб-приложение, позволяющее пользователям анализировать тексты и выполнять текстовый анализ. Его используют ученые в области цифровых гуманитарных наук, а также студенты. Веб-приложение разработано для улучшения чтения с помощью текстовой аналитики, такой как списки частотности слов и графики распределения (https://en.wikipedia.org/wiki/Voyant_Tools#Range_of_Uses). Веб-приложение Voyant Tools – это «сетевая среда чтения и анализа текста», предназначенная для помощи студентам, которые заинтересованы в интерпретации текста на цифровой платформе для широкой аудитории. Данный ресурс позволяет анализировать собственный текст или коллекцию текстов для обучения других и представлять результаты таким образом, чтобы их было легче увидеть онлайн-аудитории (https://dh.sites.gettysburg.edu/toolkit/tools/voyant-инструменты/). В Voyant есть ряд основных концепций, которые можно охватить в ходе данного исследования.
Однако существуют определенные проблемы, возникающие в результате накопленного опыта студентов и преподавателей.
Представим цели исследования: как использовать Voyant и понять, что доступно (как это использовать); как по-другому воспринимать тексты с помощью таких инструментов, как Voyant (зачем его использовать) (https://voyant-tools.org/docs/#!/guide/tutorial).
Voyant Tools – это бесплатная онлайн-программа для анализа текста с открытым исходным кодом. Пользователи могут загрузить корпус или использовать один из уже существующих текстов программы. После загрузки текста инструмент предоставляет информацию, с помощью которой пользователи могут создать облако наиболее часто встречающихся слов, графики частоты слов в корпусе и различные связанные документы.
Существует размещенная версия Voyant Tools (https://voyant-tools.org). В рамках исследования нами изучено руководство, которое охватывает следующие темы: базовая информация о Voyant (основная информация об инструменте и его конструкции); как создать (или использовать) корпус Voyant (особенно с URL-адресами и загрузкой файлов); как начать изучение корпуса в Voyant (инструменты по умолчанию и их взаимодействие); более глубокое изучение функционала Voyant (мощный поиск, работа с сетками, дополнительные инструменты); за пределами Voyant (экспорт данных, создание закладок, встраивание инструментов в другое место); участие (в качестве пользователя, разработчика, переводчика, поставщика контента); будущие направления (например, Spyral Notebooks) (https://voyant-tools.org/docs/#!/guide/tutorial).
На домашней странице программы имеется поле, в котором пользователи могут напрямую разместить свой текст или ввести URL-ссылки на документы в корпусе; программа принимает форматы файлов для загрузки различных типов текста. После загрузки текста программа показывает его анализ, а также демонстрирует наиболее часто используемые слова или термины в формате облака слов. Анализ ссылок, или график «Сопоставление», показывает слова в тесной сети, что может помочь пользователю понять связи или отношения между словами и фразами в тексте.
Главная страница для анализа включает в себя пять основных скинов по умолчанию: Cirrus, Reader, Trends, Summary и Contexts. Cirrus отображает облако слов, в котором наиболее часто встречающиеся слова располагаются в центре и как самые крупные. Чем более распространено слово, тем больше оно будет. Reader состоит из двух частей. Средство чтения текста позволяет пользователям детально читать текст, в то время как средство просмотра потенциальных клиентов отображает обзор корпуса. Trends представляет частоту употребления терминов в документах корпуса или в сегментах документа, в зависимости от режима. Summary дает сводку о количестве слов, количестве уникальных слов, самых длинных и самых коротких документах, самой высокой и самой низкой плотности словарного запаса, а также о среднем количестве слов в предложении, наиболее часто встречающихся словах, заметных пиках частоты и отличительных словах в выбранном корпусе. Contexts – это инструмент, показывающий каждое вхождение ключевого слова с небольшим количеством окружающего текста для контекста (https://dh.sites.gettysburg.edu/toolkit/tools/voyant-tools/).
Представим несколько онлайн-ресурсов для использования Voyant Tools в обучении.
1. Учебное пособие/семинар – справка Voyant Tools (voyant-tools.org) (https://voyant-tools.org/docs/#!/guide/tutorial).
2. Введение в инструменты Voyant для корпусного анализа (https://irhuru.github.io/blog/voyant-tutorial/).
3. Voyant Tools – набор инструментов для цифровых гуманитарных наук (gettysburg.edu) (https://dh.sites.gettysburg.edu/toolkit/tools/voyant-tools/).
4. Знакомство с инструментами Voyant для анализа текста – YouTube.
Voyant Tools – это онлайн-платформа, на которую исследователь может загрузить корпус, а затем проанализировать текст с помощью различных функций программы. Это облегчает быстрый анализ текста и может предоставить информацию для поддержки исследований пользователя.
Основу нашего исследования составили следующие методы: анализ научно-методической литературы по проблематике исследования; синтез полученных данных, предоставляющий возможность уточнить содержание подготовки магистров, а также показать роль нового направления подготовки цифровых гуманитариев, обладающих новыми навыками использования цифровых инструментов для анализа текста; описание педагогического опыта, позволяющего усовершенствовать программы подготовки магистров по направления 45.04.01 Филология.
Таким образом, был проведен анализ, синтез, обобщение и систематизация научно-методических источников по проблеме исследования. На основе системного подхода было уточнено содержание подготовки магистров по направлению подготовки 45.04.01 Филология, описаны особенности и возможности приложения для анализа текста и визуализации данных Voyant Tools в обучении англоязычной научной лексике при профессиональной направленности изучения английского языка и предложены методы использования инструментов цифровых гуманитарных наук.
Результаты исследования / Research results
Среди дисциплин, способствующих формированию иноязычной коммуникативной компетенции студентов магистратуры, проанализируем дисциплину «Иностранный язык для научных исследований».
Целью дисциплины «Иностранный язык для научных исследований» является взаимосвязанное формирование умений иноязычного чтения, письма и говорения в контексте научно-познавательной деятельности, для решения своих профессиональных задач и дальнейшего самообразования, а также совершенствование научно-исследовательской компетенции, заключающейся в готовности и способности использовать теоретические и практические знания при решении научно-исследовательских задач.
При освоении дисциплины решаются следующие задачи: изучение понятия «научный дискурс» и его составляющих; изучение особенностей научного стиля; ознакомление с формами научного дискурса; овладение научным стилем письма; развитие умения осуществлять научное исследование в рамках научного дискурса, оформление и представление результатов научной работы.
В процессе изучения английского языка магистранты используют интернет-ресурсы и электронные образовательные ресурсы при изучении английского языка, профессионально ориентированную академическую лексику. На заключительном этапе обучения магистранты защищают магистерскую диссертацию. Магистерская диссертация выполняется в соответствии с общеобразовательной программой магистратуры и представляет собой учебно-исследовательскую работу, которая выполняется с использованием этих инструментов.
Большинство магистрантов знают, как планировать исследования, собирать и анализировать данные, интерпретировать результаты и как писать исследовательскую работу. Но курс «Иностранный язык для научных исследований» предназначен для магистрантов, которые должны подготовить свои магистерские диссертации и представить их как на родном языке к концу обучения, так и на английском языке к концу освоения нашего курса.
По завершении обучения в магистратуре Севастопольского государственного университета студенты могут: читать письменные материалы, критически оценивать их для дальнейшего использования в учебной и научной работе; составлять презентации, используя соответствующую логическую структуру, выделяя важные моменты; создавать различные виды научных работ, включая статьи, исследовательские отчеты, аннотации, обзоры и отчеты по профессиональным вопросам, исследовательские работы; справочные ресурсы на английском языке. Поэтому необходимо овладеть академическим английским языком, который используется в научном контексте.
В английском языке существует множество различий между формальной, нейтральной и неформальной лексикой. Изучая академический английский язык, магистранты овладевают лексикой, которая используется в академической речи и письме, для обсуждения идей и научных исследований, а также для профессионального общения в академической и научной среде.
При освоении дисциплины «Английский язык для научных целей» было выявлено, что магистранты используют различные источники и ресурсы для обогащения академической и научной лексикой. Для анализа слов и выражений, часто встречающихся в академическом контексте, студенты используют такие ресурсы, как A University Grammar of English by Randolph Quirk, Sidney; Academic Vocabulary in Use by Michael McCarthy, Felicity O’Dell (Cambridge University press); Cambridge Dictionary http://dictionary.cambridge.org; Greenbaum, Geoffrey Leech, Jan Svartvik (Longman); Longman Dictionary of Contemporary English (Longman) http://www.ldoceonline.com; Macmillan Collocations Dictionary (Macmillan); Macmillan English Grammar in Context by Michael Vince (Macmillan); Merriam Webster https://www.merriam-webster.com; Practical English Usage by Michael Swan (Oxford); The Oxford Dictionary of Literary Terms: https://www.oxforddictionaries.com.
В сети Интернет они могут анализировать различные корпусы, представленные в таблице ниже.
В процессе обучения магистрантам объясняется, что разные авторы могут выражать одну и ту же мысль, используя различные языковые конструкции. Магистранты выделяют ключевые слова, которые могут быть использованы.
Описание корпусов в сети Интернет
№ п/п |
Название |
Сайт |
Описание |
1 |
Британский национальный корпус (British National Corpus |
http://www.natcorp.ox.ac.uk |
100 млн словоупотреблений |
2 |
Лингвистический корпус английского языка (The Bank of English) |
http://www.collins.co.uk/Corpus/ CorpusSearch.aspx |
Британские книги, газеты, журналы, радиопередачи (36 млн словоупотреблений); американские книги, радиопередачи (10 млн словоупотреблений); британская устная речь (10 млн словоупотреблений). Объем корпуса – 524 млн словоупотреблений, объем общедоступной части – 56 млн словоупотреблений |
3 |
Американский национальный корпус American National Corpus (ANC) |
http://americannationalcorpus.org/ |
Планируется создание представительного корпуса объемом 100 млн словоупотреблений. Объем готового фрагмента корпуса – 10 млн словоупотреблений |
4 |
Мичиганский корпус академического английского языка Michigan Corpus of Academic Spoken English: MiCASE |
http://quod.lib.umich.edu/rn/micase/ |
Объем интернет-версии корпуса – 152 источника (1 848 364 слова) |
Для того чтобы научиться писать академические тексты на английском языке, магистранту необходимо освоить правила и стандарты англоязычного академического стиля. Магистрантам рекомендуется использовать полезные инструменты, такие как Web of Science с плагином Unpaywall, для быстрого доступа к последним публикациям, а также инструмент «Отслеживание поиска обзоров литературы» – the University of Wollongong ‘Literature Review Search Tracker’ – для организации и планирования поиска по различным базам данных. Магистранты могут улучшить эффективность своей письменной и устной речи, изучая новую лексику с помощью программного обеспечения, такого как Tom Cobb's Vocab Profiler, что поможет им быстрее и лучше понимать содержание академических текстов.
Готовя глоссарий и список терминов по своей магистерской исследовательской работе, студенты используют различные ресурсы: English Vocabulary Practices (http://www.englishvoca bularyexercisions.com/), Corpus Concordance English: https://www.lextutor.ca/conc/eng/ (большое разнообразие корпусов и подкорпусов, пять демонстраций. Данные ресурсы разделены на разделы, каждый из которых включает в себя классические корпуса среднего размера, некоторые веб-отборы, а также корпуса, разработанные пользователями и студентами Lextutor). Представленные ресурсы полезны для практиков, ищущих языковую информацию, – конкордансеров.
Применен опыт использования Оксфордского фразового академического лексикона (OPAL), представляющего собой сборник списков слов, которые являются важным руководством по основным терминам, необходимым для изучения английского языка в академических целях (EAP), включая письменную и устную лексику и фразы. В нем содержится 12 подсписков, каждый из которых включает около 100–120 слов, общее количество слов составляет 22 000, более 50 000 примеров предложений из корпуса, а также 690 примечаний по словосочетаниям, показывающих более 26 000 словосочетаний.
Перед применением цифровых образовательных ресурсов, с целью определения того, кто из студентов является digital natives или digital immigrants, нами проведен опрос среди магистрантов.
Are you a ‘digital native’?
Look at the descriptions of digital natives and digital immigrants below.
Which description fits you better?
Digital native
- You prefer receiving information quickly from multiple multimedia sources.
- You like to do lots of different tasks at the same time.
- You prefer to get your information from pictures, sounds and video rather than from texts.
- You like to click on hyperlinks to jump to new information.
- You like to interact with lots of other people.
- You like to acquire new information the moment you need it.
- You prefer instant rewards.
Digital immigrant
- You prefer slow and controlled release information from limited sources.
- You like to do one task at a time.
- You prefer to get your information from text rather than from pictures, sounds and video.
- You like information to be presented in a logical sequential order.
- You like to work on your own.
- You like to acquire new information in case one day you will need it.
- You like to wait for your rewards.
Среди 24 магистрантов описание digital natives соответствовало 18 магистрантам и digital immigrants – 6 магистрантам. Но многие также отметили характеристики, которые свойственны как digital natives, так и digital immigrants.
В процессе обучения магистранты знакомятся с разными видами словарей. Они анализируют их и определяют, какие словари им будут полезны для составления их глоссария.
Задание 1. What kind of dictionary would be useful when, we looked at some different kinds of dictionaries, including:
- Visual or picture dictionaries
- School dictionaries
- Advanced learners’ dictionaries
- Bilingual and multilingual dictionaries
- Monolingual general reference dictionaries
- Dictionaries designed on historical principles
- Subject-specific dictionaries
- Special dictionaries, for example, collocation dictionaries or dictionaries of dialect or slang
Do you use different dictionaries for different types of activity?
Задание 2. What was the last word you remember looking up? Where did you look it up, what were you looking for? Did you find what you were looking for? Is there a dictionary entry – monolingual or bilingual – that you are not satisfied with?
Представляем результаты практического применения этого ресурса для анализа англоязычного научного дискурса (научная статья Academic word coverage and language difficulty of reading passages in College English Test and Test of English for Academic Purposes in China – PMC (nih.gov): https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10347537/) Voyant Tools (voyant-tools.org):
https://voyant-tools.org/?corpus=c6f4c96583d82e5e67167bf14320dd43&lang=ru
Магистрант, анализируя возможности ресурса, проводит анализ англоязычного текста. Результат анализа корпуса лексических единиц представлен на рис. 1.
Рис. 1
Результат частотности использования лексических единиц (ЛЕ) в научном тексте оформлен в таком формате (рис. 2).
Рис. 2
Есть возможность проанализировать логические связи ЛЕ (см. рис. 3).
Рис. 3
Для визуального представления результатов исследования используем ресурс “Bubbles” (рис. 4).
Рис. 4
Магистранты, отбирая ЛЕ для своего глоссария, анализируют результаты употребления ЛЕ в контексте и в отдельных устойчивых словосочетаниях (рис. 5).
Рис. 5
Продемонстрируем еще один пример. Результат анализа слова “English”(рис. 6).
Рис. 6
При составлении собственного глоссария или списка терминов для представления магистерских диссертациях на английском языке магистранты отбирают лексику, подходящую для письменного и устного контекста. Поиск нужной информации сводится к знанию правильных ключевых слов и фраз. Прежде чем приступить к поиску и просмотру научной литературы, они используют различные инструменты.
С помощью представленного ресурса студенты готовят свои глоссарии по научной лексике и используют их при защите магистерских диссертаций.
Таким образом, с помощью данного ресурса можно: выявлять значения лексических единиц из контекста; определять их логические связи, выраженные определенными связками; анализировать использование академической и научной лексики и словосочетаний в рамках научного дискурса; применять изученный материал для описания собственных научных исследований.
Студенты магистратуры расширяют свой словарный запас за счет изучения академической и научной лексики, а также коллокаций, что помогает им лучше понимать особенности использования слов и фраз в контексте и правильно применять их в научном дискурсе.
Магистранты, освоив возможности этого ресурса, отбирают необходимые для себя составляющие этой платформы. Имеется опыт использования данного ресурса для представления результатов исследования при подготовке магистерских диссертаций.
При подготовке магистерской диссертации на тему «Особенности функционирования заимствований в современной английской литературе (на примере произведений Нила Геймана “Coraline”, “Stardust”)» магистрант использовал веб-сервис Voyant Tools (https://voyant-tools.org/) для анализа художественного текста. Текст произведения «Звездная пыль» был загружен на сайт. Как только текст был загружен и обработан, пользователю предоставлен набор инструментов по умолчанию. Результат анализа текста произведения Нила Геймана «Звездная пыль» представлен на рис. 7.
Рис. 7
В первом окне в верхнем левом углу Cirrus открывает облако слов, ранжированных по частоте употребления в тексте. Наиболее часто встречающиеся слова в работе находятся в центре облака и выделены более крупным шрифтом. Цвет буквы не имеет значения. В этой модели (рис. 8) облако часто употребляемых слов состоит из 55 ключевых слов.
Рис. 8
Магистрантом с помощью онлайн-словаря Online Etymology Dictionary, составленным Д. Р. Харпером (https://www.etymonline.com/), определено, что большая часть наиболее употребляемых слов представлена заимствованиями: исконная лексика: said (say), tristran, like, woman, eyes (eye), old, dunstan, looked (look), victoria, thorn, small, yvaine, long, away, forester, thought, stormhold, lady, witch, high; заимствованная лексика: star, little, man, hand, wall, asked, time, walked, head, shall, way, know, side, village, good, young, black, took (take), unicorn, tree, told (tell), come, came, sky, night, face, day, voice, chain, just, say, mother, year, white, heart.
В качестве методов лингвистического анализа выбранных единиц магистрантом использован метод анализа словарных дефиниций и метод дефиниционного анализа. Статистический анализ наиболее популярных единиц и заимствованных единиц из их числа дал возможность выявить определенное соотношение. Проведенное исследование показывает, что из 55 ключевых слов произведения «Звездная пыль» 35 слов являются заимствованиями из разных языков. Таким образом, в процентном соотношении заимствования занимают 63,6% от общего количества использованных автором популярных единиц.
В электронном варианте произведения Нила Геймана “Coraline” магистрантом отобраны лексические единицы методом сплошной выборки. Выделив заимствования и сформировав их отдельным списком, магистрант определил эти лексические единицы и составил список лексем и их количественный показатель: рresent 1, butter 4, rest of 3, carry 4, to take 18, lion 3, elephant 1, wing 7, hit1, leg 12, egg 7, bicycle 2, cup 22, dish 2, pan 4, wall 43, they 123, call 14, street 1, wine 2, ring 5, wind 7, rich 2, iron 3, wire 1, bin 1, down 121, twig 1, piece 9, car 3, baby 2, angel 1, pepper 1, plum 2, peach 2, onion 1, cat 132, spaghetti 1, pizza 3, coffe 1, tea 10, clock 4.
Результаты анализа текста произведения Нила Геймана “Coraline” представлены на рис. 9.
Рис. 9
Облако часто употребляемых слов в произведении “Coraline” состоит из 55 ключевых слов (рис. 10).
Рис. 10
Статистический анализ наиболее популярных единиц и заимствованных единиц из их числа дал возможность выявить, что из 55 ключевых слов в произведении “Coraline” 42 слова являются заимствованиями из разных языков. Таким образом, в процентном соотношении заимствования составили 76,3% от общего количества использованных автором популярных единиц.
Таким образом, в ходе проведенного исследования проанализированы 110 лексических единиц, выявлено 77 заимствований и источники их происхождения: PIE root (праиндоевропейские корни), Latin (латынь), Low German (один из разновидностей западногерманских языков), Old Norse (древнескандинавский), Arabic (арабский), Balto-Slavic (балто-славянский), Germanic (германский), French (французский).
Заключение / Conclusion
В рамках данного исследования мы представили обзор и оценку Voyant Tools, включая его входные данные, выходные данные и возможности экспорта. Этот разнообразный набор бесплатных инструментов, который мало известен и недостаточно используется в обучении и изучении английского языка, представляет собой удобный ресурс, способный быстро и автоматически анализировать аутентичные и учебные тексты для выявления тенденций и закономерностей в различных целях (исследования языка, подготовка преподавателей, профессиональное развитие, обучение в аудитории) и для различных направлений подготовки.
В заключение можно отметить, что усовершенствовать и актуализировать процесс использования информационных технологий в обучении иностранным языкам можно путем непосредственного использования, в частности, корпусных технологий. В данном исследовании представлен собственный способ реализации инструментов программы Voyant Tools при подготовке студентов к анализу научного и художественного иноязычного текста в оригинале.
В целом следует отметить, что описываемые интернет-ресурсы в Севастопольском государственном университете используются в традиционном и смешанном обучении как студентов языкового вуза, так и педагогического направления подготовки на различных этапах профессиональной подготовки. Результаты исследования могут быть применены при обучении иностранному языку для научных целей магистрантов различных направлений подготовки.