Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online

Международная публикация
Библиографическое описание статьи для цитирования:
Марус М. Л. Сравнительный анализ современных многоязычных онлайн-словарей на примере словарей Мультитран и ABBYY Lingvo Online // Научно-методический электронный журнал «Концепт». – 2014. – № S1. – С. 51–55. – URL: http://e-koncept.ru/2014/14511.htm.
Аннотация. В статье рассматриваются основные параметры многоязычных онлайн-словарей Мультитран и ABBYY Lingvo Online, а также производится их сравнительный анализ, на основе которого формулируются выводы об их области применения.
Комментарии
Нет комментариев
Оставить комментарий
Войдите или зарегистрируйтесь, чтобы комментировать.
Текст статьи
Марус Максим Леонидович,кандидат филологических наук, доцент кафедры иностранных языков и прикладной лингвистики ФГБОУ ВПО «Омский государственный аграрный университет им.П.А.Столыпина», г. Омск.max_marus@rambler.ru

Сравнительный анализ современных многоязычных онлайнсловарей на примере словарей Мультитран и ABBYYLingvoOnline

Аннотация.В статье рассматриваются основные параметры многоязычных онлайнсловарей Мультитран и ABBYYLingvoOnline, а такжепроизводится их сравнительный анализ, на основе которого формулируются выводы об их области применения.Ключевые слова: компьютерная лексикография, электронный словарь, онлайнсловарь.Раздел:(05) филология; искусствоведение; культурология.

Компьютерная лексикография в настоящее время уверенно становится приоритетным направлением, «задвигая» классическую, «бумажную» лексикографию на второй план. Это и не удивительно, учитывая, насколько прочно вошли в нашу жизнь информационные технологии. При этом, компьютерная лексикография является не просто механической заменой классической лексикографии, а новой ступенью её развития, вводя в обиход совершенно новые понятия, методы и приёмы организации словника. Эта мысль, конечно, тривиальна, но тем более удивительно, что доводится нередко слышать суждения, свидетельствующие о полном непонимании этого. Хотя, вероятно, удивляться здесь нечему, поскольку компьютерная лексикография, как и многие подобные ей инновационные отрасли науки, находятся в самом начале своего развития (причём развития весьма бурного), производя своеобразную революцию в лингвистике и способствуя образованию новой совершенно парадигмы, которая ещё окончательно не сформирована и, следовательно, до конца не осознаётся. Электронные словари часто воспринимаются сквозь призму обычных, бумажных, «по старым правилам». Ключевой момент здесь заключается в том, что старые правила не применимы к новой ситуации в полной мере, эти правила тоже подлежат пересмотру, модернизации. Образно говоря, уравнивать электронный словарь с бумажным –это то же самое, что уравнивать печатную машинку с текстовым редактором MicrosoftWord. Их можно рассматривать и сравнивать только в диахронном аспекте, но ни в коем случае не в синхронном.

Из всего вышесказанного можно сделать закономерный вывод, что поскольку компьютерная лексикография является совершенно новой областью прикладной лингвистики, то и нерешённых проблем здесь огромное множество. В числе первых можно отметить проблему классификации электронных словарей, проблему достоверности, содержащейся в них информации, проблему принципов построения как всего словаря в целом, так и отдельных словарных статей, и это только верхушка айсберга. В таких условиях необходимо вырабатывать принципиально новый подход к новым феноменам, изменять, трансформировать имеющиеся критерии, принципы и правила.

В настоящий момент этот процесс уже начинается, хотя, как уже отмечалось, он осложнён многими особенностями периода «перехода» от классической лексикографии к электронной. Тем не менее во многих работах, в особенности в статьях зарубежных коллег, уже намечается этот «принципиально новый подход», который, вероятно, и определит будущую лексикографическую парадигму. Отличия этого подхода заключаются как во введении новых понятий, терминов, характеризующих новые феномены, так и в освоении новых приёмов, принципов организации и функционирования электронных словарей. В качестве примеров можно привести понятия гипертекста и гипертекстовой разметки словаря, а также принцип самоадаптации словаря к нуждам конкретного пользователя, которые подробно описывает Дени Арнос Куори в своей работе «AdaptiveHypermediaandUserOrientedDataforOnlineDictionaries»[1].

Вместе с тем необходимо изучать уже имеющиеся электронные словари, причём не только для их улучшения (что является, несомненно, основной целью такого исследования), но и для формирования теоретической базы в сфере компьютерной лексикографии. Основой для подобного рода анализа служат классическая лексикографическая теория, модернизированная и приспособленная к новым явлениям лексикографической практики. В данной работе осуществляется анализ онлайнсловарей Мультитран и ABBYYLingvoOnline.

Оба упомянутых словаря являются крупнейшими русскоязычными ресурсами, и в некотором роде конкурентами, к тому же они являются частью коммерческих проектов и имеют свои платные версии.

Для сопоставления выбранных онлайнсловарей используется метод параметрического анализа, предложенный Ю.Н.Карауловым в его работе «Лингвистическое конструирование и тезаурус литературного языка» [2, с. 74–108]. Необходимо отметить, что схема и набор параметров для анализа в работе Ю.Н.Караулова предназначались для исследования идеографических словарей, поэтому в данной работе набор параметров был изменен на более подходящий для анализа онлайнсловарей.

Таким образом, были отобраны следующие параметры.

1.Объём словника. Здесь необходимо уточнить, что объём словника в случае с электронным словарём (и в том числе онлайнсловарём) является неоднозначным показателем, в отличие от традиционных бумажных словарей, по нескольким причинам: вопервых, подавляющее большинство двуязычных электронных словарей имеют сразу два направления перевода, например, англорусский и русскоанглийский, а некоторые электронные словари к тому же многоязычные, что даёт ещё большее количество вариантов. Вовторых, многие электронные словари имеют в своём составе дополнительный терминологический тезаурус, что резко увеличивает объём словника. Например, электронный словарь ABBYYLingvox5 «20 языков» включает в себя в общей сложности около18,3 миллиона словарных статей. Такой объемный электронный словарь более корректно сравнивать не с одним, а с целым набором бумажных словарей. Кроме того, нельзя забывать, что многиеонлайнсловари являются «открытыми», то есть они могут пополняться как создателями данного словаря, так и авторизованными пользователями. Таким образом, словник онлайнсловарей постоянно увеличивается, что создаёт дополнительные сложности для его оценки. 2.Количество языковых пар. Оба рассматриваемых словаря служат преимущественно для перевода слов и словосочетаний с иностранного языка на русский, или обратно, однако они имеют и другие направления. В большей мере это развито в ABBYYLingvoOnline, где предоставляется возможность выбора обеих языков из выпадающих списков. В Мультитране имеется только две языковые пары, не включающие в себя русский язык: англонемецкий и англоэстонский словари. Впрочем, кажущаяся, на первый взгляд, свобода выбора языков в ABBYYLingvoOnlineна деле весьма ограничена: далеко не для всех доступных языковых пар имеются словари, например, можно выбрать для работы испанский и татарский языки, но словари для такого направления отсутствуют. В данном словаре языковые пары так же, как и в Мультитране, строятся преимущественно между русским и одним из иностранных языков. Имеется также несколько языковых пар английского и некоторых других иностранных языков, но в целом направления перевода с одного иностранного языка на другой весьма ограничены. Здесь необходимо отметить, что англорусское (и соответственно русскоанглийское) направление является приоритетным как в Мультитране, так и в ABBYYLingvoOnline. Несмотря на многоязычность данных словарей, почти половина словника в Мультитране и приблизительно треть словника в ABBYYLingvoOnlineприходится на английские и русские словари.3.Наличие и количество специализированных словарей. В принципе, такие словари присутствуют в виде дополнений практически в любом крупном электронном словаре, и данные онлайнсловари не являются исключением. Здесь несколько разнится только способ представления статей специализированных словарей при выводе результатов запроса: в ABBYYLingvoOnlineони представлены в виде набора отдельных карточек, каждая из которых имеет собственную структуру, пронумерованные варианты значений и словосочетания, тогда как в Мультитране та же самая информация представлена в виде одной большой статьи, где данные тематических словарей перечисляются в разных строках, обозначенных соответствующими пометами, а словосочетания приведены в самом конце такой статьи. Это несколько затрудняет оценку, поскольку многие из таких «тематических словарей» включают в себя буквально 2–3 слова, поэтому при анализе учитывались словари, состоящие, как минимум, из 100 словарных статей. Впрочем, и таких словарей в Мультитране насчитывается приблизительно 2500 по причине значительного тематического дробления словника. Например, если в состав ABBYYLingvoOnlineвходит словарь медицинской терминологии, то вМультитране ему соответствуют тематические словари по хирургии, офтальмологии, ортопедии и т.п. Таким образом, ABBYYLingvoOnlineрасполагает гораздо меньшим количеством специальных словарей, однако каждый из них весьма значительного объёма, в то время как Мультитран состоит из большого количества узкоспециализированных тематических словарей, содержащих весьма небольшой объём лексики.4.Наличие и характер гиперссылок. Некоторые электронные словари, являющиеся простым аналогом бумажных словарей, но реализованным в электронном виде не имеют гиперссылок в словарных статьях, однако в настоящий момент такое встречается уже довольно редко. Подобная практика существовала на раннем этапе развития электронных словарей, однако сейчас ни один электронный словарь уже необходится без гипертекста. Разница преимущественно заключается в том, насколько этот гипертекст развит и для каких целей используется. Чаще всего гиперссылки используются для перехода от одного слова из данной словарной статьи к статье, где это слово будет заглавным. Такой подход используется, например, в словаре Мультитран, где гиперссылки ведут к переводу данного слова, то есть открывают словарную статью на другом языке. В словаре ABBYYLingvoOnlineгиперссылки имеют другую функцию: они помогают выводить список примеров употребления данного слова. 5.Наличие мультимедийной информации в словарных статьях. Возможности электронных словарей позволяют приводить иллюстративный материал в абсолютно новой форме, по сравнению с классическими бумажными словарями. В словарных статьях может быть использована мультимедийная информация, то есть аудиои видеофайлы. В онлайнсловарях используется аудиоинформация для представления произношения слов. В исследуемых словарях такая функция имеется только у ABBYYLingvoOnline,с помощью которого пользователь может прослушать произношения 76000 слов и словосочетаний в словарях английского, немецкого, французского, итальянского, испанского, китайского и украинскогоязыков. 6.Наличие примеров употребления слов. Многие современные электронные словари предоставляют пользователю примеры употребления запрашиваемых слов, что позволяет наиболее полно представить смысловое содержание слова. В случае с онлайнсловарями это представляет особую ценность, поскольку базы примеров постоянно пополняются. В рассматриваемых словарях данная функция реализована поразному. В словаре Мультитран примеры даются в самом конце общей словарной статьи, причём они рассортированы по тематикам. В словаре ABBYYLingvoOnlineпримеры употребления слов доступны через гиперссылки при щелчке мышью на требуемое слово. 7.Возможность расширения словаря пользователями. Данная функция является весьма ценной и представляет собой настоящий прорыв в лексикографии. Словарь, постоянно пополняемый достаточно большим количеством людей, среди которых не только лингвисты, но и специалисты в других областях знания, несомненно, будет гораздо более полно отвечать запросам пользователей. Впрочем, здесь есть и определённые недостатки. Вопервых, информация, добавляемая людьми «со стороны», не являющимися профессиональными лексикографами, может быть не точной или вообще не верной. Здесь, безусловно, необходим строгий контроль со стороны составителей данного словаря. Вовторых, информация, вносимая разными пользователями, подчас не унифицирована и нередко вносит чрезмерное многообразие. Пользователю предоставляется множество сходных вариантов перевода какоголибо слова без всякого пояснения, что крайне затрудняет выбор наиболее подходящего эквивалента.8.Наличие интеллектуального ввода и проверки орфографии. Данная функция появилась в онлайнсловарях относительно недавно, но в настоящий момент она является весьма востребованной, поскольку значительно облегчает работу пользователя со словарём. На данном этапе эти функции во многих онлайнсловарях всё ещё далеки от идеала. Такая проблема существует не только в отечественной компьютерной лексикографии, но и в зарубежной, где внедрение систем интеллектуального ввода в онлайнсловари началось раньше, о чём пишут в своей работе «OnlineEnglishLearners’ DictionariesandMisspellings: OneYearOn» Роберт Лью и Роджер Миттон [3]. Интеллектуальный ввод, то есть подстановка вариантов слова при его наборе является весьма мощным инструментом, упрощающим работу пользователя со словарём и ускоряющим процесс перевода. Сопряжение данной функции с подбором возможных вариантов при орфографической ошибке в наборе слова также весьма важно, поскольку пользователь далеко не всегда уверен в том, как пишется то или иное слово на чужом для него языке. В исследуемых онлайнсловарях такое сопряжение полностью реализовано только в Мультитране, поскольку в ABBYYLingvoOnlineотсутствует интеллектуальный ввод текста, и это весьма удивительно, учитывая, что в компьютерных словарях ABBYYLingvoтакая функция присутствует с самых ранних версий.

В соответствии с вышеперечисленными параметрами была построена матрица параметрического анализа словарей Мультитран и ABBYYLingvoOnline, наглядно представленная в табл.1. К сожалению, как уже указывалось при подробном описании параметров, некоторые данные могут быть представлены только приблизительно. Причиной этого является прежде всего тот факт, что онлайнсловарь –это открытая система с огромным количеством элементов, находящаяся в постоянном развитии. Кроме этого, при создании разных онлайнсловарей применяются довольно разнящиеся методики, что ведёт к сложностям в сопоставлении сходных элементов. Примером этого могут служить тематические словари в каждом из рассматриваемых онлайнсловарей.Таблица 1Результаты параметрического анализа онлайнсловарей

Мультитран и ABBYYLingvoOnline

ПараметрСловариМультитранABBYYLingvoOnline1.Объём словникаПриблизительно 12 млн. словПриблизительно 18 млн. слов2.Количество языковых пар13 языковых пар Рабочие языки: русский, английский, немецкий, французский, испанский, итальянский, нидерландский, латышский, эстонский, африкаанс, эсперанто, калмыцкий28 языковых парРабочие языки: английский, венгерский, греческий, датский, испанский, итальянский, казахский, китайский, латинский, немецкий, нидерландский, норвежский, польский, португальский, русский, татарский, турецкий, украинский, французский, финский3.Наличие и количество специализированных словарейПриблизительно 2500 словарей217 словарей4.Наличие и характер гиперссылокГиперссылки используются для перехода между словарными статьями противоположного направления переводаГиперссылки используются для перехода к примерам словоупотребления5.Наличие мультимедийной информации в словарных статьях–Часть заглавных слов озвучена6.Наличие примеров употребления словДаны в словарной статье отдельным блоком с тематическим разбиениемВыдаются во всплывающем окне при нажатии на гиперссылку7.Возможность расширения словаря пользователями++8.Наличие интеллектуального ввода и проверки орфографии.Имеется интеллектуальный ввод и подбор вариантов при орфографической ошибкеОтсутствует интеллектуальный ввод, имеется подбор вариантов при орфографической ошибке

Из результатов сравнительного анализа видно, что ABBYYLingvoOnlineобладает более солидной словарной базой и превосходит Мультитран по количеству рабочих языков и языковых пар. Другими преимуществами данного словаря являются наличие озвученных заглавных слов в некоторых словарных статьях, более простой доступ к примерам словоупотребления для конкретного слова. Учитывая также тот факт, что результаты перевода слова раскладываются в виде набора словарных статей из нескольких словарей, в виде, весьма напоминающем классический бумажный словарь, можно предположить, что данный словарь рассчитан на самый широкий круг пользователей и может быть успешно использован как для профессионального перевода иноязычных текстов, так и при обучении иностранному языку, чтении и написании иноязычных текстов.

Словарь Мультитран располагает интеллектуальным вводом текста, имеет более детальное тематическое членение словника, обеспечивает более быстрый переход между рабочими языками и при таких характеристиках удобен в большей мере для профессионального перевода текстов различной тематики.

Ссылкинаисточники1.Kwary D.A. Adaptive Hypermedia and UserOriented Data for Online Dictionaries: A Case Study on an English Dictionary of Finance for Indonesian Students // International Journal of Lexicography. –2012. –Vol.25. –Issue 1(March). –URL: http://ijl.oxfordjournals.org/content/25/1/30.full. –[Датаобращения26.10.2013].2.КарауловЮ.Н.Лингвистическоеконструированиеитезауруслитературногоязыка. –М.: Наука, 1981. –368с.3.Lew R., Mitton R.Online English Learners’ Dictionaries and Misspellings: One Year On // International Journal of Lexicography. –2013. –Vol.26. –Issue2(June). –URL:http://ijl.oxfordjournals.org/content/26/2/219.full. –[Датаобращения28.10.2013].

Maxim Marus,candidate of Philological Sciences, Associate Professor at the chair of foreign languages and applied linguistics, Omsk State Agrarian University named after P.A.Stolypin, OmskComparative analysis of modern multilingual online dictionaries, evidence from Multitran and ABBYY Lingvo Online dictionariesAbstract.This article deals with the main characteristics of Multitran and ABBYY Lingvo Online multilingual online dictionaries, comparative analysis of the said dictionaries is undertaken, and the conclusions concerning their applicability are drawn.Key words: computational lexicography, electronic dictionary, online dictionary.References:1, 3 –English Sources; 2 –Russian Source.

Рекомендовано к публикации:Горевым П.М., кандидатом педагогических наук, главным редактором журнала «Концепт»