Головна Філологія Мовознавство К ВОПРОСУ О МАШИННОМ ПЕРЕВОДЕ И ФУНКЦИОНИРОВАНИИ ЭЛЕКТРОННЫХ СЛОВАРЕЙ
joomla
К ВОПРОСУ О МАШИННОМ ПЕРЕВОДЕ И ФУНКЦИОНИРОВАНИИ ЭЛЕКТРОННЫХ СЛОВАРЕЙ
Філологія - Мовознавство

Х. А. Хатиашвили, Н. М. Амирэджиби

Тбилисский государственный университет имени Иванэ Джавахишвили

Розглянуто Феномен машинного перекладу Як процесу Перекладу Текстів (письмових, а в Ідеалі й усних) з однієї оригінальної мови на іншу за допомогою спеціальної комп’ютерної про­грами; проаналізовано можливості машинного перекладу, охарактеризовано найпоширеніші комп’ютерні системи перекладу, визначено типові помилки, що виникають при машинному перекладі; обговорено проблеми перекладу з грузинської мови на інші.

Ключові слова: машинний переклад, автоматичний переклад, комп’ютерний переклад.

Рассмотрен Феномен машинного Перевода как процесса перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной комп’ютер-ной программы; проанализированы возможности машинного перевода, охарактеризованы наи­более известные компьютерные системы перевода, определены типичные ошибки, возникающие при машинном переводе; обсуждены проблемы перевода с грузинского на другие языки.

Ключевые слова: машинный перевод, автоматический перевод, компьютерный перевод.

The machine translation phenomenon is considered as translation process of texts (written, and in an ideal and oral) from one on another by means of the special computer; machine translation possi­bilities are analyzed, the most known computer translation systems are characterised, the typical er­rors arising at machine translation are defined; problems of translation from Georgian into other lan­guages are discussed.

Keywords : machine translation, automatic translation, computer translation.

Перевод имеет давнюю историю. Своими корнями он восходит к тем далеким временам, когда праязык (ввиду географических, исторических и культурных предпосылок, а следуя религии, после Вавилонского столпотворения) распался на отдельные языки и вместе с другими элементами духовной и материальной культу­ры стал развиваться во внутринациональных пределах. Начиная с этого периода возникла необходимость посредничества при общении разных языковых общин, необходимость декодирования речи для осуществления коммуникации. Поэтому почти с самого начала существования человеческой цивилизации перевод выпол­нял важнейшую социальную функцию, делая возможным межязыковое общение людей.

На протяжении истории перевод носил спонтанный характер, использовался в локальных условиях. Как отдельная научная дисциплина переводоведение сфор­мировалось во II-й половине XX столетия, что было обусловлено прогрессом меж­национальных отношений. Человеческая склонность к обобщению происходящего в мире и веками накопленный огромный опыт в переводческой практике привели ученых к созданию теории перевода. Коротко суть переводоведения можно выра­зить следующим образом: во-первых, перевод - это интеллектуальная деятельность, т. е. процесс. Во-вторых, результат этого процесса - продукт переводческой деятель­ности, т. е. речевое произведение (текст перевода), созданное переводчиком.

В настоящее время термин Перевод Охватывает широчайший круг человече­ской деятельности: переводится художественная литература - поэзия, классическая и орнаментальная проза, драматургия; научная литература по всем областям зна-

© Хатиашвили Х. А., Амирэджиби Н. М., 2010


Ния; публицистика, телеинформация, реклама, научно-популярные, документаль­ные и художественные фильмы; документация и деловые бумаги; речи ораторов, приватные беседы лиц и т. д.

Служа средством общения людей различных национальностей, перевод явля­ется существенной частью межязыковой и межкультурной коммуникации. Так как принципиально язык соотносится с одним и тем же объективным миром, расхож­дения в национальных концептуальных и языковых картинах обусловлены различ­ным опытом людей по освоению одного и того же мира. Исходя из этого, как бы ни были своеобразны по своей структуре отдельные языковые модели, в конечном итоге они все являются отображением в сознании человека окружающего мира. Поэтому перевод возможен с любого языка и на любой язык. В последнем случае основной точкой отправления служит динамическое понимание языка и культуры – взаимосвязь и взаимовлияние культурного опыта разных народов. А. Садохин дает следующее определение межкультурной коммуникации: «Межкультурная комму­никация есть совокупность разнообразных форм отношений и общения между ин­дивидами и группами, принадлежащими к разным культурам» [7]. Исследования по межкультурной коммуникации в последнее время приобретают все большее значе­ние в связи с процессами глобализации и интенсивной миграции. В этом процессе особое место занимает перевод. Согласно А. Швейцеру, «перевод может быть оп­ределен как однонаправленный и двухфазный процесс межязыковой и межкуль­турной коммуникации, при котором на основе подвергнутого целенаправленному («переводческому») анализу первичного текста создается вторичный текст (мета-текст), заменяющий первичный в другой языковой и культурной среде... Процесс, характеризуемый установкой на передачу коммуникативного эффекта первичного текста, частично модифицируемый различиями между двумя языками, двумя куль­турами и двумя коммуникативными ситуациями» [4, с. 75]. К научным дисципли­нам, исследующим проблемы перевода, Швейцер относит лингвистику, литерату­роведение, психологию и этнографию.

XXI век поставил новые задачи в коммуникативном пространстве человече­ства. Современное движение информационных потоков не знает ни границ, ни вре­мени, ни пространства. В этом непрестанном обмене роль перевода неуклонно воз­растает. Идет процесс сопоставительных, контрастивных исследований, осуществ­ляемых методом перевода и для перевода, которые являются частными теориями перевода для конкретных пар языков. Соответственно, расширяется переводческая методология. К традиционным видам перевода – письменному, устному, последо­вательному, синхронному, двустороннему, переводу с листа, письменному перево­ду на слух, развитие кибернетики и информационных технологий добавило ма­шинный перевод (МП), время широкого практического использования которого наступило с 1980-х годов. Целью Настоящей статьи является анализ основных про­блем, связанных с феноменом машинного перевода и функционированием пере­водных электронных словарей.

Машинный перевод – процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компью­терной программы [5]. Вместо определения Машинный Иногда употребляются Ав­томатический Или Компьютерный.

Машинный перевод базируется на вычислительной лингвистике. Для его осуществления в компьютер вводится специальная программа, реализующая алго­ритм перевода. Все практические системы без исключения используют идею пере­водных соответствий, т. е. модель «текст–текст».

В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, ре-


Зультаты машинного перевода могут быть использованы для поверхностного озна­комления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактиро­вания. С другой стороны – это использование машинного перевода вместо обычно­го «человеческого». Данный процесс предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, его ориентированность на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов в извлечении грамматиче­ской информации, нахождение переводных соответствий и алгоритмов синтеза.

Возможности современного персонального компьютера вполне отвечают по­требностям переводческой практики. Гарантирована высокая скорость перевода, что играет немаловажную роль в XXI столетии, универсальность – с помощью под­ключения специализированных словарей компьютер переводит тексты из любой области. Известно, что универсальными знаниями обладает лишь очень малый процент «живых» переводчиков. Кроме того, переводческие программы все время пополняются новейшими терминами и оперативностью далеко опережают свои по­лиграфические аналоги.

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, английский и русский, немецкий и испанский, английский и немецкий и т. д.). На данном этапе они обеспечивают связный перевод текста, учитывающий его морфологические, синтаксические и семантические данные, пе­ревод идиоматических словосочетаний, фразеологических единиц и штампов кон­кретной предметной области, лексический анализ и перевод лексем, отделение од­нозначных слов от многозначных, синтез словоформ и предложений в целом на выходном языке.

Можно выделить два основных стимула развития работ по машинному пере­воду. Первый – собственно научный; он определяется комплексностью и сложно­стью компьютерного моделирования перевода. Как вид языковой деятельности пе­ревод затрагивает все уровни языка – от распознавания графем до передачи смысла высказывания и текста. Кроме того, для перевода характерна обратная связь и воз­можность сразу проверить языковые уровни и эффективность предлагаемых алго­ритмов. «Эта характерная черта перевода вообще, и машинного перевода в частно­сти, привлекает внимание теоретиков, в результате чего продолжают возникать все новые теории автоматизации перевода и формализации языковых данных» [6].

Второй стимул – социальный. Он обусловлен возрастающей ролью самой практики перевода в современном мире как необходимого условия обеспечения межязыковой коммуникации, объем которой растет с каждым годом.

Идея машинного перевода стимулировала развитие исследований в теорети­ческом и прикладном языкознании во всем мире, поскольку главные трудности при создании полностью автоматизированных систем высококачественного перевода связаны с недостаточным уровнем разработанности семантической теории языков, с помощью которой можно было бы точно сформулировать правила обработки смысла и значений предложений языка. Появились теории формальных грамматик, большое внимание стало уделяться моделированию языка и отдельных его аспек­тов, языковой и мыслительной деятельности, вопросам языковой формы и количе­ственных распределений лингвистических явлений. Возникли новые направления лингвистической науки – вычислительная, математическая, инженерная, статисти­ческая, алгоритмическая лингвистика и ряд других отраслей прикладного и теоре­тического языкознания.


Качество машинного перевода зависит от тематики и стиля исходного текста, от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эф­фективности программного обеспечения, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод. Лучше всех переводятся технические и официально-деловые тексты, т. е. более качествен­ным оказывается информативный перевод, в котором особенности индивидуально-авторского стиля не так существенны. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества, т. к. «художест­венное» мышление недоступно машине и остается человеческой прерогативой.

Современные темпы жизни – поток информации и необходимость обмена ею, огромное количество переводной документации, развитие международных образо­вательных систем – требуют максимально автоматизированного процесса перевода, время остается лишь для творческого редактирования, которое всегда будет выпол­нять «живое» мышление – человек. В любом из современных видов машинного пе­ревода необходимо участие человека-редактора, удобство работы которого обеспе­чивается качеством и надежностью соответствующего программного обеспечения.

В настоящее время есть множество компьютерных программ (в большинстве созданных в США и России), позволяющих переводить с помощью автоматизиро­ванной системы. Среди них ПРОМТ (от PROject MT – проект машинного перево­да) – продукт российской компании, разработчика систем машинного перевода для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Компания была основана в Санкт-Петербурге в 1991 году быв­шими сотрудниками лаборатории инженерной лингвистики им. А. Герцена [2].

Мультитран – интернет-система, которая насчитывает 12 электронных сло­варей. Программа также создана в России.

ABBYY Lingvo – электронный словарь. Создан российской компанией ABBYY. Многоязычная версия охватывает 11 языков. В отличие от ПРОМТ-а, в ABBYY Lingvo нет функции полнотекстового перевода, но в программу включен обучающий модуль Lingvo Tutor и другие программы [1].

Компьютерный перевод, с одной стороны, облегчает работу переводчика-человека. Так, не надо смотреть в словаре незнакомые слова, что сберегает время и энергию, но с другой стороны, как уже было отмечено, машинный перевод нельзя считать окончательным, так как компьютерные программы допускают серьезные ошибки. Ведь даже профессиональный переводчик в процессе перевода для подбо­ра нужного эквивалента обращается не к одному словарю. В поисках вариантов переводчик вновь и вновь обращается к единицам ИЯ (исходного языка) в оригина­ле, ищет в словаре их значения и одновременно пробует, нельзя ли использовать для их перевода один из вариантов, предлагаемый в двуязычном словаре. Иногда переводчик обнаруживает, что имеющийся в словаре перевод можно непосредст­венно использовать для перевода данного текста, т. е. задача сводится к правиль­ному выбору словарного соответствия. Однако чаще всего переводчик не находит в словаре такого варианта, который удовлетворяет условиям конкретного контекста. В этом случае он отыскивает нужную ему единицу ПЯ (принимающего языка), со­поставляя словарные варианты, определяя общий смысл переводимого слова и применяя его к условиям контекста. Компьютерные программы зачастую выдают только один вариант перевода слова, что приводит к неправильному переводу.

Мы рассмотрим некоторые ошибки, которые допускаются при машинном пе­реводе. Большинство программ адекватно переводят простые части речи, но допус­кают ошибки в переводе падежей, прилагательных, речевых оборотов, неправильно отражают построение предложения. Кроме того, недостатком выполненного ком-


Пьютером перевода является неточность перевода слов, имеющих несколько значе­ний. Электронный переводчик справляется с переводом слов во множественном и единственном числе, но имеется определенная трудность в переводе падежей и по­становки глаголов в нужное число. Это объясняется различной интерпретацией па­дежей в том или ином языке.

Теперь несколько слов о проблемах машинного перевода в Грузии. Здесь, как и во всем мире, широко используется машинный перевод, однако до сих пор не создана электронная программа-переводчик, обеспечивающая перевод на грузин­ский язык и обратно. Чтобы перевести грузинский текст по компьютерной про­грамме, сначала его нужно обычным путем (посредством «живого» переводчика) перевести на любой, известный программе язык. Это объясняется, в первую оче­редь, особой сложностью грамматики грузинского языка (например, грузинского глагола). Вообще, кавказские языки, подразделяющиеся на северокавказские и картвельские (в последнюю подгруппу и входит грузинский), являются одними из наиболее сложных в мире по всем лингвистическим параметрам. К этому добавля­ется своеобразие грузинского письма. Как известно, грузинский язык использует Оригинальное Написание, которое относится к тем редким письменам Земли, у ко­торых нет аналогов. Известно, что оригинальными письменами пишут чуть более 4 % землян. Они проживают в 10 государствах: Южной Корее, Эфиопии и Эритрее, КНДР, Греции и Кипре, Израиле, Армении, Ирландии, на Мальдивах и Грузии. Эти страны занимают всего менее 2 % поверхности Земли. Исходя из этого, язык и письмо этих стран большей частью являются локальными и не выходят за грани того или иного этноса. Соответственно, очень низок финансовый интерес к подоб­ным проектам.

Таким образом, создание грузинского электронного словаря, и в особенности соответствующего машинного алгоритма, который бы переводил грузинские тек­сты на другие языки с учетом всех требований, – очень сложная и трудоемкая рабо­та, требующая, кроме ощутимой финансовой поддержки, особых знаний и целеуст­ремленности. Научные исследования по данному направлению идут уже давно. В них принимают участие виднейшие грузинские ученые-лингвисты, математики и инженеры, пишутся диссертации, однако до сих пор не удалось получить ощутимо­го результата.

В этом отношении перевод индоевропейских языков, к которым относится большинство самых «используемых» в настоящее время в мире языков, осуществ­ляется намного легче. Чем ближе стоят языки в группах, тем легче находятся алго­ритмические соответствия между ними. Например, используется схожесть структур германских языков, славянских языков, романских языков и т. д. По мере удаления групп разница растет, но все-таки удается находить точки соприкосновения, тем более, что в современной западной цивилизации самым распространенным пись­мом является Латиница (около 40 % населения земного шара). Ареал латиницы очень широк: Америка, Австралия, Африка, Западная Европа, Турция, Азербай­джан, Узбекистан, Туркмения, Индонезия, Малайзия, Филиппины и Вьетнам. Так­же широко распространена Кириллица, которой пользуются белорусский, болгар­ский, македонский, русский, сербский, украинский, черногорский языки.

Подводя итог, отметим преимущества и недостатки машинного перевода. С одной стороны, компьютер упрощает процесс перевода, т. е. переводческие про­граммы облегчают труд переводчика, что является, наверное, самым важным мо­ментом их функционирования. С другой стороны, машинный перевод обязательно требует редактирования, а программный перевод художественной литературы фак­тически невозможен. Для подбора более адекватных соответствий в перспективе можно предложить более глубокий эвристический анализ грамматического по-


Строения предложения, с улучшением качества перевода различных частей речи и их грамматических характеристик, а также исключить конфликт словарей при пе­реводе специализированных текстов.

Основными достоинствами машинного перевода являются высокая скорость, низкая стоимость, доступ к услуге, конфиденциальность, универсальность, перевод информации в Интернете [3, с. 172–173]. Несмотря на то, что компьютер не пони­мает языковых нюансов и не может предложить «одухотворенный» текст, в его распоряжении находится словарь, он вполне удовлетворительно выполняет до­словный перевод, нередко предлагая синонимичные ряды обозначения понятий. Именно благодаря машинному переводу появилась возможность просматривать в Интернете иностранные сайты.

Перспективы развития машинного перевода связаны с дальнейшей разработ­кой и углублением теории и практики перевода, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество пе­ревода лексических единиц. Все вышесказанное будет вносить свой вклад в совер­шенствование и дальнейшее развитие теории и практики машинного перевода.

Библиографические ссылки

1. Система электронных словарей Lingvo Для DOC И Windows. – М. : «БИТ», 1995.

2. Система перевода текста Magic Goody Для Windows. – СПб. : «ПРОМТО», 1999.

3. Чейшвили К. И. Некоторые вопросы компьютерного перевода / К. И. Чейшвили // На­учные труды II. Серия: Филология. – СПб.–Тбилиси, 2001. – С. 172–173.

4. Швейцер А. Д. Теория перевода : Статус, проблемы, аспекты / А. Д. Швейцер. – М. : Наука, 1988. – С. 75.

5. Машинный перевод. – Режим доступа : Http://ru. wikipedia. org

6. Машинный перевод. – Режим доступа : Http://www. krugosvet. ru

7. Письменности современного мира. – Режим доступа : Http://www. rbardalzo. narod. ru

Надійшла До Редколегії 24.05.10


УДК 811.161.1’373.23