30 апреля 2024
USD 91.78 -0.23 EUR 98.03 -0.69
  1. Главная страница
  2. Архив
  3. Архивная публикация 2005 года: "Переводчик в кармане"

Архивная публикация 2005 года: "Переводчик в кармане"

Группа ученых из Карлсруэ разработала компьютер, способный синхронно переводить доклады и телевизионные новости. В будущем планируется создание переносного «полиглота», которым сможет воспользоваться любой человек. КОМПЬЮТЕР

Человек что-то произносит, видно, как шевелятся его губы, но не слышно ни звука. Зато из громкоговорителя доносится фраза: «Благодарю вас за то, что вы пришли». Кто говорит? Это компьютер, обладающий искусственным голосом. Он распознает слова оратора в процессе произнесения и тут же переводит их с английского на немецкий.

Это не трюк и не феномен чревовещания «на продвинутом уровне». Техника вот то волшебное слово, которое таит в себе обещание: в будущем каждый сможет разговаривать на иностранном языке, просто нажав на кнопку. Так, например, турист, куда бы ни занесла его судьба, сможет поговорить о погоде и политике по-абхазски, на хинди или инуктикуте.

Такие интересные вещи придумывают в институте под названием «Интеракт», совместном детище Университета Карлсруэ и американского Университета Карнеги-Меллона (Питтсбург). Исследователи поставили перед собой дерзкую цель. «Мы хотим добиться исчезновения языковых границ», — говорит директор института Алекс Вайбель.

Правда, прежде чем «автоматический чревовещатель» сможет служить людям, предстоит еще много сделать. Техника первого поколения непрактична: чтобы фиксировать электрическиие сигналы, возникающие при сокращении мышц речевого аппарата, нужно прикрепить электроды к лицу и шее. Пока компьютер различает всего 30 слов, и то при условии, что «немой оратор» не позволяет себе ни малейшей улыбки.

Гораздо дальше продвинулись переводческие компьютерные программы, которые улавливают беззвучную артикуляцию и тут же переводят текст на иностранный язык. Если же исходный текст озвучен, программа и вовсе способна справиться с задачами, которые до сих пор были не под силу компьютеру. В Карлсруэ можно увидеть, как она синхронно переводит на английский новостную программу китайского телевидения: внизу экрана появляются титры с вполне понятным текстом. Возможен также перевод докладов или выступлений в парламенте. Правда, немецкий язык пока получается довольно ломаным, гораздо лучше выглядит результат при переводе с английского на испанский.

Еще недавно вряд ли кто-нибудь мог поверить, что компьютер способен переводить живую речь. Даже если ему предлагался безупречно сформулированный письменный документ, в итоге получался смешной бред: язык сбивает электронику с толку многозначностью слов и выражений. И правда, откуда компьютеру знать, что выражение «намылить шею» никак не касается банных процедур?

Искусственный переводчик годился только для узкого круга специальных областей. Компания Microsoft, например, создала в Интернете постоянно увеличивающийся банк данных, в который поступают рекомендации по решению проблем в области программного обеспечения. Терминология обозрима, форма выражения достаточно шаблонная — тут и машина справится. Перевод около 200 тыс. документов на пять языков — поистине геркулесова работа — уже сейчас на 90% осуществляется автоматически.

Однако разработчики из Карлсруэ и Питтсбурга хотят достичь большего. «Мы станем первыми, кто сделает машинный перевод эффективным практически в любой области», — утверждает Алекс Вайбель. Это возможно, поскольку появился совершенно новый метод: все больше ученых предпочитают не «учить компьютер языку», а прибегать к помощи Интернета. Сеть лучше всех знает, как подобрать наиболее точный перевод, — ведь она полна текстами, которые уже имеют аналоги на разных языках.

Какие это тексты? На общедоступных серверах размещены, например, тысячи документов ЕС и ООН; новости информационных агентств выходят сразу на многих языках, не надо забывать и о классике — например, Библии. Другими словами, чуть ли не любая фраза однажды уже была переведена. Компьютеру остается только заимствовать этот богатый опыт.

Понимать язык при этом не требуется. Компьютер просто сопоставляет одну языковую пару за другой, предложение за предложением. В итоге он знает, когда английское слово bank переводится как «банк», а когда как «берег», и запоминает, что вероятность «берега» возрастает, если в контексте упоминаются водоемы. Компьютер как бы выучивает новый язык.

«Главная прелесть в том, что все может осуществляться автоматически, при минимальном вмешательстве человека», — говорит коллега Вайбеля из Питтсбурга Таня Шульц. В этом коренное отличие нового способа от всего, что существовало раньше, когда лингвисты занимались трудоемкой работой, вручную пичкая машину огромным количеством правил, исключений, разных толкований. Этот процесс был бесконечным, и с каждым новым языком приходилось все начинать сначала.

Статистика же не заботится о правилах и информации обо всем на свете. Здесь приоритетными являются мощность компьютера и объем обрабатываемых данных: чем больше «запомнит» компьютер, тем точнее будет перевод — по крайней мере, в теории.

Пока программа, разработанная в Карлс-руэ, гораздо чаще использует канцелярские выражения, поскольку существенная часть данных получена ею из документов Европейского cоюза. Но это вопрос времени. «На нашей стороне — возрастающая мощность процессоров и растущий объем данных, — говорит директор института Вайбель. — Думаю, через 10 лет этим способом будут пользоваться все».

Программист Франц Йозеф Ох, один из основоположников статистического перевода, работает в компании Google, создающей поисковые системы. Два года назад его заметили на конкурсе, организованном американскими военными. Его программа после непродолжительной тренировки справлялась с текстами на хинди быстрее конкурентов. Работая с Google, статистик имеет дело с гигантским объемом данных: в памяти поисковой системы хранится 16 млрд. слов. Ох может тренировать свою программу в освоении всех тонкостей и оборотов языка. Целью является как можно более точный перевод на английский.

Вайбель из Карлсруэ пока не может на это рассчитывать. Его электронному синхронисту нелегко справиться со всеми превратностями устной речи, ведь он вынужден сталкиваться с заиканием, словами-паразитами и бесконечными повторениями: «Мы хотели, э… на чем я остановился?» При этом не исключено, что кто-то кашляет, смеется или хлопает дверью…

А вот с хорошим качеством речи компьютеры успешно справляются уже сейчас. Многие врачи и адвокаты пользуются звукозаписывающими системами с автоматическим распознаванием языка. Программа Dragon Naturally Speaking, разработанная лидером этого рынка — компанией Nuance, обещает распознавать до 99 из 100 слов. Но это возможно только в тихой обстановке, и говорящий должен все время находиться на одинаковом расстоянии от микрофона.

На шумном заседании парламента компьютер должен ориентироваться сам. Вайбель признает, что в такой обстановке машине работать чрезвычайно трудно. Для начала программа должна научиться отделять главное от второстепенного, делить речь на фразы и передавать смысл высказывания.

В других областях работа продвигается быстрее. Сейчас тестируется устройство для медиков, работающих в зоне бедствия, которое владеет основной лексикой, нужной для проведения осмотра и оказания помощи.

В числе разработок ученых из Карлсруэ и Питтсбурга есть целый ряд устройств, предназначенных, скорее, для секретных агентов. В их числе специальные очки, на стекла которых перевод поступает бегущей строкой. Есть также прибор, способный создавать голоса буквально из ничего. Он представляет собой пластину с множеством крошечных динамиков, посылающих ультразвуковой сигнал. Волны направлены так, чтобы их было слышно только в определенной точке. Этим способом можно, например, направить перевод одному конкретному человеку в наушниках, причем его соседи ничего не заметят.

Уже намечена первая область применения электронного переводчика-«чревовещателя». Разработчица Таня Шульц считает, что в будущем сенсоры будут имплантироваться человеку, чтобы не приклеивать их к телу. Тот, кто осмелится на подобный шаг, сможет не только беспрепятственно общаться на иностранных языках, но и использовать это устройство в качестве телефона. Так, если вам позвонят во время спектакля, вы сможете спокойно принять звонок, не мешая окружающим.

Группа ученых из Карлсруэ разработала компьютер, способный синхронно переводить доклады и телевизионные новости. В будущем планируется создание переносного «полиглота», которым сможет воспользоваться любой человек. КОМПЬЮТЕР

Человек что-то произносит, видно, как шевелятся его губы, но не слышно ни звука. Зато из громкоговорителя доносится фраза: «Благодарю вас за то, что вы пришли». Кто говорит? Это компьютер, обладающий искусственным голосом. Он распознает слова оратора в процессе произнесения и тут же переводит их с английского на немецкий.

Это не трюк и не феномен чревовещания «на продвинутом уровне». Техника вот то волшебное слово, которое таит в себе обещание: в будущем каждый сможет разговаривать на иностранном языке, просто нажав на кнопку. Так, например, турист, куда бы ни занесла его судьба, сможет поговорить о погоде и политике по-абхазски, на хинди или инуктикуте.

Такие интересные вещи придумывают в институте под названием «Интеракт», совместном детище Университета Карлсруэ и американского Университета Карнеги-Меллона (Питтсбург). Исследователи поставили перед собой дерзкую цель. «Мы хотим добиться исчезновения языковых границ», — говорит директор института Алекс Вайбель.

Правда, прежде чем «автоматический чревовещатель» сможет служить людям, предстоит еще много сделать. Техника первого поколения непрактична: чтобы фиксировать электрическиие сигналы, возникающие при сокращении мышц речевого аппарата, нужно прикрепить электроды к лицу и шее. Пока компьютер различает всего 30 слов, и то при условии, что «немой оратор» не позволяет себе ни малейшей улыбки.

Гораздо дальше продвинулись переводческие компьютерные программы, которые улавливают беззвучную артикуляцию и тут же переводят текст на иностранный язык. Если же исходный текст озвучен, программа и вовсе способна справиться с задачами, которые до сих пор были не под силу компьютеру. В Карлсруэ можно увидеть, как она синхронно переводит на английский новостную программу китайского телевидения: внизу экрана появляются титры с вполне понятным текстом. Возможен также перевод докладов или выступлений в парламенте. Правда, немецкий язык пока получается довольно ломаным, гораздо лучше выглядит результат при переводе с английского на испанский.

Еще недавно вряд ли кто-нибудь мог поверить, что компьютер способен переводить живую речь. Даже если ему предлагался безупречно сформулированный письменный документ, в итоге получался смешной бред: язык сбивает электронику с толку многозначностью слов и выражений. И правда, откуда компьютеру знать, что выражение «намылить шею» никак не касается банных процедур?

Искусственный переводчик годился только для узкого круга специальных областей. Компания Microsoft, например, создала в Интернете постоянно увеличивающийся банк данных, в который поступают рекомендации по решению проблем в области программного обеспечения. Терминология обозрима, форма выражения достаточно шаблонная — тут и машина справится. Перевод около 200 тыс. документов на пять языков — поистине геркулесова работа — уже сейчас на 90% осуществляется автоматически.

Однако разработчики из Карлсруэ и Питтсбурга хотят достичь большего. «Мы станем первыми, кто сделает машинный перевод эффективным практически в любой области», — утверждает Алекс Вайбель. Это возможно, поскольку появился совершенно новый метод: все больше ученых предпочитают не «учить компьютер языку», а прибегать к помощи Интернета. Сеть лучше всех знает, как подобрать наиболее точный перевод, — ведь она полна текстами, которые уже имеют аналоги на разных языках.

Какие это тексты? На общедоступных серверах размещены, например, тысячи документов ЕС и ООН; новости информационных агентств выходят сразу на многих языках, не надо забывать и о классике — например, Библии. Другими словами, чуть ли не любая фраза однажды уже была переведена. Компьютеру остается только заимствовать этот богатый опыт.

Понимать язык при этом не требуется. Компьютер просто сопоставляет одну языковую пару за другой, предложение за предложением. В итоге он знает, когда английское слово bank переводится как «банк», а когда как «берег», и запоминает, что вероятность «берега» возрастает, если в контексте упоминаются водоемы. Компьютер как бы выучивает новый язык.

«Главная прелесть в том, что все может осуществляться автоматически, при минимальном вмешательстве человека», — говорит коллега Вайбеля из Питтсбурга Таня Шульц. В этом коренное отличие нового способа от всего, что существовало раньше, когда лингвисты занимались трудоемкой работой, вручную пичкая машину огромным количеством правил, исключений, разных толкований. Этот процесс был бесконечным, и с каждым новым языком приходилось все начинать сначала.

Статистика же не заботится о правилах и информации обо всем на свете. Здесь приоритетными являются мощность компьютера и объем обрабатываемых данных: чем больше «запомнит» компьютер, тем точнее будет перевод — по крайней мере, в теории.

Пока программа, разработанная в Карлс-руэ, гораздо чаще использует канцелярские выражения, поскольку существенная часть данных получена ею из документов Европейского cоюза. Но это вопрос времени. «На нашей стороне — возрастающая мощность процессоров и растущий объем данных, — говорит директор института Вайбель. — Думаю, через 10 лет этим способом будут пользоваться все».

Программист Франц Йозеф Ох, один из основоположников статистического перевода, работает в компании Google, создающей поисковые системы. Два года назад его заметили на конкурсе, организованном американскими военными. Его программа после непродолжительной тренировки справлялась с текстами на хинди быстрее конкурентов. Работая с Google, статистик имеет дело с гигантским объемом данных: в памяти поисковой системы хранится 16 млрд. слов. Ох может тренировать свою программу в освоении всех тонкостей и оборотов языка. Целью является как можно более точный перевод на английский.

Вайбель из Карлсруэ пока не может на это рассчитывать. Его электронному синхронисту нелегко справиться со всеми превратностями устной речи, ведь он вынужден сталкиваться с заиканием, словами-паразитами и бесконечными повторениями: «Мы хотели, э… на чем я остановился?» При этом не исключено, что кто-то кашляет, смеется или хлопает дверью…

А вот с хорошим качеством речи компьютеры успешно справляются уже сейчас. Многие врачи и адвокаты пользуются звукозаписывающими системами с автоматическим распознаванием языка. Программа Dragon Naturally Speaking, разработанная лидером этого рынка — компанией Nuance, обещает распознавать до 99 из 100 слов. Но это возможно только в тихой обстановке, и говорящий должен все время находиться на одинаковом расстоянии от микрофона.

На шумном заседании парламента компьютер должен ориентироваться сам. Вайбель признает, что в такой обстановке машине работать чрезвычайно трудно. Для начала программа должна научиться отделять главное от второстепенного, делить речь на фразы и передавать смысл высказывания.

В других областях работа продвигается быстрее. Сейчас тестируется устройство для медиков, работающих в зоне бедствия, которое владеет основной лексикой, нужной для проведения осмотра и оказания помощи.

В числе разработок ученых из Карлсруэ и Питтсбурга есть целый ряд устройств, предназначенных, скорее, для секретных агентов. В их числе специальные очки, на стекла которых перевод поступает бегущей строкой. Есть также прибор, способный создавать голоса буквально из ничего. Он представляет собой пластину с множеством крошечных динамиков, посылающих ультразвуковой сигнал. Волны направлены так, чтобы их было слышно только в определенной точке. Этим способом можно, например, направить перевод одному конкретному человеку в наушниках, причем его соседи ничего не заметят.

Уже намечена первая область применения электронного переводчика-«чревовещателя». Разработчица Таня Шульц считает, что в будущем сенсоры будут имплантироваться человеку, чтобы не приклеивать их к телу. Тот, кто осмелится на подобный шаг, сможет не только беспрепятственно общаться на иностранных языках, но и использовать это устройство в качестве телефона. Так, если вам позвонят во время спектакля, вы сможете спокойно принять звонок, не мешая окружающим.

Подписывайтесь на PROFILE.RU в Яндекс.Новости или в Яндекс.Дзен. Все важные новости — в telegram-канале «PROFILE-NEWS».