ЕС предлагает разработчикам ресурсы по машинному переводу
- Font size: Larger Smaller
- Hits: 2708
- 0 Comments
- Subscribe to this entry
- Bookmark
Предложения взяты главным образом из Acquis Communautaire, свода законов, который должен быть принят всеми новыми членами ЕС и включает договоры, директивы и постановления ЕС, а также решения Европейского суда. Эти документы, переведенные профессиональными переводчиками, охватывают такие темы, как информационные технологии, телекоммуникации, трудовой кодекс, сельское хозяйство и право рыбной ловли.
Переводы этих предложений образуют часть «памяти переводов», используемой 1750 штатными переводчиками Комиссии, снабжены признаками предметной классификации и в точности совпадают для каждого из 22 языков. Это делает их особенно полезными для разработчиков ПО статистического машинного перевода, которым нужно собрать корпус из тысяч совпадающих фраз на разных языках, чтобы затем можно было найти наиболее вероятный перевод любой заданной фразы. Так как предложения уже совпадают, разработчики сэкономят массу времени - а гигантский размер Acquis Communautaire поможет им получать более точные результаты вычислений. До сих пор разработчики обычно разыскивали в вебе тексты, переведенные на несколько языков, и пользовались другими программными инструментами, чтобы определять начало и конец предложений и совмещать их.
Предоставляя эти данные в распоряжение разработчиков, Комиссия не совсем бескорыстна: она надеется, что доступность лучшего и более дешевого ПО машинного перевода откроет людям, говорящим на «малых» языках ЕС, доступ к онлайновой информации, которая сейчас доступна только носителям широко распространенных языков.
Заинтересованные разработчики могут загрузить тексты с веб-сайта Дирекции по переводу Европейской Комиссии. Им понадобится также программа для извлечения текста и ее библиотека.