NetworkDoc.Ru В помощь системному администратору

EasyBlog

This is some blog description about this site

  • Home
    Home This is where you can find all the blog posts throughout the site.
  • Categories
    Categories Displays a list of categories from this blog.
  • Tags
    Tags Displays a list of tags that have been used in the blog.
  • Bloggers
    Bloggers Search for your favorite blogger from this site.
  • Team Blogs
    Team Blogs Find your favorite team blogs here.
  • Login
    Login Login form

ЕС предлагает разработчикам ресурсы по машинному переводу

Posted by on in Последние новости
  • Font size: Larger Smaller
  • Hits: 2708
  • 0 Comments
  • Subscribe to this entry
  • Print
Европейская Комиссия предложила разработчикам ПО перевода бесплатный доступ почти к миллиону переведенных предложений на 22 из 23 официальных языков Евросоюза. ЕК надеется, что эти данные помогут повысить качество разнообразных языковых инструментов, включая программы проверки грамматики и орфографии, онлайновые словари и автоматические переводчики - особенно на менее распространенных языках, таких как Латвийский или Румынский.

Предложения взяты главным образом из Acquis Communautaire, свода законов, который должен быть принят всеми новыми членами ЕС и включает договоры, директивы и постановления ЕС, а также решения Европейского суда. Эти документы, переведенные профессиональными переводчиками, охватывают такие темы, как информационные технологии, телекоммуникации, трудовой кодекс, сельское хозяйство и право рыбной ловли.

Переводы этих предложений образуют часть «памяти переводов», используемой 1750 штатными переводчиками Комиссии, снабжены признаками предметной классификации и в точности совпадают для каждого из 22 языков. Это делает их особенно полезными для разработчиков ПО статистического машинного перевода, которым нужно собрать корпус из тысяч совпадающих фраз на разных языках, чтобы затем можно было найти наиболее вероятный перевод любой заданной фразы. Так как предложения уже совпадают, разработчики сэкономят массу времени - а гигантский размер Acquis Communautaire поможет им получать более точные результаты вычислений. До сих пор разработчики обычно разыскивали в вебе тексты, переведенные на несколько языков, и пользовались другими программными инструментами, чтобы определять начало и конец предложений и совмещать их.

Предоставляя эти данные в распоряжение разработчиков, Комиссия не совсем бескорыстна: она надеется, что доступность лучшего и более дешевого ПО машинного перевода откроет людям, говорящим на «малых» языках ЕС, доступ к онлайновой информации, которая сейчас доступна только носителям широко распространенных языков.

Заинтересованные разработчики могут загрузить тексты с веб-сайта Дирекции по переводу Европейской Комиссии. Им понадобится также программа для извлечения текста и ее библиотека.

0

Comments

  • No comments made yet. Be the first to submit a comment

Leave your comment

Guest Saturday, 01 February 2025
Loading ...

Joomla! Debug Console

Session

Profile Information

Memory Usage

Database Queries

Application 0.000 seconds (+0.000); 0.33 MB (+0.328) - afterLoadApplication 0.012 seconds (+0.012); 1.38 MB (+1.048) - afterInitialiseApplication 0.029 seconds (+0.017); 3.98 MB (+2.605) - afterCache