«Яндекс.Переводчик» объединил статистический перевод с нейросетью


«Яндекс» объявил о том, что сервис «Яндекс.Переводчик» начал использовать гибридную систему перевода. К статистической модели, которая работает в «Яндекс.Переводчике» с момента запуска, добавилась технология перевода на нейронной сети. Текст переводят обе модели,

а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший. Преимущество гибридной системы в том, что она позволяет взять лучшее от каждого метода и повысить качество перевода.

В отличие от статистического переводчика, нейронная сеть не разбивает тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдаёт его перевод. Такой подход позволяет учесть контекст и лучше передать смысл. Кроме того, результат получается «гладким»: предложение хорошо читается, и иногда даже можно подумать, что его перевел человек.

Статистическая модель, в свою очередь, лучше справляется с редкими словами и фразами и не фантазирует, если смысл предложения непонятен, как это может делать нейросеть.

Чтобы снизить количество грамматических ошибок, «Яндекс.Переводчик» проводит дополнительную проверку переводов, выполненных нейронной сетью. Они проходят через модель языка — так называется свод знаний о языке перевода, накопленный системой. Если в предложении есть рассогласования, например «папа пошла» или «сильный боль», модель исправит их.

Сейчас гибридная система работает только для переводов с английского на русский. Это самое популярное направление перевода — на него приходится около 80% запросов. Пользователи веб-версии «Яндекс.Переводчика» могут сравнить результат работы гибридной системы и статистического переводчика и выбрать вариант, который им больше понравится.

«Яндекс.Переводчик» заработал в 2011 г. На старте он мог работать с тремя языками: русским, украинским и английским. Сейчас он знает 94 языка, включая экзотические наподобие коса или папьяменто, и может выполнять переводы между любой парой. В 2016 году Переводчик выучил синдарин — искусственный язык, на котором говорят эльфы в книгах Дж. Р. Р. Толкина.

Калькулятор расчета пеноблоков смотрите на этом ресурсе
Все о каркасном доме можно найти здесь http://stroidom-shop.ru
Как снять комнату в коммунальной квартире смотрите тут comintour.net

Мы соц. сетях

View kondrashov’s profile on slideshare
Т Е Л Е Г Р А М
 

Hi-Tech Лентач

Наши обзоры

Различные обзоры рынков

  • Итоги работы отрасли Связь в 1 пол. 2017 года +

    Минкомсвязи подвел итоги работы отрасли Связь за 1 полугодие 2017 Подробнее
  • Криптовалюты: исследование кембриджского университета и Visa +

    Кто, где, зачем и сколько майнит и как это связано Подробнее
  • Справка о технических возможностях операторов связи ограничивать скорость сайтов +

    В начале марта 2017 года в СМИ активно обсуждалась возможность Подробнее
  • 1
  • 2
  • 3

Рынок в графиках

×
Читай избранные материалы без рекламы на каналах:
×
Все новости раз в день у Вас на почте:

Введи Ваш E-Mail