Адрес для входа в РФ: exler.world

Голосовой транслятор

04.06.2014 06:04  8583   Комментарии (43)

Microsoft представила на конференции в Калифорнии Skype Translator технологию, которая позволяет понимать друг друга людям в режиме реального времени, даже если они говорят на разных языках. (Отсюда.)

Ну, прям идут в ногу со временем, в Google Translator такое уже лет пять существует, если не больше (в мобильной версии можно наговорить текст, он его переведет, там можно нажать значок динамика - он перевод воспроизведет, причем это делается, как правило, именно носителем языка). Только толку с этого - ноль. Автоматические переводчики более или менее пристойно работают только при переводе с очень близких языков (как, например, русский и украинский, испанский и каталанский), а во всех остальных случаях показывает результаты от "ниже среднего" до "реальный ужас".

И что толку, что вот этот кошмар будет воспроизводиться с голоса? Сначала система распознавания голоса будет конкретно лажать (они все лажают), потом вот это не слишком правильно распознанное будет кошмарно переводиться кошмарным автоматическим переводчиком, потом то же самое будет делаться с противоположной стороны.

ВООБРАЖАЮ! (с) Хоботов

P.S. Ролик об этой технологии. Где-то с 1:15 идет демонстрации. На демонстрации все красиво (что неудивительно, фразы долго подбирали заранее), но на демонстрациях всегда все красиво.

04.06.2014 06:04
Комментарии 43

кстати, я тут уже писал о техподдержке яху. недавно надо было связаться с техподдержкой гугла. я сразу же нашел их контактную страничку, где был почтовый адрес в америке, номер факса там же и немецкий контактый имэйл. вот, думаю, клево, молодцы. написал на этот имэйл. сразу же пришел ответ - "т.к. на этот адрес много пишут, мы его не просматриваем и не отвечаем на пришедшие письма". вот сразу видно, что создатель гугла - русский! посоветовали в том письме свой "kontaktformular". там есть куча ответов на простые вопросы, по моему вопросу рекурсивные ответы. и никакой возможности собственно контакта с техподдержкой. факса у меня нет, но я же типа айтишник, написал на абузный адрес с просьбой отфорвардить в реальный саппорт. ответа нет и не думаю, что будет. теперь я понимаю, почему на них все подают в суд - по-другому с ними просто не связаться.
04.06.14 18:07
0 0

Между прочим, даже в офлайновом Bing translator на WinPhone 8.1 распознавание английской речи, произнесенной с очень сильным русским акцентом, происходит на ура. Правда нужно говорить по-английский правильно.

Т.е., если сказать "I'm sorry", то будет распознано с любым акцентом, а вот если сказать: "I sorry", то он никогда не напишет "sorry", а напишет, например, "I soy", или "I saw you" (это часть более длинной тестовой фразы, но работает и по отдельности).

Суть тут именно в том, что этот сервис будет встроен в скайп, наверняка будет использовать для перевода те же узловые сервера, через которые проходит трафик, либо которые можно задействовать. Сейчас есть разные аддоны, которые, например, позволяют записывать разговор или голос менять, но что-то, настолько многообещающее, но встроенное нативно - всегда лучше, чем какая-то гуглонедоделка, которую гугл все равно скоро закроет.
04.06.14 17:52
0 0

не люблю за глючную и нелогичную винду, которой время от времени приходится пользоваться. гугл я не люблю еще больше, но смарт у меня на андроиде. но по удобству сделать звонок (а особенно, сбросить до включения автоответчика) или фото старый смарт на винмобайле лучше, ибо для всего этого есть кнопки. а вообще, я в последние годы затрудняюсь что-то техническое любить. все глючат, все факапятся, все развиваются к худшему. больше ненужных фич, больше ресурсов и т.д. все, кто производил что-то хорошее, продаются худшим, которые не перенимают их качество (пример - винты от самсунга и хитачи). или стараются перенять от них все худшее. (пример - файрфокс vs. хром). хоть вешайся или становись отшельником. но без инета жизнь тоже не мила.
04.06.14 17:50
0 0

ptero:
не люблю за глючную и нелогичную винду, которой время от времени приходится пользоваться. гугл я не люблю еще больше, но смарт у меня на андроиде. но по удобству сделать звонок (а особенно, сбросить до включения автоответчика) или фото старый смарт на винмобайле лучше, ибо для всего этого есть кнопки. а вообще, я в последние годы затрудняюсь что-то техническое любить. все глючат, все факапятся, все развиваются к худшему. больше ненужных фич, больше ресурсов и т.д. все, кто производил что-то хорошее, продаются худшим, которые не перенимают их качество (пример - винты от самсунга и хитачи). или стараются перенять от них все худшее. (пример - файрфокс vs. хром). хоть вешайся или становись отшельником. но без инета жизнь тоже не мила.


Это старость.
04.06.14 18:33
0 0

не люблю майкрософт, но хочется верить, что у них получится лучше, чем у гомосексуального переводчика гугла. ибо хуже сделать, наверно, нельзя.
04.06.14 16:00
0 0

ptero : не знаю, за что вы не любите майкрософт, но как бы он не оказался меньшим из зол.
04.06.14 16:08
0 0

Кстати, распознование речи меня сейчас чаще радует, чем огорчает. У меня стандартный японско-локализированный яблокофон, и он понимает даже мой японский (чем выгодно отличается от многих двуногих братьев по разуму) и дает вразумительные ответы.



(Правда, за что они систему назвали Сири (по-японски - жопа) и не переименовали ее в японском варианте, я не знаю. Ну, наверное, не смущает...)
04.06.14 14:01
0 0

Согласен, английский стоит учить 😉 Впрочем, я не проверял качество, например, китайско-японского перевода. Ну и опять же, зависит от типа использования: если просто, чтобы поржать - это одно. Если ты знаешь, что пишешь по делу, и что переводить будет машина - то можно и ограничить себя в идиоматике и постараться изъясняться понятно.
04.06.14 12:18
0 0

igori-san:
Согласен, английский стоит учить Впрочем, я не проверял качество, например, китайско-японского перевода. Ну и опять же, зависит от типа использования: если просто, чтобы поржать - это одно. Если ты знаешь, что пишешь по делу, и что переводить будет машина - то можно и ограничить себя в идиоматике и постараться изъясняться понятно.


Согласен. Вот выше товарищ из Бинга правильно сказал, если нельзя объять необъятное, то стоит выделить важную нишу и сделать в ней конфетку. Бизнес-переписка как раз такой нишей и является, а если учесть что МС Офис нацелен на ту же аудиторию, то Майкрософту сам Бог велел уметь переводить деловую лексику лучше всех.
04.06.14 13:52
0 0

Не согласен насчёт распознавания. Распознают голос сейчас офигенно -- я и не ожидал такого прогресса на самом деле.







А вот переводчики конечно лажают, это бесспорно. Так что лажающий транслятор и правда мало кому нужен.


04.06.14 11:46
0 0

LazyLoneLion: А вот переводчики конечно лажают, это бесспорно. Так что лажающий транслятор и правда мало кому нужен. LazyLoneLion( 04.06.14 11:46 )

Многие американские коллеги утверждают, что понять текст, переведенный электронным переводчиком легче, чем английский написанный тем же китайцем или японцем. Т.е. они просят присылать письма на родном языке, во избежание недоразумений. Зная, как пишут некоторые мои японские коллеги, мне тоже кажется, что лучше машинный перевод... Да и вежлевее получается 😉
04.06.14 11:53
0 0

Давайте всё-таки проясним ряд пунктов:

1. В случае перевод Скайп-разговора перевод в первую очередь заточен под перевод "разговорной лексики", а не любого текста. Это позволяет в достаточной степени ограничить контекст для проведения семантического анализа.

2. В основе данного решения машинного перевода лежит "глубокая нейронная сеть" (точнее -- несколько таких сетей, для разных подзадач), задача которой и основана на том, чтобы произвести адекватное распознавание аудиосигнала, искользую при необходимости коррекцию на основе данных семантического анализа. Опять таки ограничение перевода разговорной лексикой позволяет ограничить домены лексики и морфологии вполне определенным контекстом.

3. В отличие от классического машинного перевода, где после разбора фразы на исходном языке начинается перевод отдельных лексем на другой язык и потом синтез фразы с учётом грамматики, в данном решении упор сделан на перевод именно частых разговорных фраз, с акцентом либо на бытовую лексику, либо на деловые переговоры.

Гугл тоже идёт в том же направлении, и мне сложно сравнимать качество его перевода, но важно понять, что качество перевода будет прямо пропорционально тому, как часто то или иное выражение встречается в сети в документах с параллельным переводом (например в статьях вики на разных языках). Чем фраза более специфическая и редкая, тем менее точным будет её машинный перевод.

Теперь по поводу немецкого языка. В немецком языке действительно есть много сложносоставных слов (Composita) и в речи возможно спонтанное образование нового слова. Однако этот феномен есть и во многих других языках (например финском), и в несколько изменённом виде и в европейских языках -- например употребление нескольких существительных подряд в английском (screen saver, keyboard layout, browser window). В немецком за счёт того, что слово пишется вместе его сложнее разбить, но даже современные средства проверки орфографии это умеют делать, не говоря уже о системах машинного перевода.

Перевод представленный на демо вполне адекватный. Конечно, это подобранные фразы, но фразы вполне естественные для делового разговора по Скайпу (где и предлагается услуга этого переводчика). Конечно, стихи Блока или хокку вряд ли будет адекватно переведено -- для этого нужно понять смысл фразы, а это пока еще не доступно искусственному интеллекту. Но для деловой беседы "для бедных" (когда нет денег или времени на человеческого переводчика) -- это вполне приятная фича, которая как раз и оптимизирована под данную нишу услуг.

По требованию юристов компании я обязан в публичных обсуждениях добавлять, что я работаю на Майкрософт (подразделение Bing), однако никак не связан с разработкой данной функции, и все вышесказанное -- моё частное мнение.
























04.06.14 09:43
0 0

Alaudo: Но для деловой беседы "для бедных" (когда нет денег или времени на человеческого переводчика) -- это вполне приятная фича, которая как раз и оптимизирована под данную нишу услуг.

:)

- Так Вы согласны подписать контракт?

- Да, наверное, нет.



- So, do you agree to sign a contract?

- Yes, maybe, no.










04.06.14 09:56
0 0

Alaudo : важно не забывать, что у в дополнение перечисленным вами механизмам, у гугла огромнейшая, прямо монструозная база двуязычных текстов. она накоплена по многим источникам и покрывает практически все пары основных языков. Благодаря этой базе качество перевода заметно выросло.

Вы не знаете, использует ли Майкрософт сейчас, или планирует использовать в будущем подобное решение?
04.06.14 10:06
0 0

Alaudo: В немецком языке действительно есть много сложносоставных слов (Composita) и в речи возможно спонтанное образование нового слова. Однако этот феномен есть и во многих других языках (например финском), и в несколько изменённом виде и в европейских языках

Термин, который Вы ищете, называется "агглютинация". 😄
04.06.14 13:36
0 0

Гугл транслейт до сих пор помогает только тогда, когда перевожу с непонятного мне языка, а это все, кроме английского и немецкого. Тогда помогает понять хоть что-то. Но всё равно часто перевдо остается на уровне бреда сумашедшего. А если это еще и произносить кривым синтезатором речи - ужость 😖
04.06.14 09:28
0 0

Все эти системы голосового ввода заточены под носителей языка. Если вы китаец, система поймет ваш китайский (пекинский или шанхайский) очень хорошо, если вы изучали китайский на курсах в питере - даже не пытайтесь.

Не буду повторять, что то же самое правило распространяется на все языки. И понятно, что разработка ведется в первую очередь для английского. Потом испанский, французский, немецкий, японский, китайский. До русского очередь дойдет после нидерландского (чисто из маркетинговых соображений). Так о чем спор? О том, что система плохо воспринимает рашен-инглиш, или плохо воспринимает российский-русский? О первом спорить глупо, о втором бессмысленно.
04.06.14 08:55
0 0

perepelkin:
Все эти системы голосового ввода заточены под носителей языка. Если вы китаец, система поймет ваш китайский (пекинский или шанхайский) очень хорошо, если вы изучали китайский на курсах в питере - даже не пытайтесь.

Не буду повторять, что то же самое правило распространяется на все языки. И понятно, что разработка ведется в первую очередь для английского. Потом испанский, французский, немецкий, японский, китайский. До русского очередь дойдет после нидерландского (чисто из маркетинговых соображений). Так о чем спор? О том, что система плохо воспринимает рашен-инглиш, или плохо воспринимает российский-русский? О первом спорить глупо, о втором бессмысленно.


Вообще не о том...
04.06.14 09:06
0 0

примерно вот так: картинка
04.06.14 08:06
0 0

Amigoss:
примерно вот так: картинка


Во-во 😉
04.06.14 08:08
0 0

Danmag: Пока не будет семантического анализа текста, любой машинный перевод будет никудышний.

+1005000
Юрий П: Ну дык, первый пароход тоже поначалу ничего кроме угля не возил.

+ over 9000
Amigoss: примерно вот так: картинка

....ответить не в состоянии ибо рыдаю и валяюсь пацталом 😄))))

Лучший способ накопить ошибки: распознавание речи + машинный перевод. И там и там качество пока дальше "побаловаться" не вышло и не выйдет в обозримом будущем. Что касается распознавания речи, то помню читал статью, что уже лет 10 как лучший результат остается около 92-94% и перспектив дальнейшего улучшения специалисты не видят.
04.06.14 07:57
0 0

Ну дык, первый пароход тоже поначалу ничего кроме угля не возил.
04.06.14 07:43
0 0

Можно глянуть видео, как это работает. Сама демонстрация где-то с 1:15



Вся фишка именно про перевод в режиме реального времени, при разговоре в Skype.
04.06.14 06:55
0 0

XineF: Можно глянуть видео как это работает.

Хм.. любопытно. Надо будет пробовать. А вдруг... ) Вроде, там что-то говорят про семантику. Остается вопрос: Когда оно выйдет и будет ли русский язык?
04.06.14 07:11
0 0

XineF: Можно глянуть видео, как это работает. Сама демонстрация где-то с 1:15

Глянул. Обычная демонстрация. Я тоже могу так подобрать фразы, чтобы их автоматический переводчик терпимо переводил. И что? А уж по поводу немецкого - это вообще ржачка, немецкий автоматическому переводу из-за их манеры склеивать слова вообще почти не поддается 😉



XineF: Вся фишка именно про перевод в режиме реального времени, при разговоре в Skype.

Так у Google это тоже фактически в режиме реального времени работает, наверняка можно такой режим сделать (сейчас просто два раза надо кнопку нажимать). Только смысл-то какой? Качество перевода все равно неудовлетворительное.
04.06.14 07:21
0 0

Пока не будет семантического анализа текста, любой машинный перевод будет никудышний.

ABBYY, вроде, начал движение в этом направлении со своим Compreno .
04.06.14 06:53
0 0

Danmag: Пока не будет семантического анализа текста, любой машинный перевод будет никудышний.

Именно.
04.06.14 07:18
0 0

Danmag:
Пока не будет семантического анализа текста, любой машинный перевод будет никудышний.

ABBYY, вроде, начал движение в этом направлении со своим Compreno .


Семантический анализ был уже в 80х, в лаборатории машинного перевода в ИППИ и в Институте Востоковедения. Просто не очень совершенный 😉

Но прогресс все-таки есть: например, в коне 90х HP Laser Jet переводился как "лазерный самолет лошадинной силы". А сейчас так уже ни один переводчик не лажается 😉 Хотя и понять, что он там наперевел, бывает трудно.
04.06.14 11:38
0 0

Danmag: Пока не будет семантического анализа текста, любой машинный перевод будет никудышний. ABBYY, вроде, начал движение в этом направлении со своим Compreno.

А до этого с семантическим анализом текста танцевала компания Stocona. Выпустили свой поисковик "Stocona Search", сейчас это проект AskNet, ru.wikipedia.org , но что-то особого успеха не видно.

А так: alternathistory.org.ua
06.06.14 10:13
0 0

Алекс, извини, не удержался, но ты гонишь. Где это Google Translator умеет это делать? Да еще лет 5 или больше. А то мужики-то не знают. Еще очень полезно не только короткие заметочки читать, но и оригиналы смотреть..blogs.technet.com
04.06.14 06:19
0 0

fmsz: Где это Google Translator умеет это делать? Да еще лет 5 или больше. А то мужики-то не знают.

В мобильной версии GT нажимаешь на микрофон. Произносишь фразу. Он ее переводит. Нажимаешь на динамик - он ее воспроизводит, причем, как правило, голосом носителя языка.

А мужикам очень полезно матчасть изучить, а то так и помрут дураками.
04.06.14 06:47
0 0

fmsz: но и оригиналы смотреть

И что мне такого интересного расскажет оригинал? Мне рассказы не интересны. Мне интересно, как это будет работать. А работать это будет конкретно херово, что очевидно.
04.06.14 06:52
0 0
Теги
Сортировать по алфавиту или записям
BLM 20
Calella 143
exler.ru 270
авто 440
видео 3975
вино 359
еда 496
ЕС 60
игры 114
ИИ 28
кино 1579
попы 189
СМИ 2747
софт 930
США 125
шоу 6