Этан Цукерман - Новые соединения. Цифровые космополиты в коммуникативную эпоху
- Название:Новые соединения. Цифровые космополиты в коммуникативную эпоху
- Автор:
- Жанр:
- Издательство:ЛитагентАд маргинемfae21566-f8a3-102b-99a2-0288a49f2f10
- Год:2015
- Город:Москва
- ISBN:978-5-9113-259-3
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Этан Цукерман - Новые соединения. Цифровые космополиты в коммуникативную эпоху краткое содержание
Этан Цукерман, директор Центра по изучению гражданских медиа при Массачусетском технологическом институте (MIT), интернет активист и блогер, в своей дебютной книге описывает как социальные сети, транспортные хабы и новые информационные технологии, изменяют нашу жизнь. Новый взаимосвязанный мир функционирует не совсем так, как представляют себе технооптимисты и колумнисты специализированных изданий, но тем не менее он уже существует, и научиться жить в нем, адекватно используя интернет и прочие инструменты во благо, а не во вред, – задача, которая стоит сегодня необычайно остро.
Новые соединения. Цифровые космополиты в коммуникативную эпоху - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Найти параллельный корпус совсем непросто, поскольку выполненный профессионалами высококлассный перевод (традиционно) стоит немалых денег. А работоспособность подобных систем обеспечивается их громадными размерами. Составленный Консорциумом лингвистических данных параллельный корпус для перевода между английским и китайским языками включает 200 миллионов слов, что много больше, чем в каждом из этих языков, однако для эффективной работы слова должны быть употреблены в самых разных контекстах. Многие тексты, которые мы могли бы использовать, как, например, переводы романов Стивена Кинга на десятки иностранных языков, остаются для нас недоступны из-за авторских прав. В поисках высококачественных переводных текстов в свободном доступе программисты часто используют правительственные документы: официальные резолюции ООН, переведенные на шесть рабочих языков организации; заседания Европейского парламента, в которых используются документы, переведенные на 23 официальных языка; постановления Канадского правительства, публикующиеся как на английском, так и на французском.
Поскольку процесс статистического машинного перевода – это, по сути, выбор наиболее вероятного перевода из набора примеров, использование таких источников приводит к возникновению забавных побочных эффектов: в машинном переводе мы все немного смахиваем на европейских парламентариев. Действительно, такие системы, как правило, куда лучше справляются с переводом официальных документов, чем с переложением полных сленга и жаргонных словечек мгновенных сообщений.
Так почему же американские и европейские репортеры и «факт-чекеры» не прочли с помощью машинного перевода материал Qilu Evening News, чтобы получить более полное представление о профессионально-техническом училище Ланьсян? Вероятно, отчасти в силу привычки. Долгие годы системы машинного перевода выдавали неудобоваримые, малоосмысленные результаты, и у журналистов развилось стойкое предубеждение против их использования. Однако за последние пять лет качество машинного перевода между китайским и английским резко возросло. Программисты оценивают качество машинного перевода, сравнивая его с работой профессиональных переводчиков. Такое сравнение легло в основу системы оценки качества машинного перевода – Bilingual Evaluation Understudy или BLEU, которая анализирует машинный перевод, подсчитывая количество тех же слов, расставленных в том же порядке, что и в работе профессионального переводчика. Когда специалисты Google решают, что оценка BLEU для новой пары языков (английский/китайский, например) достаточно высока, компания включает пару в набор инструментов Google, доступных бесплатно на translate.google.com. За шесть лет, с 2006 по 2011 год, этот порог преодолели 60 языковых пар.
Машинный перевод материала Qilu Evening News может произвести на журналистов неоднозначное впечатление. Я перевел эту статью с помощью сервиса Google [189]и получил, в частности, следующий результат:
«Школы Директор Бюро Г-н Чжоу не встретиться с нашим корреспондентом. Он только сказал, по телефону:… “Эти отчеты нонсенс измышления. Несколько дней назад, говорящих на китайском языке позвонила женщина под предлогом задавать вопросы о студенческих регистрации она не выявила себя. Мы учим в основном технического обслуживания автотранспорта, ремонт, и некоторые из этих студентов в конечном итоге присоединились к военным, чтобы сохранить ремонт транспортных средств. Он также сказал, что есть украинский профессорско-преподавательского здесь. Это нелепо. Наша школа не имеет зарубежных преподавателей. Мы не лицензированы на привлечение иностранной учит. Кроме того, мы не снижаться, чтобы ответить на вопрос о том, было украинского учителя здесь – она просто никогда не просил”».
Этот текст можно с грехом пополам разобрать, но читать его совсем непросто. Едва ли кто-нибудь сочтет, что это написано носителем английского языка. Цепкий и принципиальный репортер мог найти статью Qilu в переводе и использовать ее в продолжение своей истории. Но чтобы всякий англоговорящий, старающийся следить за китайскими событиями, ежедневно читал Qilu Evening News с помощью машинного перевода – это маловероятно. Кроме того, даже цепкий репортер мог бы не совсем верно понять прочитанную статью.
Когда IBM и Джорджтаунский университет начали программу перевода русских текстов, их цель состояла в том, чтобы создать систему, которая позволит автоматизировать часть работы по переводу статей научных журналов. При этом все понимали, что, прежде чем представлять их американским ученым, эти переводы нужно будет довести до ума вручную. В начале 1970-х годов программа забуксовала, а государственные спонсоры отвернулись от автоматического машинного перевода и сосредоточились на создании инструментов, которые могли бы повысить эффективность труда профессиональных переводчиков; то есть программах типа «запоминаем перевод», в которых сохраняется переработанная переводчиком сложная фраза, чтобы потом он или его коллеги могли к ней вернуться. Целью государственных структур США стало повышение эффективности живых переводчиков, а не совершенствование автоматизированного перевода.
Научная гонка между СССР и США уже не имеет того политического значения, как в 1950-х. Пережив холодную войну, мы вошли в эпоху сложного, многополярного мира, и теперь аудитория международных СМИ в правительстве США – это разведывательные структуры, в частности Центр открытых источников – подразделение ЦРУ, в котором глобальные события пытаются анализировать, читая местные газеты на пуштунском, азербайджанском и многих других языках. Газеты типа Baku Xalq QƏzeti для аналитиков ЦРУ переводят люди. Эти переводы широкой публике… почти доступны. Незасекреченные переведенные материалы, которые в настоящее время включают в себя посты в блогах, Twitter и на других платформах, министерство торговли США предлагает под маркой World News Connection. Переводы, в совокупности составляющие самую международную газету из известных человечеству, доступны подписчикам за 300 долларов в год, плюс четыре доллара за каждую статью из архива. [190]
Неудивительно, что подписчиков у World News Connection не так уж много: во-первых, это дорого, а во-вторых, большинство читателей, даже среди самых страстных поклонников Азербайджана, не станут изучать все материалы всех бакинских газет. Такие переводчики, как Роланд Сун, который перевел статью Qilu Evening News, ценны не только потому, что производят легко усваиваемый текст, но и потому, что действуют как фильтры, выбирая для перевода материалы, которые могут показаться интересными более широкой аудитории.
Роланд Сун и будущее перевода
Интервал:
Закладка: