Варианты сегментации в САТ Thread poster: DZiW (X)
| DZiW (X) Ukraine English to Russian + ...
Приветствую. Сегодня постоянный клиент прислала ТМ и задание на перевод EN>RU. С текстом ничего особенного, подключение прошло без нюансов, НО сегментация ТМ выполнена по абзацам 2-5 предложений. Я в курсе, что есть различные варианты и цели, но вот какая п�... See more Приветствую. Сегодня постоянный клиент прислала ТМ и задание на перевод EN>RU. С текстом ничего особенного, подключение прошло без нюансов, НО сегментация ТМ выполнена по абзацам 2-5 предложений. Я в курсе, что есть различные варианты и цели, но вот какая польза? Согласен, иногда с вариантом в контексте легче сориентироваться, но как-то напряжно, ведь кроме заниженного индекса совпадения (fuzzy match) приходится ещё обрезать. Наловчиться вполне реально, но стоит ли оно того... Подскажите, я один такой устаревший с настройками по умолчанию или действительно есть какое-то преимущество? Спс. ▲ Collapse | | | Ячейки из Excel? | May 19, 2015 |
Если сегментация делается по целым ячейкам, это может быть вполне оправданно. Смотря что за текст. А что обрезать приходится?
[Edited at 2015-05-19 11:31 GMT] | | | Andrej Local time: 00:35 Member (2005) German to Russian + ...
Возможно, память экспортирована из Across, в котором, скажем мягко, сегментация идиотская. В том числе и целыми абзацами. | | | DZiW (X) Ukraine English to Russian + ... TOPIC STARTER
Спасибо, Михаил. А ведь вполне может быть, что дело в Excel. Тогда всё не так уж и загадочно. Это обычный .DOCX файл, где "по-абзацный" ТМ заказчика выдаёт довольно низкий match именно из-за того, что на одно fuzzy предлагается совпадение с пачкой предложений (исходный абзац ил�... See more Спасибо, Михаил. А ведь вполне может быть, что дело в Excel. Тогда всё не так уж и загадочно. Это обычный .DOCX файл, где "по-абзацный" ТМ заказчика выдаёт довольно низкий match именно из-за того, что на одно fuzzy предлагается совпадение с пачкой предложений (исходный абзац или ячейка). Вот и приходится либо копировать нужную часть, либо обрезать лишнее даже у 100% match с нагрузочными предложениями, что превращается где-то в 52% match. Суть в том, что такая нетрадиционная, в смысле - альтернативная разбивка на сегменты мне не особо помогает в Computer-Aided/Assisted Translation, а должно бы... Ладно, раз дело ясное, что дело тёмное, то надо бы как-то пересегментировать и/или заново сопоставить/выровнять ТМ почти на 5,5МБ. Коллеги, есть предложения пока я не привык к абзацам?) Андрей, а вы не подскажете, если я импортирую в бесплатный Across, то будет легче или fuzzy match останется "блочный"? Благодарю.
[Edited at 2015-05-19 12:06 GMT] ▲ Collapse | |
|
|
Если я правильно Вас понял, сегментация по абзацам -- в ТМ. Следовательно, нужно настроить сегментацию и рабочего документа тоже по абзацам. Если наоборот, то, соответственно, наоборот. | | | boostrer United States Local time: 17:35 Member (2007) English to Russian + ...
Либо ТМ сделана из таблицы, либо образовалась при переводе сайта. Если пользуетесь МемоКу, то сочетания из 2-3 предложений не проблема. Если абзацы больше, то да, сложно. С другой стороны, чужая ТМ помогает мало и редко, так что все равно проблем нет - и зачем стулья ломать? | | | DZiW (X) Ukraine English to Russian + ... TOPIC STARTER одно из условий заказа | May 19, 2015 |
сохранить лексику и стилистику автора ТМ. То есть, скорее всего это продолжение перевода, а не работа с чистого листа. Я глянул текст, оценил примеры перевода в ТМ и согласился на условия, но не ожидал подвоха с сегментацией. В принципе, в такой "поблочной" сегментации ... See more сохранить лексику и стилистику автора ТМ. То есть, скорее всего это продолжение перевода, а не работа с чистого листа. Я глянул текст, оценил примеры перевода в ТМ и согласился на условия, но не ожидал подвоха с сегментацией. В принципе, в такой "поблочной" сегментации тоже есть свой некий шарм - не такой сильный отрыв от кон/текста, но никакущий match пока только усложняет процесс сверх ожидаемого - иногда в TU более пяти предложений. Работа не срочная, так что для начала распечатаю пару страниц для образца и параллельно гляну варианты стандартизации для более построчной сегментации. Так смотри - и заказчик к тому времени что-то рациональное подскажет. Век живи, век учись) ▲ Collapse | | |
DZiW wrote: заново сопоставить/выровнять ТМ Так как в ТМ одному предложению оригинала не обязательно соответствует ровно одно предложение перевода, придется выравнивать в полуавтоматическом режиме: проверять результаты машинного выравнивания и исправлять ошибки. То есть это мало чем отличается от обычного выравнивания двух файлов с оригиналом и переводом. Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel, вырежьте столбец с переводом и вставьте в другой файл. У вас останется оригинал в одном файле, а перевод в другом. Скормите эти два файла Studio/WinAlign/ABBY Aligner/вашей любимой программе и надейтесь, что ошибок выравнивания будет не очень много. | |
|
|
DZiW (X) Ukraine English to Russian + ... TOPIC STARTER Ну, более-менее | May 20, 2015 |
Заказчик не смогла уточнить почему такая сегментация ТМ и в какой САТ выполнялась, но согласилась дополнительно оплатить почасовую правку ТМ как за редактуру. Учитывая, что у меня нет скидок за повторы и с меня требуют только в сроки сдать чистовик, то это весьма неплохо) Хотя иногда вот попадаются разорванные тегами предложения, но это уже терпимо. Всем спасибо. | | | Варианты сегментации в САТ | May 20, 2015 |
Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel,...
Дальше можно сделать еще проще: 1) Копируйте первый столбик (target), вставляете в Word и сохраняете 2) Копируйте второй столбик (source), вставляете в Word и сохраняете 3) Затем выравниваете (align или alignment) два файла. Это можно сделать в Trados, MemoQ, ABBY Aligner. (Зависит от того с какой программой вы работаете) 4) Сохраняете выравненный файл в нужном формате и загружаете в TM И будет вам счастье. На все это потребуется не более 10-15 мин. | | | boostrer United States Local time: 17:35 Member (2007) English to Russian + ... Счастья не будет | May 21, 2015 |
[quote]Maxteams wrote: Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel,... На все это потребуется не более 10-15 мин.
Это если в ТМ пара сотен сегментов. Если больше, то править выравнивание вручную - это кошмар и ужас, лучше не связываться. Уйдет несколько часов или дней.
[Edited at 2015-05-21 20:30 GMT] | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Варианты сегментации в САТ No recent translation news about Russian Federation. |
Protemos translation business management system | Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.
More info » |
| TM-Town | Manage your TMs and Terms ... and boost your translation business
Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |