Trados 2014 SP2 - импорт html
Autor de la hebra: Serzhe
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
Dec 20, 2014

Проблема при переводе html страницы (загружается из Интернета, наполнение - текст и статичные картинки).
Trados при импорте (или экспорте) портит исходный код html - это хорошо видно если сравнить оригинальный файл и файл экспорта.
Собственно вопрос - как извлекать из html для перевода собственно текст и не портить код html? Поделитесь опытом.


 
Andriy Bublikov
Andriy Bublikov  Identity Verified
Ucrania
Local time: 18:55
francés al ruso
+ ...

Moderador de este foro
А зачем вам это? Dec 20, 2014

Добрый день, Serzhe.

А зачем вам это?

Serzhe wrote:

Проблема при переводе html страницы (загружается из Интернета, наполнение - текст и статичные картинки).
Trados при импорте (или экспорте) портит исходный код html - это хорошо видно если сравнить оригинальный файл и файл экспорта.
Собственно вопрос - как извлекать из html для перевода собственно текст и не портить код html? Поделитесь опытом.



Файлы для перевода вам должен высылать заказчик. Иначе, вы будете постоянно сталкиваться с подобными проблемами и в результате еще и виноватым останетесь.


 
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
PERSONA QUE INICIÓ LA HEBRA
Добрый день, Dec 20, 2014

на данный момент процесс организован так, что мне отправляют веб-ссылку. Далее открываю страницу, сохраняю её и начинается описанное ниже.

Может быть есть способ извлекать из HTML только «полезный» текст?

Если открыть страницу в чем-то типа Notepad++ там видно очень много «мусора» - типа каких-то скриптов и т.д. Скорее всего осталось от той программы, которая собственно и генерировала эту html-ку.


 
Nelli Chernitska
Nelli Chernitska  Identity Verified
Local time: 18:55
alemán al ruso
+ ...
Контент? Dec 21, 2014

Что конкретно нужно заказчику?
Если просто он хочет ознакомиться с текстом, размещенным на странице, то
достаточно открыть ссылку в ворде и сделать перевод.
Если заказчик занимается локализацией сайта, то и тут требуется текстовый формат,
потому что html-страницу просто так к движку не пристроить, потребуется дополнительное программирование - менять те скрипты, которые вы видите в редакторе.


 
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
PERSONA QUE INICIÓ LA HEBRA
Добрый день, Dec 21, 2014

нужен перевод html-страницы. Крайне желательно сохранять форматирование и его структуру.
Эту страницу никуда потом встраивать не нужно, поэтому всякие там скрипты побоку.
Поскольку страница изначально уже разверстана в html, то и ищу способ импорта в Традос с минимальн�
... See more
нужен перевод html-страницы. Крайне желательно сохранять форматирование и его структуру.
Эту страницу никуда потом встраивать не нужно, поэтому всякие там скрипты побоку.
Поскольку страница изначально уже разверстана в html, то и ищу способ импорта в Традос с минимальными потерями (чтобы прога код не портила).

Разверстать в воде или индизайне - не проблема. Для меня основное - свести верстку к минимуму.

Просмотрев профильные темы, прихожу к выводу, что исходник html все равно придётся самому обрабатывать на уровне кода.
Collapse


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 18:55
Miembro 2004
inglés al ruso
+ ...
Вопрос в другом Dec 21, 2014

Если нужно аккуратно перевести только текст, не задевая коды, то это вообще то не проблема. Важно понимать, что за сохранение форматирования и структуры такой страницы может отвечать та начинка, которая остается "за пределами" той страницы, которая не в свободном доступе (о�... See more
Если нужно аккуратно перевести только текст, не задевая коды, то это вообще то не проблема. Важно понимать, что за сохранение форматирования и структуры такой страницы может отвечать та начинка, которая остается "за пределами" той страницы, которая не в свободном доступе (она на сервере). Это таблица стилей (css), и часто она не одна. А к ней (к ним) привязаны все страницы одного сайта. Прошли времена, когда html просто кодировался в каждой конкретной странице и все.
Что бы Вы не делали только с одной той страничкой, ситуация не предсказуемая, потому что не ясно, что будет с компоновкой страницы, если текста станет больше или меньше и что-то куда-то "полезет" или "вылезет", а это неизбежно.
Для "обработки исходника html" требуется доступ ко всему содержимому сайта (с авторизацией). Но это уже совсем не на тему переводов.
Collapse


 
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
PERSONA QUE INICIÓ LA HEBRA
Спасибо, Dec 22, 2014

чем глубже изучаю вопрос, тем больше убеждаюсь, что конкретно в моём случае html-страницу нужно будет в коде чистить от всего «лишнего», переводить в Традос, а затем создавать новую CSS.

Тут есть один очень положительный момент. Все html-страницы изначально оформляются одинаково по стилям. Может быть получиться привязать к ним (html) одну CSS.

Благодарю всех за участие!


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 18:55
Miembro 2004
inglés al ruso
+ ...
О том и речь Dec 22, 2014

Я и говорю, что одна таблица css отвечает за все страницы. Главное в этом деле обозначиться в плане оплаты за value-added, если, конечно, эта работа Вам под силу. А то можно перестараться с очисткой от всего лишнего.

 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 18:55
inglés al ruso
+ ...
rainbow Dec 22, 2014

С такими страницами хорошо работает программа Rainbow
Она вытаскивает только текст из хтмл-страниц, этот текст переводится в традосе, и сразу же вставляется обратно. Программа организует просмотр хтмл-страниц в режиме оффлайн одновременно с переводом

Я на этом сайте много раз про нее писал на форуме, с достаточным количеством скриншотов
Можно найти поиском


 
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
PERSONA QUE INICIÓ LA HEBRA
Радуга Dec 22, 2014

так, вот это похоже моё (или очень-очень близко)...

нашёл тему «Перевод веб-страниц в Wordfast». С Радугой более-менее понятно. С Горизонтом у Вас есть подобное объяснение?

Ссылка на пакет программ уже битая - не могли бы Вы её обновить для Горизонта (Радугу уже нашел
... See more
так, вот это похоже моё (или очень-очень близко)...

нашёл тему «Перевод веб-страниц в Wordfast». С Радугой более-менее понятно. С Горизонтом у Вас есть подобное объяснение?

Ссылка на пакет программ уже битая - не могли бы Вы её обновить для Горизонта (Радугу уже нашел но в 5-й версии, возможно 3-я будет получше).

Радуга может формировать документ, например в IDML? И как переведённый в Традосе (можно ли здесь использовать именно его) файл возвращается обратно в «английский» html?

В моём случае даётся только ссылка, далее сохраняю страницу (html + папка).
Основная проблема в том, что при экспорте и последующем импорте (даже если не делать перевод) Традос почему-то удаляет часть кода со страницы. Почему?
Collapse


 
Serzhe
Serzhe
Federación Rusa
Local time: 18:55
inglés al ruso
+ ...
PERSONA QUE INICIÓ LA HEBRA
вот в этой теме Dec 22, 2014

«QuarkXpress и переводчик» у меня не отображаются картинки...

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Trados 2014 SP2 - импорт html


Translation news in Federación Rusa





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »