Trados 2014 SP2 - импорт html
Thread poster: Serzhe
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
Dec 20, 2014

Проблема при переводе html страницы (загружается из Интернета, наполнение - текст и статичные картинки).
Trados при импорте (или экспорте) портит исходный код html - это хорошо видно если сравнить оригинальный файл и файл экспорта.
Собственно вопрос - как извлекать из html для перевода собственно текст и не портить код html? Поделитесь опытом.


 
Andriy Bublikov
Andriy Bublikov  Identity Verified
Ukraine
Local time: 17:42
French to Russian
+ ...

Moderator of this forum
А зачем вам это? Dec 20, 2014

Добрый день, Serzhe.

А зачем вам это?

Serzhe wrote:

Проблема при переводе html страницы (загружается из Интернета, наполнение - текст и статичные картинки).
Trados при импорте (или экспорте) портит исходный код html - это хорошо видно если сравнить оригинальный файл и файл экспорта.
Собственно вопрос - как извлекать из html для перевода собственно текст и не портить код html? Поделитесь опытом.



Файлы для перевода вам должен высылать заказчик. Иначе, вы будете постоянно сталкиваться с подобными проблемами и в результате еще и виноватым останетесь.


 
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
TOPIC STARTER
Добрый день, Dec 20, 2014

на данный момент процесс организован так, что мне отправляют веб-ссылку. Далее открываю страницу, сохраняю её и начинается описанное ниже.

Может быть есть способ извлекать из HTML только «полезный» текст?

Если открыть страницу в чем-то типа Notepad++ там видно очень много «мусора» - типа каких-то скриптов и т.д. Скорее всего осталось от той программы, которая собственно и генерировала эту html-ку.


 
Nelli Chernitska
Nelli Chernitska  Identity Verified
Local time: 17:42
German to Russian
+ ...
Контент? Dec 21, 2014

Что конкретно нужно заказчику?
Если просто он хочет ознакомиться с текстом, размещенным на странице, то
достаточно открыть ссылку в ворде и сделать перевод.
Если заказчик занимается локализацией сайта, то и тут требуется текстовый формат,
потому что html-страницу просто так к движку не пристроить, потребуется дополнительное программирование - менять те скрипты, которые вы видите в редакторе.


 
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
TOPIC STARTER
Добрый день, Dec 21, 2014

нужен перевод html-страницы. Крайне желательно сохранять форматирование и его структуру.
Эту страницу никуда потом встраивать не нужно, поэтому всякие там скрипты побоку.
Поскольку страница изначально уже разверстана в html, то и ищу способ импорта в Традос с минимальн�
... See more
нужен перевод html-страницы. Крайне желательно сохранять форматирование и его структуру.
Эту страницу никуда потом встраивать не нужно, поэтому всякие там скрипты побоку.
Поскольку страница изначально уже разверстана в html, то и ищу способ импорта в Традос с минимальными потерями (чтобы прога код не портила).

Разверстать в воде или индизайне - не проблема. Для меня основное - свести верстку к минимуму.

Просмотрев профильные темы, прихожу к выводу, что исходник html все равно придётся самому обрабатывать на уровне кода.
Collapse


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 18:42
Member (2004)
English to Russian
+ ...
Вопрос в другом Dec 21, 2014

Если нужно аккуратно перевести только текст, не задевая коды, то это вообще то не проблема. Важно понимать, что за сохранение форматирования и структуры такой страницы может отвечать та начинка, которая остается "за пределами" той страницы, которая не в свободном доступе (о�... See more
Если нужно аккуратно перевести только текст, не задевая коды, то это вообще то не проблема. Важно понимать, что за сохранение форматирования и структуры такой страницы может отвечать та начинка, которая остается "за пределами" той страницы, которая не в свободном доступе (она на сервере). Это таблица стилей (css), и часто она не одна. А к ней (к ним) привязаны все страницы одного сайта. Прошли времена, когда html просто кодировался в каждой конкретной странице и все.
Что бы Вы не делали только с одной той страничкой, ситуация не предсказуемая, потому что не ясно, что будет с компоновкой страницы, если текста станет больше или меньше и что-то куда-то "полезет" или "вылезет", а это неизбежно.
Для "обработки исходника html" требуется доступ ко всему содержимому сайта (с авторизацией). Но это уже совсем не на тему переводов.
Collapse


 
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
TOPIC STARTER
Спасибо, Dec 22, 2014

чем глубже изучаю вопрос, тем больше убеждаюсь, что конкретно в моём случае html-страницу нужно будет в коде чистить от всего «лишнего», переводить в Традос, а затем создавать новую CSS.

Тут есть один очень положительный момент. Все html-страницы изначально оформляются одинаково по стилям. Может быть получиться привязать к ним (html) одну CSS.

Благодарю всех за участие!


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 18:42
Member (2004)
English to Russian
+ ...
О том и речь Dec 22, 2014

Я и говорю, что одна таблица css отвечает за все страницы. Главное в этом деле обозначиться в плане оплаты за value-added, если, конечно, эта работа Вам под силу. А то можно перестараться с очисткой от всего лишнего.

 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 17:42
English to Russian
+ ...
rainbow Dec 22, 2014

С такими страницами хорошо работает программа Rainbow
Она вытаскивает только текст из хтмл-страниц, этот текст переводится в традосе, и сразу же вставляется обратно. Программа организует просмотр хтмл-страниц в режиме оффлайн одновременно с переводом

Я на этом сайте много раз про нее писал на форуме, с достаточным количеством скриншотов
Можно найти поиском


 
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
TOPIC STARTER
Радуга Dec 22, 2014

так, вот это похоже моё (или очень-очень близко)...

нашёл тему «Перевод веб-страниц в Wordfast». С Радугой более-менее понятно. С Горизонтом у Вас есть подобное объяснение?

Ссылка на пакет программ уже битая - не могли бы Вы её обновить для Горизонта (Радугу уже нашел
... See more
так, вот это похоже моё (или очень-очень близко)...

нашёл тему «Перевод веб-страниц в Wordfast». С Радугой более-менее понятно. С Горизонтом у Вас есть подобное объяснение?

Ссылка на пакет программ уже битая - не могли бы Вы её обновить для Горизонта (Радугу уже нашел но в 5-й версии, возможно 3-я будет получше).

Радуга может формировать документ, например в IDML? И как переведённый в Традосе (можно ли здесь использовать именно его) файл возвращается обратно в «английский» html?

В моём случае даётся только ссылка, далее сохраняю страницу (html + папка).
Основная проблема в том, что при экспорте и последующем импорте (даже если не делать перевод) Традос почему-то удаляет часть кода со страницы. Почему?
Collapse


 
Serzhe
Serzhe
Russian Federation
Local time: 18:42
English to Russian
+ ...
TOPIC STARTER
вот в этой теме Dec 22, 2014

«QuarkXpress и переводчик» у меня не отображаются картинки...

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Trados 2014 SP2 - импорт html


Translation news in Russian Federation





Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »