Приходится часто осуществлять поиск в параллельных текстах. Написал простенькую программку - CompareParallelTexts.
Скриншот
Загрузить для Windows
Если я изобретаю колесо, подскажите аналоги
Руководство:
О программе
Программа CompareParallelTexts предназначена для переводчиков и позволяет сравнивать файлы оригинала и перевода в формате txt.
После запуска пользователю предлагается выбрать файлы оригинала и перевода (порядок на данный момент не имеет значения). Файлы должны быть в формате plain text (txt), иметь кодировку UTF-8 и перенос строк Unix. ОБРАТИТЕ ВНИМАНИЕ: если текст имеет другую кодировку, программа попытается автоматически ее изменить с перезаписью исходного файла. Используйте на входе только временные файлы!
Навигация
Для навигации можно использовать мышь или стрелки на клавиатуре.
Щелкните левой кнопкой мыши (ЛКМ) в нужном месте. Программа найдет ближайший фрагмент текста, по которому можно более-менее достоверно ориентироваться и выделит его. После этого будет произведен поиск соответствующего фрагмента во второй области окна.
Алгоритм работы
Программа ориентируется по словам (фрагменты, разделенные пробелами или разрывами строк), не включающим кириллицу и латиницу (например, числа). Пунктуация и скобки игнорируются. Имеет значение только номер такого ключевого фрагмента. Если большую часть текста составляет кириллица, то слова на латинице также будут считаться ключевыми фрагментами.
Пример:
Рассмотрим такой оригинальный текст:
Компания Ford выпускает модель F-350 с 2006 года.
И перевод:
The Ford company puts the F-350 model into circulation since 2006.
Если нажать ЛКМ внутри слов "Компания" или "Ford" в первом тексте, то программа выделит "Ford" как в первом, так и во втором тексте. Если "Ford" повторяется несколько раз, то во втором тексте программа попытается отыскать "Ford" с учетом его повторов, т.е. выделение пятого по счету "Ford" в первом тексте приведет к выделению также пятого "Ford" во втором тексте. Ключевыми фрагментами также являются "F-350" и 2006.
Ключевые фрагменты также можно искать во втором тексте, однако, будут находиться только "F-350" и "2006", но не "Ford", потому что второй текст на английском.
Поиск по тексту
Как по первому, так и второму тексту можно производить поиск (Control-F3 - искать новое слово или слова, F3 - искать далее по тексту, Shift-F3 - искать назад по тексту).
|
||
Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы | ||