Проект "Моделино" - изучение иностранных языков с помощью НЛП-моделирования

Субтитры к фильмам

 

Базовая информация о субтитрах

Если вы не в курсе, что такое субтитры и как ими пользоваться, начните с легкого ликбеза:

Для правильного воспроизведения практически любых видеофайлов с субтитрами практически любого формата, инсталлируйте себе на компьютер:

Для просмотра фильмов рекомендуется пользоваться плеерами:

Чтобы субтитры автоматически подгружались к проигрываемому видеофайлу необходимо, чтобы имя файла с субтитрами совпадало с именем видеофайла. Например, для субтитров в текстовом формате:

  • The Matrix (1999).avi
  • The Matrix (1999).srt

или для субтитров в графическом формате:

  • The Matrix (1999).avi
  • The Matrix (1999).idx
  • The Matrix (1999).sub

Для распознанных субтитров (например, формат srt) допускается также такой вариант имени файлов с субтитрами:

  • The Matrix (1999).avi
  • The Matrix (1999).english.srt
  • The Matrix (1999).russian.srt

Существует несколько форматов текстовых (распознанных) субтитров. Я вам рекомендую отдавать предпочтение формату srt, как получившему наиболее широкое распространение и поддерживаемому практически всеми программами для редактирования субтитров и кодеками для отображения субтитров.

Несколько слов о субтитрах в DVD-дисках. В случае с DVD-дисками возможно 2 варианта:

1) субтитры в графическом формате - в виде полупрозрачных картинок, которые при просмотре фильма "накладываются" на изображение, таким образом вы видите и картинку фильма, и субтитры. Такие субтитры легко извлекаются в виде отдельной пары файлов idx/sub с помощью программы VSRip (см. ниже - раздел как извлечь субтитры из DVD-диска).

2) субтитры, встроенные в видеопоток (англ. closed captioning, франц. encodage malentendant). Такие субтитры на обложке DVD-дисков обозначаются двумя буквами "CC" или значком "closed captions logo". Данный формат субтитров встречается в основном в Северной Америке (США, Канада) и для отображения этих субтитров нужно, чтобы DVD-плеер имел специальный декодер. Большинство европейских DVD-плееров этого декодера не имеют. Единственный известный мне компьютерный плеер, который позволяет показывать эти субтитры при проигрывании DVD-дисков, - это Windows Media Player. Такие субтитры извлекаются с помощью программы CCextractor (см. ниже - раздел как извлечь субтитры из DVD-диска).

 

Интернет-базы субтитров

Для поиска субтитров рекомендуется также пользоваться гуглом. При этом в поисковой строке вы вводите точное название фильма и слово "субтитры" на том языке, на котором вы хотите, чтобы были субтитры. В результатах часто выпадают ссылки на указанные выше базы.

Для поиска общей информации о фильмах рекомендуется пользоваться интернет-базой The Internet Movie Database.

 

Вопросы кодировки

Если вы изучаете такие языки, как французский, немецкий, японский, то наверняка вы можете столкнуться с ситуацией, когда прочитать субтитры или невозможно совсем, или же некоторые буквы исковерканы. Как решить эту проблему?

Для начала выясняем, какая кодировка стоит в операционной системе Windows по умолчанию для программ, не поддерживающих юникод. Для этого идем "Start" - "Control Panel" - "Regional and Language Options", вкладка "Advanced", "Language for non-Unicode programs" ("Пуск" - "Панель управления" - "Язык и региональные стандарты", вкладка "Дополнительно", "Язык, соответствующий языку используемых программ, которые не поддерживают Юникод"), скорее всего у вас там стоит русский (если там стоит другой язык и вы ничего не понимаете в кодировках, то лучше выберите русский - вам будет проще понять объяснения ниже). Естественно, если кодировка субтитров и язык, выбранный в этой вкладке, не совпадают, то субтитры будут отображаться с ошибками. Но даже если они совпадают, субтитры иногда могут отображать с ошибками. Чтобы решить эту проблему, прежде всего надо сохранить субтитры в нужной кодировке:

  • для западноевропейских языков (французский, немецкий, испанский) - это кодировка "Западноевропейская (Windows)". Иногда она называется "Windows-1252",
  • для японского языка - это кодировка "Японская (Shift-JIS)",
  • для китайского языка - это кодировки "Китайская упрощенная (GB-18030)" и "Китайская традиционная (Big5)",
  • для русского языка - это кодировка "Кириллица (Windows)". Иногда она называется "Windows-1251".

Хотя кодировки юникод ("Unicode", "Unicode (UTF-8)") и удобны в некоторых случаях, я не рекомендую вам ими пользоваться (особенно если вы новичок в вопросе кодировок) - часть программ для редактирования субтитров с ними не работает, к тому же база субтитров opensubtitles.org их не поддерживает. Тем не менее субтитры, которые выложены в интернет-базах, иногда бывают сохранены в кодировке юникод. И в идеале вам нужно уметь конвертировать субтитры из любого формата и любой кодировки в нужный формат (srt) и нужную кодировку (см. список абзацем выше).

В любом случае прежде чем пробовать смотреть фильм со скаченными субтитрами, вам нужно проверить, в какой кодировке они сохранены. Есть 2 способа это сделать:

1) с использованием файлового менеджера Total Commander. Для этого необходимо навести с помощью клавиатуры курсор Total Commander'а на файл субтитров (или в окне Total Commander'а навести курсор мыши на файл и кликнуть по нему левой кнопкой) и нажать F3 - файл субтитров откроется просмотрщиком файлов Lister. (Примечание: все объяснения ниже относятся к тому случаю, когда кодировка в операционной системе Windows по умолчанию для программ, не поддерживающих юникод, установлена на русский язык - см. выше).

В меню просмотрщика Lister сверху выбираем "Options" и удостоверяемся, что кодировка субтитров - "только текст": напротив "Text only" стоит галочка. В этом случае:

  • для западноевропейских языков вы увидите тайминг субтитров и строчки иностранного текста, где буквы с диакритическими знаками заменены на буквы кириллицы. Вот скриншоты для субтитров на французском языке в формате SubRip (расширение "srt"), SubStation Alpha (расширение "ssa"), MicroDVD (расширение "sub", не путать с субтитрами в графическом формате).
  • для японского и китайского языков вы увидите тайминг субтитров, а вместо текста - непонятный набор символов. Вот скриншоты для субтитров на японском языке в формате SubRip (расширение "srt"), SubStation Alpha (расширение "ssa"), MicroDVD (расширение "sub", не путать с субтитрами в графическом формате).
  • для русского языка вы увидите тайминг субтитров и русский текст. Вот скриншоты для субтитров в формате SubRip (расширение "srt"), SubStation Alpha (расширение "ssa"), MicroDVD (расширение "sub", не путать с субтитрами в графическом формате).

Если кодировка субтитров - "только текст", то можно переходить к просмотру фильма.

Однако может оказаться, что кодировка субтитров одна из юникодовских, в этом случае в просмотрщике Lister галочка в разделе меню "Options" будет стоять напротив "Unicode" или "UTF-8". Если это так, то субтитры следует пересохранить в формате "только текст" с помощью хорошего текстового редактора (см. ниже).

2) с помощью хорошего текстового редактора (Microsoft Word, OpenOffice).

В случае с редактором Microsoft Word обычно проблем не возникает - при открытии файла чаще всего Word сам предложит вам ту кодировку, в которой сохранен файл субтитров. Например, для субтитров на русском языке скорее всего это будет кодировка "Кириллица (Windows)", для субтитров на немецком или, например, французском - скорее всего "Западноевропейская (Windows)", для японского языка - "Японская (Shift-JIS)" или "Юникод (UTF-8)" и т.д. Итак, если при открытии файла Word предлагает вам "нужную" кодировку (см. список рекомендуемых кодировок выше) и после открытия файла текст изображается без ошибок (для западноевропейских языков все диакритические знаки отображаются верно, для иероглифических языков вы видите правильный текст, а для кириллицы - нормальный русский текст), то ничего вам менять в файле субтитров не нужно, кодировка у него правильная, можно переходить к просмотру фильма. Если же при открытии файла Word предлагает вам одну из юникодовских кодировок, то вам надо открыть файл, убедиться, что иностранный текст изображается без ошибок, а после этого выбрать в меню "Файл" - "Сохранить как..." - "текстовый формат txt" и выбрать "нужную" кодировку вручную (см. список рекомендуемых кодировок выше). Т.к. Word при сохранении файла даст ему расширение "txt", вам нужно потом вручную поменять расширение файла на то же, что и соответствовало формату исходного файла ("srt" для формата SubRip, "ssa" - для формата SubStation Alpha, "sub" - для формата MicroDVD). Поменять расширение файла можно легко с помощью файлового менеджера Total Commander. Как менять расширение файлов в проводнике Windows, я не знаю. (Примечание: иногда Word глючит - при открытии файла предлагает вам неправильную кодировку - текст изображается с ошибками, или предлагает правильную кодировку, но открывает файл все равно с ошибками. В этом случае руководствуйтесь окном предварительного просмотра - повыбирайте различные кодировки, пока не найдете ту, при которой иностранный текст в окне предварительного просмотра изображается без ошибок).

В случае же с редактором OpenOffice вам необходимо вручную выбрать кодировку и язык субтитров. Если при открытии файла вы выбираете "нужную" кодировку (см. список рекомендуемых кодировок выше) и после открытия файла текст изображается без ошибок, то ничего менять не надо - файл субтитров готов к употреблению, можно переходить к просмотру фильма. Если же при открытия файла вам приходится выбирать одну из юникодовских кодировок, чтобы файл открылся нормально (иностранный текст отображался без ошибок), то после открытия файла, его нужно пересохранить - в меню выбираем "Файл" - "Сохранить как..." - "кодированный текст txt" и вручную задаем "нужную" кодировку (см. список рекомендуемых кодировок выше). Затем нужно также поменять расширение файла субтитров (см. предыдущий абзац).

***

Итак мы получили файл субтитров в нужной кодировке. Но формат субтитров может быть разный - SubRip (расширение "srt"), SubStation Alpha (расширение "ssa"), MicroDVD (расширение "sub"). Я предпочитаю однообразие и пересохраняю субтитры в формате SubRip, как получившем наибольшее распространение на сегодняшний день. Пересохранить субтитры в другом формате можно с помощью программы Subtitle Workshop.

Итак приступаем к просмотру - копируем файл субтитров в папку с фильмом (при этом имя обоих файлов должно совпадать - см. выше раздел "Базовая информация о субтитрах"). Есть 2 варианта сделать так, чтобы иностранный текст отображался в субтитрах без ошибок:

1) Предпочтительный вариант. В кодеке Vobsub (он входит в состав сборника кодеков Combined Community Codec Pack, этот сборник кодеков должен быть инсталлирован на вашем компьютере) вам нужно выбрать кодировку языка субтитров. Для этого запускаем фильм, при этом внизу справа (рядом с часами Windows) появляется зеленая стрелочка. Нажимаем на нее правой кнопкой мыши и выбираем "DirectVobSub (auto-loading version)". Нажимаем на кнопку с изображением используемого шрифта под надписью "Text Settings". В появившемся окне нажимаем на такую же кнопку под надписью "Font". Внизу справа выбираем нужный регион: Western - для западноевропейских языков, Cyrillic - для русского, Japanese - для японского. В случае с японским убедитесь, что выбранный шрифт ("Font") включает японские иероглифы и кану, - в окошке "Пример" ("Sample") должны отображаться буквы "А", написанные хираганой и катаканой. Жмем "Ок".

2) Альтернативный вариант. Если вы знаете, что все ваши субтитры, например, на французском языке сохранены в кодировке "Западноевропейская (Windows)", то вы можете установить французский язык в качестве языка по умолчанию для программ, не поддерживающих юникод (Start" - "Control Panel" - "Regional and Language Options", вкладка "Advanced"). В этом случае вам не нужно менять кодировку в кодеке Vobsubпосле запуска фильма.

 

Как синхронизировать субтитры в текстовом формате (srt, ssa) с фильмом в формате avi?

Владельцы сайта opensubtitles.org написали замечательную программу (SubDownloader), которая автоматически скачивает с упомянутого сайта субтитры, которые подходят именно вашему видеофайлу с фильмом. При этом должно выполняться несколько условий:

  • субтитры к этому фильму должны быть в базе этого сайта;
  • хэш вашего видеофайла должен совпадать с хешем видеофайла человека, который загрузил субтитры на базу. Иными словами, ваш рип видеофайла должен быть абсолютно идентичен рипу видеофайла человека, загрузившего субтитры на базу.

Итак в разделе download проекта программы выбираем "Windows Installer 1.2.9", скачиваем программу и инсталлируем ее себе на компьютер.

Как работать с программой SubDownloader? Предположим вы скачали из какой-нибудь файлообменной сети фильм "Back to the Future". Размер фильма - 1,291,964,416 байт. Удостоверяемся, что название файла точно соответствует названию фильма в соответствии с базой The Internet Movie Database. Желательно также, чтобы название включало год фильма. Например, назовем файл таким образом: "Back to the Future (1985).avi". Запускаем программу SubDownloader. Слева выбираем вкладку "Search", справа жмем на кнопку - "Add video file". Выбираем ваш видеофайл. Программа автоматически начинает поиск в своей базе субтитров, основываясь на хеше файла, и выводит вам список тех субтитров, которые подходят вашему фильму. Вы ставите галочки напротив тех субтитров, которые хотите скачать (например, английские и русские), и нажимаете кнопку справа "Download subtitles". Программа сама скачает субтитры и даже переименует их в соответствии с вашим названием видеофайла. В нашем случае это будут:

  • Back to the Future (1985).en.srt
  • Back to the Future (1985).ru.srt

Что делать, если программа SubDownloader не нашла субтитров на нужном вам языке? Что ж, ищем субтитры вручную по названию фильма. Начать поиск имеет смысл с той же базы opensubtitles.org, т.к. субтитры к вашему фильму на ней могут быть, но программа SubDownloader не нашла их, т.к. рип видеофайла человека, загрузившего субтитры на базу, не идентичен вашему рипу видеофайла.

Итак, вы нашли субтитры на нужном вам языке к вашему фильму, но они не синхронизированы с вашим видеофайлом. Здесь возможны различные варианты:

1) У вас есть синхронизированные с вашим фильмом субтитры. Используя любой текстовый редактор вы открывайте эти синхронизированные субтитры и выписываете тайминг первой и последней реплики (только время, когда начинаются эти реплики). После этого вы запускаете программу Subtitle Workshop (см. ниже раздел "Программы для редактирования субтитров"). Выбираете в меню "Edit" - "Timings" - "Adjust" - "Adjust subtitles...". Вводите выписанный вами тайминг для первой реплики в клеточку "First spoken line", для последней реплики - в клеточку "Last spoken line". Нажимаете кнопку "Adjust!". Программа сама сместит тайминг субтитров, при необходимости растянув или сжав его. Все! Можно смотреть фильм!

2) У вас нет синхронизированных с вашим фильмом субтитров. Тогда мы открываем фильм в плеере (например, в Media Player Classic) и начинаем его смотреть, внимательно следя за счетчиком времени. Как только прозвучала первая реплика нажимаем на паузу и отмечаем время, когда актер начал ее произносить. Идем в конец фильма и точно так же отмечаем время, когда начинается последняя реплика. Дальше поступаем так же, как написано выше, в варианте №1.

При синхронизации по способам 1 и 2 проверьте, что собой представляют первый и последний субтитр в том файле субтитров, которые вы синхронизируете. Иногда это бывает название фильма (в начале) или название компании, которая создавала субтитры (в конце). Эти субтитры надо удалить и лишь после этого начинать синхронизировать по первой и последней реплике персонажей фильма.

3) Если ваша версия фильма разбита на 2 файла, а субтитры рассчитаны на один видеофайл, то вот, что мы делаем. Запускаем файл №2 вашего фильма и запоминаем первую произнесенную реплику. В любом текстовом редакторе открываем наш файл с субтитрами, находим эту реплику, чисто физически разбиваем этот файл на два и оба файла сохраняем. Второй файл должен начинаться с найденной вами реплики. После этого поступаем так же, как написано в пункте 2.

4) Если субтитры разбиты на 2 файла, а ваша версия фильма - в виде одного файла, то вот, что можно сделать. Переименовываем оба файла субтитров следующим образом: "The Matrix (1999).english_CD1.srt" "The Matrix (1999).english_CD2.srt" (файл с фильмом - "The Matrix (1999).avi"). После этого синхронизируем с видеофайлом сначала первый файл субтитров, затем второй (см. пункт 2 выше). После этого запускаем программу Subtitle Workshop и в меню выбираем: "Tools" - "Join subtitles...", нажимаем на кнопку "Add", добавляем первый файл субтитров, затем второй, и нажимаем на кнопку "Join!".

Каким бы из вышеуказанных способов вы не синхронизировали субтитры, качество новых субтитров нужно обязательно проверить. Дело в том, что в разные релизы одного и того же фильма некоторые сцены могли входить, а некоторые - нет. Поэтому проверять качество синхронизированных субтитров нужно не только по первой и последней реплике, но и в других местах (точки четыре-пять на фильм). Проверять готовые субтитры нужно в плеерах Media Player Classic или VLC media player (программой Subtitle Workshop для этих целей лучше не пользоваться - она часто не синхронно показывает видео и субтитры).

Если вы вручную синхронизировали субтитры с какой-либо версией видеофайла, обязательно загрузите эти субтитры на базу opensubtitles.org!!!

Как это сделать? Загружаем программу SubDownloader. Слева выбираем вкладку "Upload" (желательно при этом залогиниться, если перед этим вы завели себе аккаунт на сайте opensubtitles.org). Нажимаем на кнопку "Browse avi...", выбираем видеофайл с фильмом, нажимаем на кнопку "Browse sub...", выбираем файл субтитров (естественно имя файла фильма и файла субтитров должно совпадать). Нажимаем кнопку "Confirm" - программа проверяет, нет ли уже ваших субтитров в базе. Если субтитров нет, то дальше выбираем язык субтитров и идентификационный номер фильма в соответствии с базой The Internet Movie Database. И наконец нажимаем кнопку "Upload" и терпеливо ждем, пока программа загрузит наши субтитры себе в базу. После этого программа предложит открыть web-страницу с ссылкой на загруженные вами субтитры.

Альтернативный вариант описания, как синхронизировать субтитры, см. в разделе "помощь" сайта subtitry.ru.

 

Как синхронизировать субтитры в графическом формате (idx/sub) с фильмом в формате avi?

Для работы с субтитрами в формате vobsub (пара файлов idx/sub) вам потребуются:

  1. Любой простейший текстовый редактор, например Блокнот (входит в состав «стандартных программ» операционной системы Windows).
  2. Программа Vobsub cutter. Она входит в состав кодека Vobsub. Внимание: программа Vobsub cutter не входит в состав сборника кодеков Combined Community Codec Pack.
  3. Программа Subresync. Эта программа также входит в состав кодека Vobsub.

Итак, программа Subresync нужна лишь для того, чтобы проверить, что за субтитры нам попали. В ней нажимаем на кнопку «Open...», открываем файл idx, наводим на первую-вторую строчку, смотрим текст, удостоверяемся, что субтитры к нашему фильму.

Рассмотрим следующий случай. У нас есть рип некоего сериала – файлы в формате avi (каждая серия – 1 файл), а также субтитры в формате vobsub, извлеченные из DVD-релиза этого сериала (на каждом диске было по 2 серии). Задача – разбить пару файлов idx/sub субтитров (включающую субтитры к двум сериям) на 2 пары файлов – каждая пара к своей серии – и сделать так, чтобы субтитры были идеально синхронизированы с обоими файлами avi.

Во-первых, переименовываем оба файла idx и sub – даем им то же имя, что и имя avi файла с первой серией. Получаем три файла с одинаковым именем, но разными расширениями, например:

  • Last Christmas (2004) 01.avi
  • Last Christmas (2004) 01.idx
  • Last Christmas (2004) 01.sub

Начинаем смотреть сериал (настоятельно рекомендуется для этого использовать Media Player Classic).

Первый вариант возможной проблемы – может оказаться так, что субтитры отстают или обгоняют звук. Что делать? В любом случае отмечаем разницу во времени. Например, субтитр №1 появился в 0:00:35,000, а соответствующая фраза начала звучать лишь в 0:00:37,500. Соответственно субтитры появляются на 2,500 секунды раньше звука. Точный тайминг, когда появляются субтитры, можно посмотреть в файле idx. Для этого открываем этот файл в Блокноте и находим строчки вроде этих:

  • # alt: Japanese
  • # Vob/Cell ID: 1, 1 (PTS: 0)
  • timestamp: 00:00:35:000, filepos: 000000000
  • timestamp: 00:01:19:145, filepos: 000000800
  • timestamp: 00:01:25:318, filepos: 000001000

Видно, что первый субтитр появляется в 0:00:35,000.

Если с субтитрами все просто, то вот определить точный тайминг, когда начинает звучать первая фраза не всегда просто. Здесь возможны варианты.

  1. Если у вас уже есть точно синхронизированные с вашим avi файлом субтитры, то тайминг можно взять оттуда. Открываем в Блокноте файл субтитров в формате srt и смотрим тайминг нужной нам фразы (или ее перевода).
  2. Если ваши avi файлы – это хардсаб, то тайминг субтитров можно оттуда извлечь с помощью программ: SubRip, AviSubDetector, VideoSubFinder (тема на сайте fansubs.ru, посвященная программе), SRT Make.
  3. При определенной сноровке разницу между появлением субтитров и звуком можно определять на глаз/слух.

Итак, мы определили, что субтитры у нас появляются на 2,500 секунды раньше звука. Открываем в Блокноте файл idx и сразу после строчки:

# Vob/Cell ID: 1, 1 (PTS: 0)

вставляем следующую строчку:

delay: 00:00:02:500

В случае если субтитры наоборот – появляются позже звука, вставляем следующую строчку:

delay: -00:00:02:500

Будем называть такие строчки «строчками задержки субтитров».

Бывают такие ситуации, что разница между субтитрами и звуком появляется не с начала фильма. Такое бывает, если например в TV-рипе сериала была рекламная вставка, а в DVD-релизе она отсутствует. В этом случае у нас, например в течение первых 15 минут сериала субтитры совпадают со звуком, а потом звук начинает отставать от субтитров (субтитры появляются раньше звука). В этом случае мы находим в фильме последний точно совпадающий со звуком субтитр (следующий субтитр уже не совпадает со звуком), открываем в Блокноте файл idx и вставляем строчку задержки субтитров ПОСЛЕ последнего точно совпадающего субтитра (соответственно ПЕРЕД первым несовпадающим субтитром).

Бывает также следующая ситуация. В начале фильма субтитры совпадали со звуком, но постепенно они начинают все больше и больше отставать от звука (или обгонять его). Такое случается, когда число кадров в TV-рипе не совпадает с числом кадров в DVD-релизе.

Что делать в этом случае? Чтобы исправить подобную десинхронизацию субтитров вам нужно точно знать разницу в секундах между субтитрами и звуком в КОНЦЕ фильма (на сколько секунд отстают/обгоняют субтитры). После этого считаем длительность фильма в секундах (длительность фильма можно посмотреть в плеере Media Player Classic). Например, для фильма длительностью 57 минут 49 секунд это число составляет 59*60 + 47 = 3469 секунд. Затем открываем программу Vobsub cutter. В ней нажимаем на кнопку «Open…», открываем файл idx. Ставим галочку напротив «Modify FPS». В окошке «Org» пишем длительность фильма в секундах, а в окошке «New» пишем следующее число:

  • длительность фильма в секундах ПЛЮС разница в секундах между субтитрами и звуком – в случае, если субтитры появлялись ПОЗЖЕ звука,
  • длительность фильма в секундах МИНУС разница в секундах между субтитрами и звуком – в случае, если субтитры появлялись РАНЬШЕ звука.

Жмем кнопку «Save as…», выбираем желаемое имя для будущей пары файлов idx и sub.

Программа Vobsub cutter пригодится вам еще для одного случая – она пересчитывает заново тайминг, который вы изменяли, вставляя строчки задержки субтитров. Для этого достаточно открыть отредактированные вами субтитры и заново сохранить под другими именем – все строчки задержки субтитров исчезнут, а цифры тайминга в файле idx будут изменены (пересчитаны).

Итак, все вышеперечисленное мы выполняли для первой серии, но пара файлов idx и sub содержат субтитры для двух серий. Нам надо разбить эти файлы на первую и вторую серию (получить 2 новые пары idx и sub, которые кстати будут приблизительно в 2 раза меньше своих предшественников по объему).

Во-первых, создаем резервную копию разбиваемой пары файлов idx и sub. Затем открываем файл idx в программе Vobsub cutter. Чтобы получить пару файлов idx и sub:

  • для ПЕРВОЙ серии в окошке «Start» оставляем 0:00:00:000, а в окошке «End» пишем длительность первой серии, например, 0:57:49:000,
  • для ВТОРОЙ серии в окошке «Start» вставляем длительность первой серии, например, 0:57:49:000, а в окошке «End» оставляем общую длительность двух серий, например, 1:45:32:000.

При этом возможно появление небольшой десинхронизации во второй серии, но она легко исправляется вставкой строчки задержки субтитров. После этого пара файлов idx и sub для первой серии считается окончательной, а с парой для второй серии мы начинаем работать так же, как мы работали с первой серией. В любом случае окончательные варианты субтитров тщательно проверяйте в 5-10 точках на каждую серию.

 

Как посмотреть свой DVD-диск со скаченными внешними субтитрами?

Вы купили DVD-диск с иностранным фильмом, а на диске нет нужных вам субтитров. Но зато вам удалось скачать субтитры из одной из интернет-баз. Как подключить их к фильму на DVD-диске? Вы можете найти подробную инструкцию, как это сделать, в разделе "помощь" сайта subtitry.ru. Если субтитры не синхронизированы с фильмом, то сначала их надо синхронизировать (см. вариант №1). Точный тайминг первой и последний строчки можно получить, если извлечь из DVD-диска имеющиеся на нем субтитры и посмотреть тайминг в файле с расширением idx в Блокноте.

 

Как извлечь субтитры из DVD-диска?

1) Извлечение субтитров в графическом формате.

Если у вас есть DVD-диск с фильмом на иностранном языке, содержащий субтитры (особенно на языке оригинала), к тому же этой версии субтитров еще нет ни на одной базе субтитров, то есть довольно быстрый способ извлечь эти субтитры из DVD-диска и сохранить их на жестком диске в виде 2-х компактных файлов: один - с расширением idx (размером 50-100 килобайт), другой - с расширением sub (размером от 1 до 20 мегабайт). Пара этих файлов - это и есть субтитры в графическом формате. Бесплатная программа, которая позволяет это сделать, называется VSRip, объем ее около 400 килобайт. Эта программа работает очень быстро - на извлечение субтитров из одного DVD-диска уходит около 10 минут (если все файлы DVD-диска у вас находятся на жестком диске, то еще меньше - около 5 минут).

Как работать с программой VSRip? Запускаем программу. Нажимаем на кнопку "Load IFO...". Выбираем диск с DVD (или папку на жестком диске, куда скопирован DVD-диск), заходим в папку "VIDEO_TS", выбираем файл с расширением "IFO", содержащий в названии цифры. Причем начало названия этого файла должно совпадать с началом названия файлов с расширением "VOB", которые и являются фильмом (обычно эти VOB-файлы самые большие). Чаще всего этот IFO-файл называется "VTS_01_0.IFO" (в таблице ниже он выделен жирным шрифтом).

Типичный пример директории VIDEO_TS (см. также инструкцию о том, как сделать DVDrip):

название файла размер файла  
VIDEO_TS.BUP 12 288 DVD-меню
VIDEO_TS.IFO 12 288
VIDEO_TS.VOB 12 171 264
VTS_01_0.BUP 55 296 Глава 01
VTS_01_0.IFO 55 296
VTS_01_0.VOB 226 873 344
VTS_01_1.VOB 1 073 739 776
VTS_01_2.VOB 1 073 739 776
VTS_01_3.VOB 1 073 739 776
VTS_01_4.VOB 1 073 739 776
VTS_01_5.VOB 495 568 896
VTS_02_0.BUP 24 576 Глава 02
VTS_02_0.IFO 24 576
VTS_02_1.VOB 1 073 739 776
VTS_02_2.VOB 817 969 152

Нажимаем на кнопку "Save To...", и затем выбираем место на жестком диске, куда будут сохранены 2 файла (idx и sub), и как они будут называться. Нажимаем внизу кнопку "Next". Появляется меню "Extraction settings". В разделе "Languages" выбираем те языки, которые мы хотим сохранить (лучше выбирать все языки - кто знает, может быть ваши субтитры потом пригодятся кому-то, владеющему этим языком). Нажимаем на кнопку "Next" и терпеливо ждем, пока программа извлечет субтитры из DVD-диска, о чем она вам сообщит надписью "Done!".

В некоторых DVD-дисках (особенно это относится к сериалам и многосерийным мультфильмам) в меню "Extraction settings" вам нужно выбирать слева (раздел "Program Chains") разные части одной главы - PGC1, PGC2 и т.д. - иначе не возможно извлечь все субтитры. За один "проход" программа извлекает субтитры только из одной части (например, PGC1).

2) Извлечение субтитров, встроенных в видеопоток ("closed captioning", "closed captions").

Программа VSRip хоть и имеет опцию извлечения данного вида субтитров (галочка "Extract closed caption" в окне "Extraction setting"), но извлекает их с ошибками - очень часто многие строчки пропускает, к тому же всегда портит кодировку (буквы с диакритическими знаками превращаются в вопросительные знаки и т.п.). Есть другая программа, которая отлично справляется с этой задачей - CCextractor. Как с ней работать? Скачиваем архив. Распаковываем его в какое-то место на вашем жестком диске. Создаем ярлык на рабочем столе к файлу "/ccextractor.0.46/windows/CCGui.exe". Кликаем на этот ярлык - запускаем программу. В отдельном окне открываем проводник Windows, а в нем находим свой DVD-диск (или папку на жестком диске, куда скопированы все файлы DVD-диска). В проводнике же заходим в директорию VIDEO_TS, и находим там файлы с расширением "VOB", которые занимают больше всего места (в таблице выше с примером директории VIDEO_TS эти файлы выделены наклонным шрифтом). По одному файлу перетаскиваем их в окно программы CCextractor "input files" (по очереди файлы "VTS_01_1.VOB", "VTS_01_2.VOB", "VTS_01_3.VOB", "VTS_01_4.VOB", "VTS_01_5.VOB"). В строчке "Output file" вводим желаемое имя файла, например "matrix.srt". Нажимаем внизу кнопку "Start". Процесс пошел!

Если вы извлекли субтитры в графическом формате из DVD-диска, которых еще ни у кого нет, пожалуйста, поделитесь ими!!!

Например, загрузите их на базу-субтитров shooter.cn (как это сделать - см. инструкцию). Если это субтитры на языке оригинала к какому-нибудь фильму на французском, немецком или японском языках, то вы можете прислать их мне на email (см. раздел "Контакты"), и я выложу их здесь на этом сайте. Или вы можете распознать субтитры в текстовый формат.

 

Как извлечь субтитры из файла в формате mkv?

Довольно часто видеофайлы в формате mkv могут включать субтитры как в графическом, так и в текстовом формате. Вот, что нужно сделать, чтобы извлечь их из файла. Первым делом инсталлируем программу MKVToolnix. Затем скачиваем себе дистрибутив программы MKVExtractGUI. Затем вам надо разархивировать содержимое архива zip в папку, куда инсталлировалась программа MKVToolnix (по умолчанию это C:\Program Files\MKVtoolnix\), т.е. 4 файла программы MKVExtractGUI должны оказаться в указанной выше папке.

Приступаем к извлечению субтитров. Запускаем файл MKVextractGUI.exe, во вкладке Input нажимаем на многоточие, выбираем файл в формате mkv. После этого ставим галочки напротив тех субтитров, которые хотим извлечь (строки включают слово "subtitles"). И нажимаем справа кнопку Extract. Все! Процесс прошел, можно расслабиться и ждать.

К сожалению, бывают случаи, когда извлеченные субтитры содержат ошибки (тайминг, пропущенные субтитры), которых не было в исходном видеофайле в формате mkv.

 

Как извлечь субтитры из файла в формате mp4?

Иногда в видеофайлы в формате mp4 зашивают субтитры, которые могут быть как в графическом, так и в текстовом формате. Для того, чтобы извлечь эти субтитры, выполняем следующее. Прежде всего инсталлируем себе на компьютер программу YAMB (выберете самоинсталлирующийся файл "Yamb-2.0.0.8 with installer").

Запускаем программу. В меню слева выбираем пункт "Editing". Двойным кликом щелкаем по подпункту "Click to extract streams from AVI/MP4/MOV/TS files". Выбираем исходный файл ("Input"). Из появившихся дорожек выбираем нужную нам дорожку субтитров и нажимаем "Next". Процесс пошел...

 

Как распознать субтитры из графического формата (idx/sub) в текстовый (srt)?

Файлы в графическом формате (idx/sub) не удобны тем, что занимают относительно много места на диске (от 2 до 20 мегабайт), а также тем, что их нельзя выложить в большинство баз субтитров, в частности на самую удобную - opensubtitles.org. К тому же субтитры в графическом формате нельзя распечатать. Что делать? Спешу обрадовать - проблема решаема. Надо всего лишь распознать эти субтитры из графического формата в текстовый. Для этого существуют специальные программы:

  • SubRip - хорошо распознает субтитры на европейских языках,
  • SubOCR 0.98 - для распознавания субтитров на китайском языке.

Для японского языка был предложен следующий способ распознавания графических субтитров.

Подробнейшая инструкция о том, как распознавать субтитры с помощью программы SubRip, находится в разделе "Помощь" сайта subtitry.ru. При соответствующей сноровке на распознавание субтитров к одному фильму с ее помощью уходит 10-15 минут. И эти 10-15 минут стоит потратить - после этого вы сможете:

1) распечатать субтитры, и заниматься по распечатке там, где вам удобно, а не только там, где есть компьютер.

2) загрузить распознанные вами субтитры на одну из интернет-баз субтитров. Таким образом, вы поможете всем изучающим иностранные языки по фильмам.

Если у вас есть какие-то редкие субтитры (особенно на языке оригинала), обязательно загрузите их на одну из интернет-баз субтитров, желательно на opensubtitles.org!!! Как это сделать написано выше.

3) облегчите себе работу с фильмом - по распознанному тексту легко производить поиск с помощью текстовых редакторов. Например, если вам нужно найти в субтитрах некую фразу или слово. А если у вас есть электронный словарь, то вы можете скопировать из распознанных субтитров незнакомое слово и быстро узнать его значение.

 

Как получить файл с таймингом в формате srt, если есть субтитры в графическом формате (idx/sub)?

В некоторых случаях нужно получить файл с таймингом к фильму, к которому субтитры имеются только в графическом формате (idx/sub). Файл с таймингом (в текстовом формате - srt) может вам потребоваться в случае, если вы решили перевести фильм (создать к нему субтитры на вашем родном языке) или вы решили набрать вручную текст актеров на языке оригинала в рамках изучения письменного языка (в последнем случае обязательно проговаривайте текст вслух, вспоминая и точно копируя интонации).

Итак, что мы делать? Скачиваете программу SubRip. Я рекомендую пользоваться версией SubRip 1.40 Beta 3 (= Final). Запускаете ее, в ней открываете файл idx (File – Open VOB(s) – Open IFO). Выбираете нужный язык в разделе «Language stream». В разделе Action справа выбираете «Save SubPictures As BMP». Кликаете «Start». Выбираете желаемое имя файлов BMP и путь, куда они будут сохраняться. Кликаете «Save». В появившемся окне выбираете «l-Author». Кликаете «Ok». Программа начинает синтезировать BMP файлы по количеству субтитров. Прилежно ждем.

После этого в окне внизу выбираем Output Format – Set Output Format. Выбираем Text Formats – SubRip (*.srt). Жмем Convert to this Format. Программа повозмущается, что, мол, нехорошо сохранять в текстовом формате, но мы жмем Ok. Затем выбираем File – Save As. Затем нажимаем в том же окне внизу кнопку «Save» и выбираем нужное имя и путь к окончательному файлу с таймингом в формате srt. Собственно он-то нам и нужен.

Затем, в случае, если я хочу ввести вручную текст диалогов в файл с таймингом в формате srt, я предпочитаю поступать следующим образом. В одном окне открываю файл srt в редакторе Word, в другом – самый первый файл BMP с помощью стандартного Windows picture and Fax Viewer. Располагаю окна друг под другом. Окно с файлом BMP можно сильно сжать. И можно начинать работать с файлом srt – или впечатывать туда текст диалогов, или перевод – если вы после просмотра фильма решили его перевести. Один субтитр обработали – кликаете по окну с BMP-файлом, стрелочкой «вниз» переходим к следующему и т.д.

Если будете создавать субтитры в формате srt на языке оригинала фильма – обязательно загрузите их потом на одну из интернет-баз субтитров!!!

 

Программы для редактирования субтитров

Для редактирования субтитров можно пользоваться:

1) любым текстовым редактором (Блокнот, Microsoft Word, OpenOffice),

2) программой Subtitle Workshop, она очень удобна для синхронизации субтитров,

3) программой Aegisub, включает больше редакторских возможностей, чем Subtitle Workshop.

 

Как распечатать субтитры без тайминга?

Если вы хотите распечатать распознанные субтитры (в формате srt), чтобы заниматься по распечатке, например, в транспорте, и при этом не хотите расходовать тонну бумаги, то вот, что можно сделать.

Запускаем программу Subtitle Workshop. Открываем наши субтитры в формате srt. В меню выбираем "File" - "Save as...". Внизу нажимаем кнопку "Custom format". В открывшемся окне удаляем текст в поле справа. Вставляем в это поле следующие строки:

{RepeatSub}
{swText}
{EndRepeat}

Нажимаем кнопку "Save!". Вводим желаемое имя файла и нажимаем "Save".

Все! Можно печатать полученный текстовый файл из любого текстового редактора. Если вы используете редактор Word, то иногда он не хочет открывать файлы с расширением txt в нужной кодировке. Чтобы решить эту проблему, переименуйте расширение txt в какую-нибудь абракадабру (например, sss) и попробуйте открыть файл с таким расширением - в этом случае Word спросит, с помощью какой кодировки открыть файл, и вы сможете выбрать нужную вам.

 

Специальные программы для работы с субтитрами

Media Player For Foreign Languages Learners (Медиа плеер для изучающих иностранные языки) - данный плеер в отдельном окне показывает субтитры, причем текст субтитров можно выделить и скопировать в буфер обмена, что значительно облегчает быстрый поиск перевода слова в электронных словарях.

 

Рейтинг@Mail.ru Rambler's Top100 НЛП. Рейтинг сайтов  сообщества. Нейро-лингвистическое программирование

© Байтукалов Тимур, 2006-2009