Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Транслитерация  (Прочитано 3256 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Транслитерация
« : 14 Ноября 2010, 17:11:51 »
Здравствуйте!
Скажите, пожалуйста, возможно ли, и если да, то как, транслитерировать названия всех файлов в определенной папке с латиницы на кириллицу? В обратную сторону можно найти решения в гугле, а в эту что-то не нашел.
Спасибо!
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн Дмитрий Бо

  • Погонщик серверов
  • СуперМодератор
  • Старожил
  • *
  • Сообщений: 3549
  • Я не техподдержка, я за порядком слежу
    • Просмотр профиля
Re: Транслитерация
« Ответ #1 : 14 Ноября 2010, 17:48:12 »
Покажи, что нашёл.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #2 : 14 Ноября 2010, 17:56:31 »
Ох, давно это было... Сейчас еще поищу...

Пользователь решил продолжить мысль 14 Ноября 2010, 18:02:04:
https://forum.ubuntu.ru/index.php?topic=5296.0
Вот, например. Там скрипт, который почему-то не работает. Как его исправить, можно понять, даже не зная программирования, чтобы в обратную сторону транслитерировал. Починить бы его...
В гугле еще есть подобные же скрипты, кажется, я помню...
« Последнее редактирование: 14 Ноября 2010, 18:02:04 от Phlya »
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн Jack Sparrow

  • Активист
  • *
  • Сообщений: 641
    • Просмотр профиля
Re: Транслитерация
« Ответ #3 : 14 Ноября 2010, 18:05:29 »
Мне кажется, что обратная задача не вполне однозначна. Поэтому и решени найти не просто. Если транслитерируешь с русского на латиницу, то можно придерживаться определенных правил, например, "ц" писать как "c". А другой будет писать как "ts". Все равно русский человек без особого труда прочитает.
А при обратной процедуре проблема в том, что не знаешь, кто какие буквы использовал. Это мог делать и автомат, и вручную. В результате не будет последовательности. Например:
"цветочек" - "cvetochek/tsvetochek/tsveto4ek". Когда читаешь транслитерацию, то на такие мелочи можно не обращать внимания. Но если перевести обратно в кириллицу, то могут получиться слабочитаемые слова, типа "тсветочек". Сомневаюсь, что есть программа, учитывающая ВСЕ возможные варианты. Но если первая транслитерация была сделана последовательно, по вполне определенным правилам, то, думаю, все рашаемо.
Нейросети тебя не заменят. Тебя заменит человек, который умеет ими пользоваться.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #4 : 14 Ноября 2010, 18:08:10 »
http://ru.wikibooks.org/wiki/LOR-FAQ-Storage#.D0.9A.D0.B0.D0.BA_.D0.BF.D0.B5.D1.80.D0.B5.D0.BA.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.B0.D1.82.D1.8C_.D1.80.D1.83.D1.81.D1.81.D0.BA.D0.B8.D0.B5_.D0.BD.D0.B0.D0.B7.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F_.D1.84.D0.B0.D0.B9.D0.BB.D0.BE.D0.B2_.D0.B2_.D1.82.D1.80.D0.B0.D0.BD.D1.81.D0.BB.D0.B8.D1.82.3F

Вот несколько скриптов... Можно их как-то несложно изменить, чтоб в обратную сторону?

Про правила не имею ни малейшего представления. У меня есть некоторое количество скачанной музыки с названиями в транслите. Хочется читать их на русском, который еще и является для них оригиналом...
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн Чистый

  • Почётный модератор
  • Старожил
  • *
  • Сообщений: 3473
  • nix - вот оно счастье...
    • Просмотр профиля
Re: Транслитерация
« Ответ #5 : 14 Ноября 2010, 18:12:19 »
Про правила не имею ни малейшего представления. У меня есть некоторое количество скачанной музыки с названиями в транслите. Хочется читать их на русском, который еще и является для них оригиналом...
а теги заполнены в этой самой музыке, если она в mp3 конечно...
Тестовый репозиторий kdeNeur ppa:devcode/kdeneur
各々が死ぬことをどのように決定する

Оффлайн ende_neu

  • Старожил
  • *
  • Сообщений: 2473
    • Просмотр профиля
Re: Транслитерация
« Ответ #6 : 14 Ноября 2010, 18:14:22 »
А теги-то верные прописаны?Easytag-oм переименуй.
Нормальная обратная транслитерация дело очень сложное.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #7 : 14 Ноября 2010, 18:15:45 »
В теге названия стоит название файлов - транслит.

Кстати, чтобы не создавать отдельную тему. Возможно ли сделать аналогичную вещь, только не транслитерировать названия, а перевести с английского на русский? =)

Пользователь решил продолжить мысль 14 Ноября 2010, 18:17:08:
Кстати, да. Без подключения орфографического словаря правильную траслитецию не сделать. Если устравает, что в глаголах "tsya" станет "ця", то можно.
:idiot2: :(
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн Чистый

  • Почётный модератор
  • Старожил
  • *
  • Сообщений: 3473
  • nix - вот оно счастье...
    • Просмотр профиля
Re: Транслитерация
« Ответ #8 : 14 Ноября 2010, 18:19:29 »
Кстати, чтобы не создавать отдельную тему. Возможно ли сделать аналогичную вещь, только не транслитерировать названия, а перевести с английского на русский? =)

Я думаю что это еще сложнее чем переработать все вручную :)
Тестовый репозиторий kdeNeur ppa:devcode/kdeneur
各々が死ぬことをどのように決定する

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #9 : 14 Ноября 2010, 18:21:56 »
Эх, жаль...
Спасибо...

А как хотя бы сделать, чтобы с ошибками транслитерировало?..
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн ende_neu

  • Старожил
  • *
  • Сообщений: 2473
    • Просмотр профиля
Re: Транслитерация
« Ответ #10 : 14 Ноября 2010, 18:40:17 »
С ошибками я тупо sed-oм делал.(но это для поискового робата предназначалось, он ошибочные написания верно понимал.А так это вряд ли сгодится)
s/F/Ф/g и т.д. и т.п.(^_^)

Оффлайн Дмитрий Бо

  • Погонщик серверов
  • СуперМодератор
  • Старожил
  • *
  • Сообщений: 3549
  • Я не техподдержка, я за порядком слежу
    • Просмотр профиля
Re: Транслитерация
« Ответ #11 : 14 Ноября 2010, 19:03:38 »
Сначала прогоняем s/sch/щ/, потом s/sh/ш/, s/ts/ц и т. д., потом однобуквенные.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #12 : 14 Ноября 2010, 19:10:51 »
А можно ведь это в скрипт загнать?
Как тогда примерно он будет выглядеть? Начало его и конец, середину, наверное, я сам смогу аналогичными строчками заполнить)
Ubuntu 14.04 (Unity), MSI GE40

Оффлайн ende_neu

  • Старожил
  • *
  • Сообщений: 2473
    • Просмотр профиля
Re: Транслитерация
« Ответ #13 : 14 Ноября 2010, 19:19:53 »
>Сначала прогоняем s/sch/щ/, потом s/sh/ш/, s/ts/ц и т. д., потом однобуквенные.

Да, так должно быть лучше.Но всё равно криво будет - например то что должно быть "счастье" получится "щастие".В английском алфавите и букв меньше - при транслитерации многие теряются.Вобщем нормальное преобразование - задача для непростого приложения, тут словари надо подключать.

В конкретно этой задаче я бы всёж easytag-ом попробывал сделать - он ведь через CDDB может найти названия.

Оффлайн Phlya

  • Автор темы
  • Старожил
  • *
  • Сообщений: 2219
  • Фля, Цыганский барон, Винни Пух
    • Просмотр профиля
Re: Транслитерация
« Ответ #14 : 14 Ноября 2010, 19:55:29 »
О! Я нашел текстовый файл, в котором есть список всех этих композиций на русском в формате
Album 1
001. Name1
002. Name2
...
Album2
014. Name14
...

Можно ли его как-то использовать?)
Ubuntu 14.04 (Unity), MSI GE40

 

Страница сгенерирована за 0.037 секунд. Запросов: 20.