Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Проблема с кодировкой .txt файлов после обновления системы до 22.10  (Прочитано 71520 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Yolter

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Здравствуйте уважаемые гуру, прошу помочь с проблемой кодировки в файлах .txt. На версии 20.04 все было хорошо, те же самые файлы были читаемы, после обновления системы до версии 22.10 некоторые файлы стали выводиться иероглифами. Пробовал самостоятельно решить этот вопрос следующими способами:
1. распространенная рекомендация с помощью dconf поправить автоопределение в редакторе gedit не помогла, так стоит редактор nano, там настроек связанных с кодировокй вообще не нашел :-\
2. пробовал добавить кодировки в локали по адресу /var/lib/locales/supported.d/ru. Изначально из русских там была ru_RU.utf8. Добавил ru_RU.cp1251 ru_RU.iso88595 ru_RU.koi8r. Затем их сгенерировал командой locale-gen. Добавленные кодировки по команде locale -a появились, но проблему не решили.

Командой file -i посмотрел какая кодировка у файла - charset=iso-8859-1, в поддерживаемых кодировках из русских только ru_RU.iso88595, это узнал через команду sudo dpkg-reconfigure locales.

Больше поиском ни в сети, ни на форуме ничего вразумительного не нашел.  :(

Естественно, из под Win 10 эти же файлы открываются отлично...

Подскажите пожалуйста в какую сторону копать?

один из файлов с проблемой кодировки прикладываю

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 7726
    • Просмотр профиля
Хотя-бы в качестве временной меры, плюнь на nano и установи Midnight commander. Он заменит тебе и консольный редактор и многое другое.

« Последнее редактирование: 23 Ноября 2022, 12:01:55 от andytux »

Оффлайн Peter_I

  • Старожил
  • *
  • Сообщений: 3211
    • Просмотр профиля
Если однобайтовые кодировки не требуются для работы или каких-то специальных целей,
то лучше пользоваться только UTF-8.
Пётр.

Оффлайн Yolter

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Хотя-бы в качестве временной меры, плюнь на nano и установи Midnight commander. Он заменит тебе и консольный редактор и многое другое.


спасибо за совет, установил, разобрался, в качестве временной, хорошая мера! все таки странно почему система автоматом не определяет Windowsкую кодировку  ???

Пользователь добавил сообщение 23 Ноября 2022, 13:49:10:
Если однобайтовые кодировки не требуются для работы или каких-то специальных целей,
то лучше пользоваться только UTF-8.
полностью с вами согласен, ковыряю старый курс, а там таких полно, да и на строй версии проблем не было, а с 22.10 вылезло..
« Последнее редактирование: 23 Ноября 2022, 13:49:10 от Yolter »

Оффлайн SergeyIT

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 5694
  • Все по палатам!
    • Просмотр профиля
Yolter, как ты с 20.04 обновился до 22.10?
И какая система не определяет кодировку?
Извините, я все еще учусь

Оффлайн Yolter

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Yolter, как ты с 20.04 обновился до 22.10?
технически не обновлялся, а заново переустановил

И какая система не определяет кодировку?
в 22.10 эта проблема появилась. в 20.04 все было норм


Оффлайн SergeyIT

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 5694
  • Все по палатам!
    • Просмотр профиля
в 22.10 эта проблема появилась. в 20.04 все было норм
Так это проблема редактора, в котором вы работаете, а не системы. Система работает с кодировкой, которая заложена в системе. Если не устраивает (не можете настроить) - пошлите баг репорт о gedit, ведь 22.10 система для тестирования, а не для работы. Или можете использовать другой редактор (я gedit практически никогда не использовал).
Кстати, кроме кодировки, могут иметь другое значение и символы конца строки... 
Извините, я все еще учусь

Оффлайн Peter_I

  • Старожил
  • *
  • Сообщений: 3211
    • Просмотр профиля
Файлы можно перекодировать с помощью iconv и сразу все в каталоге в одной кодировке, это будет скрипт из нескольких строк.
Пётр.

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 7726
    • Просмотр профиля
Хорошее предложение. Но...
Перед конвертацией проверить каждый файл и убедиться, что все они в одной кодировке. Иначе запутаешь так, что не разгребешь.
Где помещать и как назвать скрипт, чтобы самому потом его найти. Как его запускать. Ответ на все вопросы, mc:

Выделил файлы, выбрал команду в меню, выполнил.

Оффлайн Yolter

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
в 22.10 эта проблема появилась. в 20.04 все было норм
Так это проблема редактора, в котором вы работаете, а не системы. Система работает с кодировкой, которая заложена в системе. Если не устраивает (не можете настроить) - пошлите баг репорт о gedit, ведь 22.10 система для тестирования, а не для работы. Или можете использовать другой редактор (я gedit практически никогда не использовал).
Кстати, кроме кодировки, могут иметь другое значение и символы конца строки...
если я правильно понимаю, и проблема была бы в редакторе, то в другом редакторе, например, LibreOffice все бы работало? Но в нем тоже не работает и в других редакторах тоже, а стоит вместо gedit nano, но это не суть важно. Про баг репорт изучу вопрос, если разберусь, отправлю, спасибо!

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 7726
    • Просмотр профиля
Цитировать
стоит вместо gedit nano
Может и не вместо. По умолчанию, они стоят вместе.
У меня например, нано удален, и офис тоже. А gedit - как назвать. Если по имени файла, то gedit, если по названию десктоп-файла, то org.gnome.gedit, если по тому, как покажет меню, то Text Editor.

Цитировать
в другом редакторе, например, LibreOffice все бы работало?
Как знать. Может оно и работает. Например, то что ты делал с ...
Цитировать
...помощью dconf поправить автоопределение в редакторе gedit
...касается исключительно только gedit. От правильности-неправильеости системы не зависит никак.

Оффлайн jurganov

  • Старожил
  • *
  • Сообщений: 1913
    • Просмотр профиля
мне присылают csv файлы. в экселе сделанные в UTF-8
Поставил Komodo Edit
и сохраняю их в один щелчок мыши в WINDOWS - 1251 для помещения на сайт в базу мудла.

Оффлайн Yolter

  • Автор темы
  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
всем спасибо за помощь и участие! :) решил больше не тратить время на поиск проблемы, для моих нужд вполне хватит МС и его функционала.

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 7726
    • Просмотр профиля
Жаль, так и не вырос...
Написал-бы конкретно, как делал для gedit. Для более старых версий (примерно до 20.04) советовали:
Цитировать
gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8', 'WINDOWS-1251', 'KOI8-R', 'GBK', 'CURRENT', 'ISO-8859-15', 'UTF-16', 'CP-866']"
Но, например, в 22.04:
$ gsettings get org.gnome.gedit.preferences.encodings candidate-encodings
['WINDOWS-1251', 'UTF-8', 'ISO-8859-15', 'UTF-16']
...и gedit открыл твой файл в правильной кодировке.
« Последнее редактирование: 26 Декабря 2023, 02:24:41 от andytux »

 

Страница сгенерирована за 0.075 секунд. Запросов: 27.