Форум русскоязычного сообщества Ubuntu


Получить помощь и пообщаться с другими пользователями Ubuntu можно
на irc канале #ubuntu-ru в сети Freenode
и в Jabber конференции ubuntu@conference.jabber.ru

Автор Тема: html_entity_decode в bash, recode проблемы с кириллицей  (Прочитано 623 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Electricity

  • Автор темы
  • Участник
  • *
  • Сообщений: 241
    • Просмотр профиля
Здравствуйте.
Нужно сделать html_entity_decode в bash.
На php работает правильно:
Код: PHP
  1. echo 'Проверка < « » –' | php -r 'echo  html_entity_decode(file_get_contents("php://stdin"));'

А через recode html..utf8 искаженная кириллица.

php:

recode:


Могу использовать PHP, но зачем грузовик.
Kubuntu 18.04 amd64, Qt: 5.9.5, KDE Frameworks: 5.44.0, plasmashell 5.12.7, корпус чёрный, клава белая

Оффлайн alsoijw

  • Старожил
  • *
  • Сообщений: 4073
  • Fedora 25 GNOME 3 amd64
    • Просмотр профиля
Electricity, рискну предположить что если ты вставишь по середине смену кодировки(utf8 -> windows 1252) или перенастроишь php проблема исчезнет.
Мало видеть нам начало - надо видеть и конец. Если видишь ты создание - значит где-то есть ТВОРЕЦ
Многие жалуются: геометрия в жизни не пригодилась. Ямб от хорея им приходится отличать ежедневно?

Оффлайн Electricity

  • Автор темы
  • Участник
  • *
  • Сообщений: 241
    • Просмотр профиля
Откуда у меня что-то отличное от UTF8

$ locale
LANG=ru_RU.UTF-8
LANGUAGE=ru:en
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=
Kubuntu 18.04 amd64, Qt: 5.9.5, KDE Frameworks: 5.44.0, plasmashell 5.12.7, корпус чёрный, клава белая

Оффлайн alsoijw

  • Старожил
  • *
  • Сообщений: 4073
  • Fedora 25 GNOME 3 amd64
    • Просмотр профиля
Electricity, вставь в середине команды и посмотри. Вероятность того что поможет высока.
Мало видеть нам начало - надо видеть и конец. Если видишь ты создание - значит где-то есть ТВОРЕЦ
Многие жалуются: геометрия в жизни не пригодилась. Ямб от хорея им приходится отличать ежедневно?

Оффлайн Electricity

  • Автор темы
  • Участник
  • *
  • Сообщений: 241
    • Просмотр профиля
Мне решение проблемы нужно.
Откуда кодировка CP1252 на Kubntu?



И если она там взялась, то нужно удалить.
Recode похоже не знает такую.
Kubuntu 18.04 amd64, Qt: 5.9.5, KDE Frameworks: 5.44.0, plasmashell 5.12.7, корпус чёрный, клава белая

Оффлайн alsoijw

  • Старожил
  • *
  • Сообщений: 4073
  • Fedora 25 GNOME 3 amd64
    • Просмотр профиля
Код: Bash
  1. echo 'Проверка < « » –' | iconv -t cp1251 -f utf8 | куда тебе нужно.
Мало видеть нам начало - надо видеть и конец. Если видишь ты создание - значит где-то есть ТВОРЕЦ
Многие жалуются: геометрия в жизни не пригодилась. Ямб от хорея им приходится отличать ежедневно?

 

Страница сгенерирована за 0.176 секунд. Запросов: 24.