В файле блокнота содержится юникод но его не видно

Обновлено: 07.07.2024

Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word — а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).

Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).

Иероглифы в текстовых файлах (.txt)

Самая популярная проблема. Дело в том, что текстовый файл (обычно в формате txt, но так же ими являются форматы: php, css, info и т.д.) может быть сохранен в различных кодировках .

Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…

Что делать, если вместо текста иероглифы

Рис. 1. Блокнот — проблема с кодировкой

Как с этим бороться?

На мой взгляд лучший вариант — это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.

Notepad++

Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.

В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).

Рис. 2. Смена кодировки в Notepad++

Рис. 2. Смена кодировки в Notepad++

После смены кодировки мой текстовый документ стал нормальным и читаемым — иероглифы пропали (см. рис. 3)!

Рис. 3. Текст стал читаемый. Notepad++

Рис. 3. Текст стал читаемый… Notepad++

Bred 3

Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).

Кстати, Bred 3 очень помогает при работе со «старыми» файлами, сохраненных в MS DOS форматах. Когда другие программы показывают только иероглифы — Bred 3 легко их открывает и позволяет спокойно работать с ними (см. рис. 4).

Рис. 4. BRED3.0.3U

Если вместо текста иероглифы в Microsoft Word

Самое первое, на что нужно обратить внимание — это на формат файла. Дело в том, что начиная с Word 2007 появился новый формат — « docx » (раньше был просто « doc «). Обычно, в «старом» Word нельзя открыть новые форматы файлов, но случается иногда так, что эти «новые» файлы открываются в старой программе.

Просто откройте свойства файла, а затем посмотрите вкладку « Подробно » (как на рис. 5). Так вы узнаете формат файла (на рис. 5 — формат файла «txt»).

Если формат файла docx — а у вас старый Word (ниже 2007 версии) — то просто обновите Word до 2007 или выше (2010, 2013, 2016).

Рис. 5. Свойства файла

Рис. 5. Свойства файла

Рис. 5. Word - преобразование файла

Рис. 6. Word — преобразование файла

Чаще всего Word определяет сам автоматически нужную кодировку, но не всегда текст получается читаемым. Вам нужно установить ползунок на нужную кодировку, когда текст станет читаемым. Иногда, приходится буквально угадывать, в как был сохранен файл, чтобы его прочитать.

Рис. 7. Word - файл в норме!

Рис. 7. Word — файл в норме (кодировка выбрана верно)!

Смена кодировки в браузере

Когда браузер ошибочно определяет кодировку интернет-странички — вы увидите точно такие же иероглифы (см. рис 8).

Рис. 8. браузер определил неверно кодировку

Рис. 8. браузер определил неверно кодировку

  1. Google chrome: параметры (значок в правом верхнем углу)/дополнительные параметры/кодировка/Windows-1251 (или UTF-8);
  2. Firefox: левая кнопка ALT (если у вас выключена верхняя панелька), затем вид/кодировка страницы/выбрать нужную (чаще всего Windows-1251 или UTF-8) ;
  3. Opera: Opera (красный значок в верхнем левом углу)/страница/кодировка/выбрать нужное.

PS

Таким образом в этой статье были разобраны самые частые случаи появления иероглифов, связанных с неправильно определенной кодировкой. При помощи выше приведенных способов — можно решить все основные проблемы с неверной кодировкой.

мой компьютер недавно нормально отображал символы Юникода. Однако; он недавно перестал отображать их, я могу успешно отображать символы в блокноте на другом компьютере, под управлением той же Win 7, но это x86 вместо x64. В обоих случаях используется один и тот же шрифт (arial) переключение на шрифт, поддерживаемый unicode на компьютере x64 устраняет проблему. Есть мысли?

Шрифт В Блокноте

в блокноте Windows, вы не можете (в общем) смешивать шрифты, вы можете выбрать только один шрифт одновременно. Однако этот оператор должен быть квалифицирован для последних версий Windows.

Windows XP и более ранние

в Windows XP и более ранних версиях Блокнот не мог отображать символы, отсутствующие в выбранном шрифте. Поэтому отсутствует или неправильно отображается символ (обычно отображается в виде пустого поля) может быть вызван:

использование Arial вместо Arial Unicode.
Ариал-это 778,552 байт, Ариал Юникод 23,275,812 байт. Разница в том, что огромное количество символов в Arial Unicode, но не в Arial. (эти размеры от Vista не XP, Но разница будет аналогичная).

опуская Знак порядка байтов (BOM)
Windows ожидает файлы Unicode (UTF-8, UTF-16 LE и т. д.) Для хранения спецификации. Если нет, Затем Windows угадывает кодировку с помощью функции Windows API ( isTextUnicode ), который, как известно, делает ошибки, в результате чего вместо одного правильного символа отображается несколько латинских символов-1.

Windows Vista и далее

Блокнот теперь принял стратегию, впервые увиденную в веб-браузерах-если символ не существует в текущем шрифте, найдите шрифт, который делает содержать этот символ и только для этого символа использовать другой шрифт. Поэтому, если у вас есть различные дополнительные шрифты на одном компьютере, он может вести себя по-разному на других компьютерах (даже если ОС одинакова).

" Неправильно " Arial
Я не знаю алгоритма, но представляется возможным, что, если у вас поврежден или значительно меньше Ариал Юникод, что не хватает некоторых символов, Блокнот может поверить шрифт содержит символ не. шрифт Arial шрифт 3,395 КБ не то, что я ожидал бы на Windows 7. Возможно, установка какого-то приложения заменила шрифт по умолчанию на тот, который каким-то образом неисправен?

дополнительные "плохой" шрифт В качестве альтернативы Блокнот может искать другой, недавно добавленный, шрифт для отсутствующего символа, прежде чем смотреть на Arial Unicode. Если этот другой шрифт утверждает, что содержит символ, но не (например, неверный макет теги, Блокнот может не отображать характер

действия

на компьютере, который имеет 3,395 КБ Arial regular, скопируйте файл шрифта в безопасное место, снимите его, а затем установите 761 КБ Arial regular файл шрифта, скопированный с другого компьютера.

Вопрос пользователя

Здравствуйте.

Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.

Заранее спасибо.

Доброго времени суток!

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные "крякозабры" (как я их называю), и прочитать это нереально.

Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из Википедии ), а браузер пытается открыть его в другой. Из-за такого рассогласования, вместо текста — непонятный набор символов.

ускорение ПК

Исправляем иероглифы на текст

Браузер

Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для "ручной" настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек.

Вместо текста одни лишь крякозабры

Вместо текста одни лишь крякозабры // Браузер выставил кодировку неверно!

Поэтому, я рекомендую в ручном режиме попробовать их обе. Для этого нам понадобиться браузер MX5 (ссылка на офиц. сайт). Он один из немногих позволяет в ручном режиме выбирать кодировку (при необходимости):

Браузер MX5 — выбор кодировки UTF8 или авто-определение

Теперь отображается русский текст норм.

Теперь отображается русский текст норм.

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например, при чтении Readme в какой-нибудь программе прошлого века (скажем, к играм) .

Разумеется, что многие современные блокноты просто не могут прочитать DOS'овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Иероглифы при открытии текстового документа

Далее в Bred 3 есть кнопка для смены кодировки: просто попробуйте поменять ANSI на OEM — и старый текстовый файл станет читаемым за 1 сек.!

Исправление иероглифов на текст

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

Смена кодировки в блокноте Notepad++

Пример работы ПО "Штирлиц"

Пример работы ПО "Штирлиц"

BAT-файлы (скрипты)

На скрине видно, что вместо русского текста отображаются различные квадратики, буквы "г" перевернутые, и пр. иероглифы.

Как выглядит русский текст при выполнении BAT-файла

Как выглядит русский текст при выполнении BAT-файла

  1. в начало BAT-файла добавить код @chcp 1251 ;
  2. установить программу Notepad++ и в меню выбрать OEM-866: "Кодировки/Кодировки/Кириллица/OEM-866" ;
  3. установить программу Akelpad, в разделе "Кодировки" выбрать "Сохранить в DOS-866" .

Документы MS WORD

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 года в Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат — то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

Так же при открытии любого документа в Word (в кодировке которого он "сомневается"), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

  1. Widows (по умолчанию);
  2. MS DOS;
  3. Другая.

Переключение кодировки в Word при открытии документа

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать — нереально).

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

  • нажмите Win+R ;
  • введите intl.cpl , нажмите Enter.

intl.cpl - язык и регион. стандарты

Формат - русский / Россия

Во вкладке "Местоположение" — укажите "Россия" .

И во вкладке "Дополнительно" установите язык системы "Русский (Россия)" .

После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

Текущий язык программ

PS

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF.

Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2016+ и Adobe Reader для примера выше).


2016.10.14 Мария Нисимо Привет, ребята!
Такой вопрос: на компе стоит китайская винда, когда скачиваю документ с русским текстом формата txt, то после скачки отображается не русский текст, а набор иероглифов. Почему так происходит и как мне это настроить?
Огромное спасибо.

Возможно, по-умолчанию стоит какой-нибудь китайский sim hei. Поставьте шрифт с поддержкой кирилицы в настройках блокнота.

Это кодировка. Вам нужно знать в какой кодировке текст, чтобы выбрать её. Попробуйте
UTF-8 (универсальная)
GB2312 (китайская упрощённая - если создавали на китайской винде)
Winodws-1251 (кириллическая - скорее всего она, если создавали на русскоязычной винде)

И ещё разные наркоманские кириллические типа варианты KOI8. Всё зависит от того, кто создавал файл. Нормальные люди используют юникод.

У вас по умолчанию скорее всего GB2312 (если китайская винда), зависит от настроек редактора.

Меняется в меню где "вид".

Откройте файл в веб-браузере, скорее всего автоматически подберет правильную кодировку. Если нет, то просто поиграйтесь с кодировками, там скорее всего Windows-1251.

На будущее сохраняйте в Юникоде (UTF-8), он универсален.

Так у меня открываются все документы txt.В это раз документ скачен с сайта литрес, соответственно, всё в нем должно быть ок. Я меняла кодировки для повторного сохранения документа (мне там предлагаются ANSI, Unicode, Unicode big endian, UTF-8), документ остается таким же, наполненным огромным количеством иероглифов. Я открыла его в браузере-та же ерунда.
Подскажите, пожалуйста, подробнее, где мне поменять настройки "по умолчанию". Меню "вид"? Мария Нисимо, НЕ надо повторно сохранять в другой кодировке, тогда уж точно всё пропало. Откройте оригинальный документ в Хроме или Огнелисе, конкретно в Хроме: нажимаете на кнопку из трёх точек в правом верхнем углу, потом "дополнительные инструменты" -> "кодировка" -> Windows-1251. Выделяете весь текст (Ctrl + A), открываете Блокнот и вставляете его туда, пересохраняете в UTF-8.


2016.10.14 Мария Нисимо Подскажите, пожалуйста, подробнее, где мне поменять настройки "по умолчанию". Меню "вид"?

Можно и через браузер, но не факт, что вам будет проще. В браузере тоже надо менять, сам они не часто правильно определяют текст.

Читайте также: