Как посчитать количество знаков в пдф файле

Обновлено: 06.07.2024

Блог

Многим компаниям и фрилансерам, переводчикам приходится иметь дело с PDF-файлами. Нередко при такой работе возникает необходимость быстро оценить объем содержащегося в них текста. Но в формате PDF такая возможность отсутствует, а в популярных приложениях для просмотра PDF-документов вы можете узнать только общее количество страниц.

Казалось бы, можно примерно представить, сколько текста может поместиться на таком количестве страниц. Но это не работает, поскольку:

  • в файле могут использоваться шрифты разного размера
  • в файле могут содержаться рисунки и таблицы, которые существенно увеличивают его объем
  • файл может содержать титульные страницы с одной-двумя строчками текста и т.п.

Поэтому узнавать объем нужного вам файла придется по-другому. Это можно сделать двумя способами:

  1. Скопировать весь текст (Ctrl+A) и вставить его в документ Word (см. Как узнать количество символов в Word). Однако этот способ работает не всегда. Файл может быть защищен от копирования, или весь текст может представлять собой картинку (например, если вы имеете дело со сканом). Кроме того, не все символы при копировании могут распознаваться как текст из-за особенностей верстки.
  2. Более надежный вариант – это посчитать слова и символы с помощью специальных программ для распознавания текстов. На сегодня существует целый ряд приложений, позволяющих сделать это быстро и удобно. Наиболее известные и распространенные из них, это:
  • FineReader, который позволяет распознать файлы PDF и JPG и преобразовать их содержимое в обычный текст. Поддерживается экспорт в различные форматы: Word, Excel, Powerpoint и т.д. Мы используем именно эту программу и считаем ее наиболее мощным инструментом для распознавания текста в PDF. Часть работы выполняется вручную, поэтому эту работу лучше доверить специалисту по OCR. Услугу можно заказать в нашей компании отдельно от услуг перевода.

Инструменты, приведенные ниже, не поддерживают распознавание в ручном режиме, соответственно, часть текста может быть не распознана или распознана неправильно.

Подсчитывать количество знаков умеют многие текстовые редакторы. Перечислим самые популярные.

1. Google Docs

Платформы: веб.

Чтобы посчитать количество символов во всем документе с помощью Google Docs, кликните «Инструменты» → «Статистика». Или нажмите Ctrl + Shift + C.

Если хотите узнать число знаков только в определённом фрагменте текста, сначала выделите его, а потом откройте статистику.

2. Microsoft Word

Платформы: Windows, macOS, веб.

Чтобы узнать общее количество символов в документе с помощью Word, щёлкните по надписи «Число слов» в нижней части экрана.

Если вас интересует количество знаков в определённом фрагменте, предварительно выделите его и только после этого откройте статистику.





3. LibreOffice Writer

Платформы: Windows, macOS, Linux.

LibreOffice Writer по умолчанию отображает суммарное количество символов документа в нижней части экрана. Чтобы узнать число знаков только в отдельном фрагменте текста, просто выделите его. Информация появится на том же месте.

4. Apple Pages

Платформы: macOS, веб.

Чтобы посмотреть общее количество символов в документе с помощью Apple Pages, нажмите «Вид» → «Показать число слов». Затем кликните по стрелкам на баннере, появившемся в нижней части окна, и выберите нужный вариант: «Символов с пробелами» или «Символов без пробелов». Информация появится на этом же баннере.

Чтобы узнать число знаков в конкретном фрагменте текста, просто выделите его. Результат отобразится на баннере в нижней части окна.

Читайте также: