Какую информацию можно получить с помощью гистограммы распределения количества пикселей

Обновлено: 06.07.2024

Одним из ценнейших инструментов для редактирования фотографий в Photoshop можно назвать гистограмму! На самом деле, гистограммы настолько важны, что их применение не ограничивается только Photoshop . Они есть в большинстве фоторедакторов, включая Adobe Lightroom , Photoshop Elements , и даже в Camera Raw в Photoshop .

Гистограмма – график, который показывает текущий тональный диапазон изображения, что позволяет оценить его и, если потребуется, подкорректировать. Под тональным диапазоном я подразумеваю уровни яркости на снимке/изображении. Гистограмма показывает, какая часть изображения максимально черная, а какая – максимально белая, а также все то, что находится между этими цветами.

Гистограммы отлично помогают и при работе с цветными снимками. Даже если мы не воспринимаем цвет как нечто большее, чем просто цвет, у каждого из них в изображении есть собственный уровень яркости. Например, желтые оттенки обычно очень светлые, синие гораздо темней. Эта разница в яркости сильно влияет на тональный диапазон всего снимка.

Как же тональный диапазон снимка может помочь нам? К примеру, доводилось ли вам когда-нибудь смотреть на фотографию с мыслями о том, что она какая-то « неполная »? Тема снимка интересна, композиция хорошая, но в целом он ничем не цепляет. И все потому, что на снимке недостает контраста. Светлые области слегка блеклые, а тени недостаточно темные.

Сейчас может казаться, что подобные недочеты можно разглядеть и невооруженным глазом, но не всегда можно полагаться на собственное зрение. Визуально легко сравнивать два расположенных рядом снимка, но если всматриваться в одно изображение, то зрение может с легкостью обмануть вас.

Также стоит учитывать, что монитор не всегда способен показывать цвета такими, какие они есть. Если настроить яркость экрана на полную, то на нем снимок будет выглядеть прекрасно, но вы будете разочарованы, распечатав его. Гистограмма поможет избежать подобных ситуаций, потому что она получает информацию прямо с изображения, всегда показывая точные данные о тональном диапазоне, и помогает выявить проблемы с контрастом.

Как и в случае с низкой контрастностью, не всегда можно выявить проблемы такого типа визуально. Наши глаза просто недостаточно чувствительны к таким вещам, и монитор также может отображать нам не совсем точную картину. Но гистограмма всегда дает точные данные, особенно когда в процессе редактирования кто-то переусердствовал с настройками и случайно испортил цвета на снимке.

Либо, если нам предстоит восстанавливать очень старый снимок, то гистограмма позволит определить недостающие детали, и укажет, откуда следует начать работу. В конце концов, если вы часто обрабатываете фотографии, и при этом не умеете работать с гистограммой, то ничего хорошего в этом нет.

Просмотр гистограммы в Photoshop

Посмотреть гистограмму в Photoshop можно несколькими способами, включая всем известную панель « Гистограмма » ( Histogram ). Однако чтобы лучше всего понять, как именно работает гистограмма, советуем вам воспользоваться панелью « Уровни » ( Levels ).

Ранее я уже упоминал о том, что гистограммы работают одинаково хорошо как с черно-белыми снимками, так и с цветными. Но чтобы информация легче воспринималась, давайте начнем с черно-белого снимка :

Просмотр гистограммы в Photoshop

Чтобы перейти на панель « Уровни » ( Levels ), нужно открыть меню « Изображение » ( Image ) в самом верху экрана, затем раздел « Коррекция » ( Adjustments ), а потом « Уровни »:

Перед вами откроется окно « Уровни ». Но давайте оставим тему использования уровней при корректировке изображений для следующего руководства. Сейчас мы просто используем это окно, чтобы оценить работу гистограммы:

Гистограмма – это черная фигура в центре окна, напоминающая силуэт гор. У каждой картинки своя уникальная гистограмма, и сейчас вы поймете почему:

Если посмотреть чуть ниже гистограммы, можно увидеть полоску градиента. Слева он начинается с черного цвета и постепенно переходит к белому цвету справа:

Уровни яркости гистограммы соответствуют расположенному под ней градиенту

Так почему же гистограмма напоминает горы? Потому что она показывает текущие уровни яркости или тональные значения на изображении. Другими словами, она показывает, какая часть изображения находится на определенном уровне яркости в сравнении с остальными уровнями яркости. Поэтому некоторые элементы гистограммы длиннее других.

Чем выше « столбик » гистограммы на определенном уровне яркости, тем больше пикселей изображения находятся на этом уровне. Более короткие столбики гистограммы указывают на те уровни яркости, где находится меньше всего пикселей. А если в определенной области градиента столбик вообще не отображается, это значит, что на этом участке изображения нет пикселей, которые охватывают этот уровень яркости.

Важно знать, что гистограмма не показывает нам конкретное количество пикселей. Это связано с тем, что большинство современных фотокамер способны делать снимки в разрешении 10-20 мегапикселей при одном и том же размере изображения.

Чтобы вместить все эти пиксели в гистограмму, понадобится несколько огромных мониторов! Поэтому вместо этого гистограмма дает нам лишь общее представление о тональном диапазоне изображения, распределенное на светлые участки, полутона и тени, а также показывает полностью черные или белые области.

Гистограмма хорошо экспонированного кадра будет показывать весь диапазон уровней яркости от черного до белого цвета, и пример такого изображения приведен ниже. Левая часть гистограммы начинается от левого края, над самым черным оттенком градиента ( это самые темные оттенки, которые могут быть ):

Левая сторона гистограммы начинается от самого края, с чистого черного цвета

С другой стороны гистограммы мы видим, что она простирается до самого правого края, охватывая и всевозможные света. Маленький столбик в самом конце гистограммы говорит нам о том, что на снимке есть максимально белые цвета. То есть, можно с уверенностью сказать, что наш черно-белый снимок выглядит правильно:

Правая сторона гистограммы заканчивается на чистом белом цвете

Обычно гистограмма читается слева направо ( от темного к светлому ). Если начать слева и продвигаться в правую сторону, то можно увидеть, что на снимке преобладают темные цвета, а затем, при приближении к полутонам, идет резкий спад количества пикселей. Затем снова идет стремительное увеличение, после которого резкий обрыв до полного отсутствия пикселей:

Самые высокие столбики гистограммы приходятся на светлые области и тени; меньше всего пикселей в области полутонов

Так как большая часть пикселей приходится на светлые области, можно сделать вывод о том, что изображение будет светлым. У нас также есть достаточное количество темных оттенков, и это отображают высокие столбики, приходящиеся на темную часть градиента. И, наконец, небольшая высота столбиков в полутонах говорит нам о том, что такие области на изображении все же есть, но их меньше, чем светлых или темных.

Давайте снова взглянем на снимок и убедимся, что его большая часть действительно светлая ( кожа девушки, глазные яблоки, одежда, фон ). У нас также достаточно темных областей ( волосы, брови, глаза, и некоторая часть фона) , но мало полутонов. Они есть, но их не так много, как других уровней яркости, что дает больший контраст. Можно с уверенностью утверждать, что гистограмма отлично рассказала нам о тональном диапазоне на фотографии:


Теперь давайте взглянем на полноценный цветной фотоснимок :


Давайте еще раз откроем окно «Уровни» и посмотрим на гистограмму. Но на этот раз я воспользуюсь сочетанием клавиш Ctrl+L ( Win ) / Command+L ( Mac ). Открывается одно и то же окно, только с использованием горячих клавиш все происходит быстрее:

Давайте посмотрим, о чем нам говорит эта гистограмма. Здесь мы снова видим, что снимок хорошо экспонирован. С левой стороны гистограмма начинается с черного цвета, а правая часть заканчивается полностью белым, а это значит, что тональный диапазон охватывает обе границы:

Гистограмма начинается с черного цвета, а заканчивается белым

Начиная изучение гистограммы слева направо, можно увидеть, что количество пикселей резко возрастает практически с самого начала, на темных областях, но, в отличие от предыдущего примера, их количество не падает на полутонах. Вплоть до светлых областей количество пикселей остается примерно одинаковым, но после достижения этого диапазона на градиенте, высота столбиков на гистограмме стремительно увеличивается. После чего идет резкий спад на белых областях:

Гистограмма второго изображения показывает, что здесь гораздо больше полутонов, чем в прошлом примере

Это говорит о том, что изображение достаточно детализировано во всех трех диапазонах ( тенях, полутонах и светлых участках ), и о том, что белых областей здесь больше, чем остальных. Давайте снова взглянем на изображение. Белая рубашка жениха и платье невесты составляют большую часть кадра, и это объясняет, почему на гистограмме в светлом диапазоне гораздо больше пикселей:


Фотография и гистограмма снова соответствуют друг другу

Применяем гистограмму для выявления проблем

До сих пор мы рассматривали гистограммы фотографий с правильной экспозицией, но ведь гистограмма также позволяет выявлять проблемные места. К примеру, что может означать этот высокий « пик » в начале правой части гистограммы?

Обычно это указывает на то, что изображение переэкспонировано. Высокий подъем выходит за установленные пределы, потому что на фотографии слишком большая область превратилась в белый цвет без какой-либо информации. Чтобы увидеть это на изображении, давайте сравним рубашку жениха. Слева правильно экспонированное фото, на котором видны все детали. Справа размещено переэкспонированное ( или пересвеченное ) фото, где белые оттенки превратились в сплошное белое полотно.

Обратите внимание на то, сколько деталей рубашки утеряно:

Применяем гистограмму для выявления проблем - 2

Превышение предельного уровня яркости приводит к потере деталей снимка

Это говорит о том, что снимок недоэкспонирован, и многие области стали сплошным черным полотном, потеряв детали. Чтобы рассмотреть дефект на фотографии, давайте сравним волосы жениха на двух снимках. Слева у нас снова снимок с хорошей экспозицией, на котором просматриваются все нужные детали. Справа многие детали теряются ввиду того, что многие области превратились в « полотно »:


Недостаточный уровень яркости темных областей приводит к потере деталей и делает их черными

Сколько в гистограмме уровней яркости?

Теперь вы знаете, что гистограмма отображает тональный диапазон изображения от полностью черного до полностью белого цвета. Но сколько всего тонов в гистограмме? Гистограмма вмещает в себя 256 уровней яркости для каждого из этих « столбиков ». Но бывает и так, что столбик вообще не отображается на гистограмме.

Если сильно приблизить график гистограммы, то можно увидеть, что на самом деле он неплавный, и состоит из отдельных столбиков. Каждый пик представляет собой вершину отдельного вертикального столбика. Если просматривать гистограмму с полным спектром в градации серого, то при подсчете столбиков вы получите именно число 256:

В гистограмме для каждого из 256 уровней яркости используется отдельный столбик

Почему 256? Для людей требуется как минимум 200 уровней яркости, чтобы видеть картинку плавной. Если в самом начале градации будет резкий перепад, то переходы между тонами будут слишком заметными для нашего глаза. Это объясняет, почему уровней должно быть как минимум 200. Но почему 256?

Все, что нам действительно важно знать, это что гистограмма отображает диапазон из 256 возможных уровней яркости от черного к белому. Вы даже можете посчитать их на градации под гистограммой в окне « Уровни ». С левой стороны у нас 0, олицетворяющий чистый черный цвет. С правой стороны число 255, отвечающее за белый цвет. Но почему исчисление идет от 0 до 255, а не от 1 до 256? Потому что люди начинают счет от 1, а компьютеры – от 0.

Цифры под гистограммой отражают черный (0) и белый (255) цвета, а между ними еще 254 уровня

В сегодняшнем руководстве мы научились читать гистограммы и понимать разницу между переэкспонированным и недоэкспонированным изображением. Мы воспользовались окном « Уровни » в Photoshop для визуализации тонального диапазона на гистограмме, где слева отображается черный цвет, а справа – белый, а также градация от теней к полутонам и светлым тонам.

Мы также ознакомились с наглядным примером гистограммы снимка с правильной экспозицией, на котором присутствует вся градация уровней яркости. Однако это не всегда нужный результат, бывают случаи, когда нужно сделать акцент на тенях или на светлых областях, чтобы придать снимку определенное настроение.

В нашем следующем руководстве «Учимся понимать гистограммы: фотографии с низким и высоким ключом» мы рассмотрим примеры как раз таких случаев, а также постараемся объяснить, почему не существует «идеальной» или «универсальной» гистограммы.

Что дает нам представление о тональном диапазоне?

Изображения с низким контрастом вряд ли кому-то понравятся. Гистограмма дает нам возможность работать с яркостью отдельных групп пикселей и работать с изображением в области теней и света. Свет и тени — это визуальные критерии, нехватка каждого из которых делает наше изображение менее детальным.

Что покажет гистограмма?

  • Изучив гистограмму, можно получить общее представление о правильности экспозиции, контрасте и цвете снимка.
  • С помощью гистограммы можно определить, имеет ли изображение достаточно деталей для эффективной коррекции.
  • Гистограмма позволяет определить тип ключа изображения. На изображениях в низком ключе детали концентрируются в тенях. Фотография в высоком ключе содержит больше всего деталей в светлых участках. В средних тонах детали концентрируются на изображениях в среднем ключе.

Фотография с полным тональным диапазоном содержит определенное число пикселей во всех областях. Как правило, в таком изображении мало совсем тёмных и совсем ярких пикселей. По мере приближения к средним тонам, количество пикселей в изображении увеличивается. Такой снимок можно получить при достаточном освещении, влияющем на всю сцену, и отсутствии источников света в кадре.

Гистограмма изображения и коррекция тона и цвета инструментом «Уровни»

Изображение с полным тональным диапазоном

Гистограмма помогает выполнить коррекцию тона инструментом «Уровни» в программе Adobe Photoshop

Коррекция «Уровни» в программе Adobe Photoshop используется для изменения соотношения светлых и темных участков изображения путем регулировки визуальных маркеров на гистограмме.

Смещение маркеров приводит к изменению соотношения светлых и темных пикселей в изображении. Сближение черного и белого маркеров увеличивает контрастность изображения.

Коррекция цвета инструментом «Уровни»

В недавнем уроке мы выяснили, что такое график гистограммы и как по нему оценить яркость изображения, правильность экспозиции. Сегодня перед нами стоит более сложная задача — разобраться с гистограммами каналов и научиться использовать гистограмму в обработке изображений.

Наверняка у вас так бывало: вы делаете кадр, и сначала он вам очень нравится как по цветам, так и по яркости. Но через некоторое время, вернувшись к этому снимку, вы понимаете, что и с яркостью на нём есть проблемы и вообще он какой-то тусклый, да и цвета странные. Всё потому, что ваше визуальное восприятие снимка зависит от множества внешних факторов: от освещения, при котором вы смотрите на изображение, от фона, на котором оно находится. Да даже от вашего настроения. Также свои коррективы в восприятие снимка будет вносить техника: на разных дисплеях фото может выглядеть по-разному. Откройте один и тот же кадр на экране компьютера и на дисплее мобильного телефона — почти наверняка они будут немножко различаться.

График гистограммы — это мощный инструмент для контроля технического качества фотографий. Он позволит вам меньше зависеть от причуд собственного восприятия и несовершенства дисплеев, с которыми вы работаете.

Но с помощью гистограммы можно не только оценивать качество снимков. Она лежит в основе двух очень эффективных инструментов обработки изображения, с которыми вы можете столкнуться в любом графическом редакторе. Эти инструменты называются Уровни и Кривые. Как только одним инструментом отредактировать и яркость, и контраст, и цвета на изображении? И в чём отличие кривых от уровней? Давайте узнаем!

Яркость и цвета на гистограмме. Гистограмма RGB

Мы помним, что по гистограмме яркости можно оценить лишь экспозицию кадра, увидеть, есть ли на снимке потери деталей в светлых и тёмных участках. Но ведь это далеко не всё, что мы хотим знать о техническом состоянии кадра. Кадр — это не только яркость, но ещё и цвет. Оценить цвета позволяет другой тип гистограммы — RGB. C помощью гистограммы RGB мы можем увидеть график как для каждого из цветовых каналов изображения (основных его цветов — красного, зелёного и синего), так и суммарную гистограмму для всех каналов сразу.

Удобно, что гистограмму RGB можно увидеть не только в каких-то компьютерных программах (о них речь будет чуть ниже), но даже на экране вашей фотокамеры. Это позволит уже при съёмке контролировать яркость снимка и цвета.

Гистограмма и обработка изображения

Как отображается гистограмма RGB?

Отображение общей гистограммы для каждого канала отдельно, а также общего графика в фотокамере Nikon D810.

Отображение общей гистограммы для каждого канала отдельно, а также общего графика в фотокамере Nikon D810.

Вид представления RGB-гистограммы на едином графике. Гистограммы каждого из каналов окрашены в свои цвета. Программа Nikon Capture NX-D, в которой сделан этот скриншот, может представлять гистограммы как на едином графике, так и выводить отдельно каждый канал. Кстати, это гистограмма кадра с прудом, который вы видели чуть выше.

Вид представления RGB-гистограммы на едином графике. Гистограммы каждого из каналов окрашены в свои цвета. Программа Nikon Capture NX-D, в которой сделан этот скриншот, может представлять гистограммы как на едином графике, так и выводить отдельно каждый канал. Кстати, это гистограмма кадра с прудом, который вы видели чуть выше.

Зачем нужно контролировать цвета по гистограмме? Вспомним, что на гистограмме яркости отлично видны потери деталей в светлых и тёмных участках: когда вплотную к границам поля графика определяются пики, а также тогда, когда весь график «наплывает» на левую или правую границу поля.

Потеря деталей в тёмных участках.

Потеря деталей в тёмных участках.

Потеря деталей в светлых участках.

Потеря деталей в светлых участках.

А ведь потеря информации может произойти и в каком-то из цветовых каналов. Это грозит тем, что, допустим, на розе вместо красивых лепестков с разными оттенками красного будут просто красные пятна, лишённые всяческих деталей. Это негативно скажется на восприятии снимка зрителем. Особенно это актуально при съёмке в JPEG, но и для RAW, где при обработке можно «вытянуть» многое, но не всё, тоже будет полезно.

Такого рода потери очень часто происходят во время обработки изображения при неосторожном повышении насыщенности или контраста.

Кадр и гистограмма красного канала.

Кадр и гистограмма красного канала.

Потери информации в красном канале нет.

Потери информации в красном канале нет.

Произошла потеря информации в красном канале. Самые яркие красные участки превратились в пятна, лишённые деталей.

Произошла потеря информации в красном канале. Самые яркие красные участки превратились в пятна, лишённые деталей.

На графике гистограммы заметен пик на правой границе поля.

На графике гистограммы заметен пик на правой границе поля.

Гистограмма и обработка изображения

Инструмент Уровни (Levels)

Это простейший инструмент для работы с гистограммой. Он подойдёт как начинающим, так и опытным пользователям в тех случаях, когда необходимо внести быстрые и простые коррекции. Рассмотрим Уровни из Adobe Photoshop. Инструмент Levels вызывается через меню Edit - Adjustments - Levels. Кстати, вызвать его также можно сочетанием клавиш Ctrl+L.


Как видим, перед нами предстал график гистограммы с тремя ползунками под ним. Левый ползунок показывает, где начинается чёрный цвет на фото: всё, что правее него, светлее чёрного. Правый ползунок отвечает за уровень белого: всё, что левее него, темнее белого. Средний ползунок отвечает за уровень полутонов.

Я специально открыл неконтрастный снимок: по его гистограмме видно, что в тёмных и светлых участках никакой информации нет. Оттого и фотография не контрастна. Попробуем подвинуть уровни белого и чёрного в те места, где начинается непосредственно сам график гистограммы.


Мы видим, что контраст увеличился, но вот снимок выглядит темноватым. Самое время подвинуть ползунок, отвечающий за полутона. Не мудрствуя, поставлю его туда, где виден самый высокий пик гистограммы.


Итак, мы увеличили контраст кадра и чуть-чуть прибавили ему яркости. Безусловно, фотографию можно редактировать и дальше. Но пока обратим внимание на три «пипетки», находящиеся справа от графика гистограммы. С их помощью вы можете указать на фото, что считать чёрным (указать «точку чёрного», как говорят профессионалы) — для этого предназначена пипетка чёрного цвета. Пипеткой серого цвета можно установить уровень полутонов, а белой пипеткой мы можем показать, что на фото считать белым (самым ярким!). Но важно помнить, что на фотографии могут отсутствовать чисто чёрные, чисто серые и чисто белые объекты, а значит эти пипетки применимы далеко не всегда. Вы можете их попробовать в работе на собственных кадрах.

Не забудем о том, что мы работаем не просто с гистограммой яркости, а с гистограммой RGB, и перед нами — суммарный график всех трёх цветовых каналов. Кроме общего графика, мы можем работать и с каждым каналом отдельно, настраивая не только яркость и контраст, но и цвета на фото. Канал можно выбрать в меню Channel (Канал) над графиком гистограммы.

Тем же образом, каким мы редактировали общие уровни, попробуем настроить их для каждого канала по отдельности. Такой подход даст, с одной стороны, больше контроля над гистограммами каждого из каналов, а с другой стороны — большую творческую свободу в настройке цветового решения кадра.


Я сознательно сместил ползунок полутонов в красном и голубом канале, чтобы усилить вечернюю атмосферу кадра.

Но, как всегда, недоэкспозиция «лечится» гораздо охотнее, нежели переэкспозиция.

Но, как всегда, недоэкспозиция «лечится» гораздо охотнее, нежели переэкспозиция.

А что делать, если необходимо не просто повысить уровень красного на фото, а увеличить количество красных оттенков, скажем, только в светлых участках кадра? Тут нам на помощь придёт инструмент Curves (Кривые). Его отличие от уровней в том, что он позволяет вносить более глубокие и точные регулировки в гистограмму, а не только крутить туда-сюда уровни белого, чёрного и полутонов. Особенно хорошо вы почувствуете превосходство кривых на уровнями, попробовав с ними работать. Так что не будем откладывать в долгий ящик — откроем инструмент Кривые. Находится он в том же меню, что и Уровни: Edit - Adjustments - Curves. Вызвать его можно и сочетанием клавиш Ctrl+M. Также кривые очень удобно применять в качестве корректирующего слоя, но об этом — в другой раз. Откроем инструмент Curves.


Справа и слева на графике гистограммы — уже знакомые нам уровни чёрного и белого. А на самой гистограмме мы видим идущую по диагонали линию. Мы можем свободно изменять её форму, избирательно корректируя ту или иную область на гистограмме. Чтобы менять форму кривой, для начала необходимо поставить на ней контрольную точку: просто кликните мышкой на нужную область кривой.

Попробуем этот приём на практике. Повысим контраст снимка не с помощью инструмента Уровни, а путём коррекции самой кривой. Для этого понизим яркость тёмных оттенков и повысим яркость светлых. Придадим кривой S-образную форму.


S-образная кривая — самый распространённый вид кривой, который очень часто используют для повышения как общего контраста, так и при работе с каждым из каналов.

Несмотря на заходящее солнце, кадр выглядит бледновато. Виной тому — сильная дымка в воздухе. Попробуем придать кадру более эффектное, закатное настроение. Сначала откроем кривую для красного канала. Делается это точно так же, как и в уровнях: через меню, находящееся над графиком гистограммы.


Теперь добавим больше красного оттенка в светлых участках кадра. Для этого поставим контрольную точку на кривой в том месте, где находятся светлые тона (правая часть графика) и поднимем её повыше. Чтобы снимок не стал красным, как помидор, оставим тени такого же цвета, какими они и были. Для этого просто не дадим повышаться красному цвету в тенях. Поставим точку в «теневой» области гистограммы и снизим её до прежнего уровня.


Кадр наконец заиграл красками. Теперь можно пройтись и по другим каналам, экспериментируя с формой кривых и подбирая наиболее выразительное решение.


Все регулировки кривых, которые вы использовали, будут отображены соответствующим цветом на общем графике RGB. Такой конечный результат получился у меня.

Nikon D810 / Nikon 85mm f/1.4D AF Nikkor

Nikon D810 / Nikon 85mm f/1.4D AF Nikkor

Безусловно, кадр можно редактировать и далее, другими инструментами. А можно и по-другому обработать его с помощью кривых. Каждый читатель имеет возможность самостоятельно поработать с этим кадром и оставить в комментариях итоговое изображение с описанием того, как он добился своего результата.

Гистограмма распределения - это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа


Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Перед тем как анализировать полученный результат - отсортируйте исходный массив данных .

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно - максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .


Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.


Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.


Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).


Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.


В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество - 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() - Подсчет ЧИСЛОвых значений в MS EXCEL .

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .


В итоге можно добиться вот такого результата.

Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .


Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

Читайте также: