Как построить ящик с усами в excel

Обновлено: 07.07.2024

Диаграмма "ящик с усами" показывает распределение данных по квартилям, выделяя их выбросы. В полях могут быть линии, протянутые вертикально под названием "усы". Эти линии указывают на отклонение за пределами верхнего и нижнего квартилей, и любая точка за пределами этих линий (усов) считается выбросом.

Диаграмма "ящик с усами" чаще всего используется в статистическом анализе. Например, с помощью нее можно сравнить результаты медицинских испытаний или экзаменационные баллы учащихся.

Пример поля и диаграмма "ящик с усами"

Создание диаграммы "ящик с усами"

Выделите данные (один или несколько рядов).

Значения на изображении ниже являются частью набора данных, на основе которого был создан показанный выше образец диаграммы.

В Excel выберите команды Вставка > Вставить диаграмму статистики > Ящик с усами, как показано на рисунке ниже.

Важно: В Word, Outlook и PowerPoint порядок действий немного другой.

На вкладке Вставка в группе Иллюстрации нажмите кнопку Диаграмма.

В диалоговом окне Вставка диаграммы на вкладке Все диаграммы выберите элемент Ящик с усами.

Тип диаграммы "ящик с усами" на вкладке "Вставка" в Office 2016 для Windows

На вкладках Конструктор и Формат можно настроить внешний вид диаграммы.

Если они не отображаются, щелкните в любом месте диаграммы "ящик с усами", чтобы добавить на ленту область Работа с диаграммами.

Параметры диаграммы "ящик с усами"

Щелкните правой кнопкой мыши одно из полей на диаграмме, чтобы выбрать его, а затем в контекстном меню выберите пункт Формат ряда данных.

В области Формат ряда данных, выбрав Параметры ряда, внесите необходимые изменения.

(Руководствуйтесь информацией в таблице под приведенным ниже рисунком.)

Область задач "Формат ряда данных", в которой показаны параметры диаграммы "ящик с усами" в Office 2016 для Windows

Параметр ряда

Ширина зазора

Управление зазором между категориями.

Показывать внутренние точки

Отображение точек данных между верхней и нижней усами. .

Показывать точки выбросов

Отображает точки выбросов, которые находятся ниже линии верхней или нижней точки уса. .

Показывать маркеры медиан

Отображение маркеров медианы выбранного ряда.

Показывать линию медиан

Отображение линии, соединяющей медианы блоков в выбранном ряде.

Вычисление квартилей

Выберите метод вычисления медиан.

Инклюзивная медиана Медиана включается в вычисления, если N (число значений в данных) — нечетное число.

Исключающая медиана Медиана исключается из вычислений, если N (число значений в данных) — нечетное число.

Совет: Дополнительные сведения о диаграммах "ящик с усами", а также их пользе для визуализации статистических данных см. в этой записи о гисторамме, диаграммах Парето и "ящик с усами" блога группы разработчиков Excel. Дополнительные сведения о других новых типах диаграмм приведены в этой записи блога.

Создание диаграммы "ящик с усами"

Выделите данные (один или несколько рядов).

Значения на изображении ниже являются частью набора данных, на основе которого был создан показанный выше образец диаграммы.

Значок статистической диаграммы

На ленте на вкладке "Вставка" щелкните (значок статистической диаграммы) и выберите "Ящик с усами".

На вкладке "Конструктор диаграмм" и "Формат" можно настроить внешний вид диаграммы.

Если вкладки "Конструктор диаграмм" и "Формат" не вы видите, щелкните в любом месте диаграммы "ящик с усами", чтобы добавить их на ленту.

Параметры диаграммы "ящик с усами"

Щелкните одно из полей на диаграмме, чтобы выбрать его, а затем на ленте нажмите кнопку "Формат".

Внести нужные изменения можно с помощью инструментов на вкладке "Формат".

Раньше я такие видел только в специализированных ПО, типа STATISTICA, и для того, чтобы нарисовать подобную диаграмму в Excel, нужно было изрядно потрудиться. Теперь она есть в стандартном наборе Excel.

Диаграмма ящик с усами на ленте Excel 2016

Зачем нужна такая диаграмма? Допустим, есть выборка для анализа. А еще лучше несколько выборок, которые нужно сравнить. Для этого рассчитывают различные показатели. Однако к любому расчету всегда хочется добавить наглядности, чтобы мозг перешел в режим образного представления, а не довольствовался сухими цифрами и формулами. Поэтому основные характеристики ловко изображают на рисунке. Отличным вариантом будет как раз диаграмма «ящик с усами».

Пример двух выборок на диаграмме ящик с усами

На рисунке показан формат по умолчанию. Как видно, сравниваются две выборки путем изображения двух «ящиков с усами».

Что здесь что обозначает?

Крестик посередине – это среднее арифметическое по выборке.

Линия чуть выше или ниже крестика – медиана.

Нижняя и верхняя грань прямоугольника (типа ящика) соответствует первому и третьему квартилю (значениям, отделяющим ¼ и ¾ выборки). Расстояние между 1-м и 3-м квартилем – это межквартильный размах (или расстояние).

Горизонтальные черточки на конце «усов» – максимальное и минимальное значение (без учета выбросов, см. ниже).

Отдельные точки – это выбросы, которые показываются по умолчанию. Если значение выходит за пределы 1,5 межквартильных размаха от ближайшего квартиля, то оно считается аномальным. Их можно скрыть (см. ниже настройки).

Во всей красе «ящик с усами» проявляется при сравнении выборок, в которых данные делятся на категории. Допустим, провели некоторый эксперимент среди мужчин и женщин. Есть данные до и после эксперимента по обоим полам. Для анализа потребуется вычислить различные показатели. А если к этому добавить диаграмму «ящик с усами», то результат будет весьма наглядным.

Анализ выборок с категориями на диаграмме ящик с усами

Отлично видно, что после проведения эксперимента данные по мужчинам в целом уменьшились, а данные среди женщин наоборот, увеличились. Это не значит, что выборки больше не нужно анализировать (сравнивать, проверять гипотезы и т.д.). Но наглядность сильно улучшает понимание. Перейдем к настройкам.

Общий вид диаграммы настраивается стандартно. Можно менять цвет, добавлять подписи и т.д. Для этого есть две контекстные вкладки на ленте (Конструктор и Формат). Но есть настройки, предназначенные специально для этой диаграммы.

Выбираем какой-либо ряд и жмем Ctrl+1. Либо два раза кликаем по какому-нибудь «ящику». Можно через правую кнопку Формат ряда данных…. Справа вылазит панель настроек.

Панель настроек для диаграммы ящик с усами

Рассмотрим по порядку.

Боковой зазор – регулирует ширину ящиков и расстояние между ними.

Показывать внутренние точки. Если поставить галочку, то на оси, где расположены «усы», точками будут показаны все значения. Так хорошо видно распределение внутри групп.

Все точки на диаграмме ящик с усами

Показывать точки выбросов – отражать экстремальные значения.

Выбросы

Выбросы – это точки, выходящие за пределы 1,5 межквартильных размаха.

Показать средние метки – среднее арифметическое (крестики). Стоят по умолчанию, но можно скрыть.

Показать среднюю линию – только для различных категорий. Показывает изменения по категориям.

Изменения в категориях

Если добавить линии, то изменения после эксперимента станут видны еще лучше. В справке написано, что соединяются медианы, но на графике почему-то соединяются средние. Чудеса.

Инклюзивная медиана или эксклюзивная медиана. Инклюзивная медиана включает в «ящик» квартильные значения , а эксклюзивная медиана не включает. При выборе «эксклюзивной медианы» верх и низ «ящика» соответствует средней между квартильным и следующим (от центра) значением. По умолчанию стоит «эксклюзивная». Пусть стоит дальше. Причем тут медиана, вообще не понял, – речь ведь про квартиль. Думал, криво перевели, но в английской версии те же названия. В общем, здесь лучше ничего не менять.

Как показано в ролике ниже, все делается очень быстро и просто.

Чтобы для заданной выборки построить в MS EXCEL классическую блочную диаграмму (иногда она называется Диаграмма размаха или Ящик с усами, англ . box plot, box-and-whiskers diagram) необходимо предварительно вычислить пять показателей: медиану выборки , 1-й и 3-й квартиль , а также минимальное и максимальное значение.

Примечание : Определение квартилей дано в статье Квартили и интерквартильный интервал (IQR) в MS EXCEL . Там же показано как их вычислять в MS EXCEL.

Блочная диаграмма используется для оценки разброса значений в небольших выборках или для сравнения нескольких выборок .

Примечание : Характеристикой разброса значений в выборке является также дисперсия и стандартное отклонение .

Блочная диаграмма может быть полезна, когда количества значений в выборке недостаточно для построения полноценной гистограммы.


Построим блочную диаграмму с помощью Гистограммы с накоплением .

СОВЕТ : Для начинающих пользователей EXCEL советуем прочитать статью Основы построения диаграмм в MS EXCEL , в которой рассказывается о базовых настройках диаграмм, а также статью об основных типах диаграмм .

Примечание : Блочная диаграмма может строиться как вертикально (см. рисунок выше), так и горизонтально (см. ниже).

Для построения блочной диаграммы нам потребуются 5 наборов значений в строках 45-78 файла примера , лист Box-plot.


При вертикальном расположении нижняя сторона блока (ящика) соответствует Q1 (первому квартилю ), а верхняя сторона – Q3 (третьему квартилю ). Соответственно, высота блока равна интерквартильному размаху IQR . Линия внутри блока соответствует медиане (Q2).

Примечание : Чтобы вычислить квартили используйте функцию КВАРТИЛЬ.ВКЛ() .

Если для построения самого блока используется Гистограмма с накоплением , то для усов используются вертикальные планки погрешностей . Усы сверху и снизу блока заканчиваются соответственно максимальным и минимальным значением из набора.


Чтобы построить нижний ус необходимо выделить нижнюю (невидимую) часть гистограммы (см. рисунок выше). Затем, во вкладке Макет в группе Анализ выбрать команду Планки погрешностей , и, наконец, после раскрытия подменю, пункт Дополнительные параметры планок погрешностей … После этого откроется диалоговое окно.


Установите направление «Минус», выберите пользовательскую величину погрешности и нажмите кнопку Укажите значение . В появившемся окне, в поле Отрицательное значение ошибки, введите ссылку на ячейки содержащие разность значений Q1 и минимальных значений для каждого набора данных.

Для верхнего уса нужно проделать подобные действия, предварительно выделив часть гистограммы соответствующую верхней части блока.

Теперь, используя блочную диаграмму, попытаемся сравнить несколько наборов данных.

Предположим, что необходимо сравнить 5 различных ресторанов по доставке пиццы. В каждом ресторане было сделано по 30-20 заказов, а срок доставки пиццы фиксировался в таблице (в минутах). Пусть наши 5 блочных диаграмм соответствуют этим 5 наборам значений.


Для примера сравним первые 2 ресторана ( выборка №1 и №2).

Очевидно, что второй ресторан справляется гораздо лучше второго: типичное время доставки 1-го ресторана ( медиана ) чуть больше 60 минут, а у второго только 20. Кроме того, IQR (высота блока, соответствующая разбросу значений) у второго ресторана в несколько раз меньше, то есть его срок доставки гораздо более предсказуем, чем у первого. Очевидно, что сравнивать рестораны, используя блочные диаграммы, гораздо проще, чем анализировать данные непосредственно в таблице.

В файле примера также построены Блочная диаграмма с подписями и Блочная диаграмма с горизонтальным размещением .


Блочная диаграмма с подписями построена с помощью обычной гистограммы с группировкой (использованы ряды с перекрытием).

Кроме того, на диаграмме в качестве целевого значения, выведена горизонтальная линия (зеленая). Это целевое значение можно использовать в качестве порога: если типичное значение выборки ниже или выше порогового значения, то соответствующий объект не соответствует некому требованию.


Горизонтальное размещение диаграмм построено на основе диаграммы Линейчатая с группировкой .

Примечание : В файле примера для удобства написания формул использована функция ДВССЫЛ() . Подробнее об этой функции можно прочитать в статье Функция ДВССЫЛ() в MS EXCEL .

Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки

Диаграмма Ящик с усами (англ. Box and Whisker Chart, Box Plot) обычно используется для отображения статистического анализа. К сожалению, Excel не может строить такие диаграммы, но вы можете создать свою диаграмму ящик с усами с помощью гистограммы и планок погрешностей. Данная статья посвящена тому, как построить вертикальный Box Plot в Excel 2013.

Подготовка данных

Чтобы лучше понять материал и работать с одними и теми же цифрами, скачайте книгу Excel с примером Диаграмма ящик с усами.xlsx.

Данные, используемые в примере имеют нормальное распределение со средним значением равным 10 и стандартным отклонением равным 5-ти. Данные имеют четыре столбца по 20 значений.

Все значения положительные, так как при смешанном (положительные и отрицательные значения) виде, данная методика требует некоторых модификаций.

91-2-Данные для boxplot

Прежде чем начать строить диаграмму, нам необходимо произвести некоторые расчеты и подготовить данные. Для этого вставьте пустые строки над массивом и заполните заголовки показателями, которые потребуются для построения диаграммы, как показано на рисунке.

91-3-подготовка данных для boxplot

Для начала рассчитаем некоторые простые статистические меры, такие как количество значений, среднее и стандартное отклонение. Формулы, используемые для расчетов отображены на рисунке ниже.

91-4-данные для boxblop

Теперь рассчитаем минимум, максимум, медиану, значение первого и третьего квартиля.

91-5-данные для boxblop

Наконец, давайте определим значения, которые станут основой построения. Наша диаграмма имеет коробку второго квартиля, которая отображает разницу между медианой и первым квартилем, значения которых мы рассчитали ранее. Также имеется коробка третьего квартиля – рассчитывается как разница между значением третьего квартиля и медианой. Нижняя часть коробки опирается на первый квартиль. Длина нижних усов равняется значению первого квартиля минус минимальное значение, длина верхних усов – максимум минус значение третьего квартиля.

91-6-данные для boxblop

Построение диаграммы ящик с усами

Выделите заголовок таблицы с расчетами, затем удерживая клавишу Ctrl, выделите три строки содержащие данные Низ, 2Q Коробка и 3Q Коробка. Этот диапазон с несколькими площадями выделен оранжевым на рисунке ниже.

91-7-построение ящика с усами

Во вкладке Вставка перейдите в группу Диаграммы и выберите Вставить гистограмму –> Гистограмма с накоплением.

91-9-Настраиваемый предел погрешностей

Нажимаем OK и получаем диаграмму, имеющую следующий вид.

Теперь необходимо добавить верхние усы. Для этого выделяем ряд данных 3Q Коробка и повторяем действия описанные выше, только теперь в поле Направление панели Формат предела погрешностей устанавливаем маркер Плюс. А в диалоговом окне Натраиваемый предел погрешностей поле Отрицательное значение ошибки оставляем неизменным, а в поле Положительное значение ошибки указываем диапазон B15:E15, который называется Усы+. Жмем ОК и получам следующую диаграмму ящика с усами.

Осталось навести антураж и отформатировать нашу таблицу. Выделяем ряд данных Низ и убираем заливку и границы ряда данных. Для ряда данных 2Q Коробка и 3Q Коробка задаем светло серую заливку и темный контур. Удаляем легенду и название диаграммы.

Добавление среднего значения

Чтобы добавить данные со средним значение к каждому ящику, выделите ряд под названием Среднее. На картинке выделено голубым.

91-12-данные для среднего

Скопируйте выделенные данные в буфер обмена с помощью сочетания клавиш Ctrl+C. Затем выделите диаграмму и вставьте скопированные данные с помощью клавиш Ctrl+V. У вас должна получиться следующая картинка.

91-13-построение среднего

Щелкните по новому ряду данных правой кнопкой мыши и выберите Изменить тип диаграммы для ряда. В появившемся диалоговом окне Изменение типа диаграммы найдите рад данных Среднее, поменяйте тип диаграммы на Точечная и снимите маркер Вспомогательная ось, если он был установлен.

Наша финальная диаграмма ящик с усами готова. На ней можно увидеть распределение данных от первого до третьего квартиля, медиану и среднее значение.

Читайте также: