Поддерживает ли sas оконные функции

Обновлено: 06.07.2024

SAS разрабатывался в Государственном университете Северной Каролины с 1966 по 1976 год, когда был включен институт SAS. SAS получила дальнейшее развитие в 1980-х и 1990-х годах с добавлением новых статистических процедур, дополнительных компонентов и введения JMP . Интерфейс "укажи и щелкни" был добавлен в версию 9 в 2004 году. Продукт для анализа социальных сетей был добавлен в 2010 году.

СОДЕРЖАНИЕ

Технический обзор и терминология

SAS - это программный пакет, который может добывать, изменять, управлять и извлекать данные из различных источников, а также выполнять их статистический анализ. SAS предоставляет графический пользовательский интерфейс «укажи и щелкни» для нетехнических пользователей и многое другое на языке SAS .

В программах SAS есть шаги DATA, которые извлекают и обрабатывают данные, и шаги PROC, которые анализируют данные. Каждый шаг состоит из серии утверждений.

Шаг DATA содержит исполняемые операторы, которые приводят к тому, что программное обеспечение выполняет действие, и декларативные операторы, которые предоставляют инструкции для чтения набора данных или изменения внешнего вида данных. Шаг DATA состоит из двух этапов: компиляции и выполнения. На этапе компиляции обрабатываются декларативные операторы и выявляются синтаксические ошибки. После этого на этапе выполнения последовательно обрабатывается каждый исполняемый оператор. Наборы данных организованы в таблицы со строками, называемыми «наблюдениями», и столбцами, называемыми «переменными». Кроме того, у каждой части данных есть дескриптор и значение.

Шаг PROC состоит из операторов PROC, которые вызывают именованные процедуры. Процедуры выполняют анализ и составление отчетов по наборам данных для создания статистики, анализа и графиков. Существует более 300 названных процедур, каждая из которых содержит значительный объем программной и статистической работы. Операторы PROC также могут отображать результаты, сортировать данные или выполнять другие операции.

Макросы SAS - это фрагменты кода или переменных, которые кодируются один раз и используются для выполнения повторяющихся задач.

Данные SAS можно публиковать в HTML, PDF, Excel, RTF и других форматах с помощью системы доставки вывода, которая была впервые представлена ​​в 2007 году. SAS Enterprise Guide - это интерфейс SAS, основанный на принципах «укажи и щелкни». Он генерирует код для управления данными или автоматического выполнения анализа и не требует опыта программирования SAS.

Программный пакет SAS состоит из более чем 200 компонентов. Некоторые из компонентов SAS включают:

  • Базовый SAS - Основные процедуры и управление данными
  • SAS / STAT - Статистический анализ
  • SAS / GRAPH - Графика и презентация
  • SAS / OR - Операционные исследования
  • SAS / ETS - Эконометрика и анализ временных рядов
  • SAS / IML - язык интерактивных матриц
  • SAS / AF - Средство приложений
  • SAS / QC - Контроль качества
  • SAS / INSIGHT - интеллектуальный анализ данных
  • SAS / PH - Анализ клинических испытаний
  • Enterprise Miner - интеллектуальный анализ данных
  • Руководство для предприятий - редактор кода на основе графического интерфейса и менеджер проектов
  • SAS EBI - набор приложений бизнес-аналитики
  • SAS Grid Manager - менеджер вычислительной среды SAS grid.

История

Происхождение

Разработка SAS началась в 1966 году после того, как Университет штата Северная Каролина повторно нанял Энтони Барра для программирования своего программного обеспечения для анализа дисперсии и регрессии, чтобы оно могло работать на компьютерах IBM System / 360 . Проект финансировался Национальным институтом здоровья . и изначально предназначалась для анализа сельскохозяйственных данных с целью повышения урожайности сельскохозяйственных культур. К Барру присоединился студент Джеймс Гуднайт , который разработал статистические процедуры программного обеспечения, и они стали руководителями проекта. В 1968 году Барр и Гуднайт интегрировали новые процедуры множественной регрессии и дисперсионного анализа . В 1972 году, после выпуска первой версии SAS, проект лишился финансирования. По словам Goodnight, это произошло потому, что NIH хотел финансировать только проекты с медицинскими приложениями. Гуднайт продолжал преподавать в университете за зарплату в 1 доллар и доступ к мэйнфреймам для использования в проекте, пока в следующем году он не был профинансирован университетскими статистиками Южных экспериментальных станций . Джон Салл присоединился к проекту в 1973 году и внес свой вклад в эконометрику программного обеспечения, временные ряды и матричную алгебру. Еще одна ранняя участница, Кэролл Г. Перкинс, внесла свой вклад в раннее программирование SAS. Джолейн В. Сервис и Джейн Т. Хелвиг создали первую документацию SAS.

Первые версии SAS были названы в честь года их выпуска. В 1971 году SAS 71 был выпущен ограниченным выпуском. Он использовался только на мэйнфреймах IBM и имел основные элементы программирования SAS, такие как этап DATA и наиболее распространенные процедуры на этапе PROC. В следующем году была выпущена полная версия SAS 72, в которой был представлен оператор MERGE и добавлены функции для обработки недостающих данных или объединения наборов данных. В 1976 году Барр, Гуднайт, Салл и Хельвиг вывели проект из штата Северная Каролина и включили его в состав SAS Institute, Inc.

Разработка

SAS был переработан в SAS 76 с открытой архитектурой , допускающей компиляторы и процедуры. Операторы INPUT и INFILE были улучшены, чтобы они могли читать большинство форматов данных, используемых мэйнфреймами IBM. Также добавлено создание отчетов с помощью операторов PUT и FILE. Также была добавлена возможность анализа общих линейных моделей и процедура FORMAT, которая позволяла разработчикам настраивать внешний вид данных. В 1979 году в SAS 79 была добавлена ​​поддержка операционной системы CMS и введена процедура DATASETS. Три года спустя SAS 82 представил ранний макроязык и процедуру APPEND.

SAS версии 4 имел ограниченные возможности, но сделал SAS более доступным. Версия 5 представила полный макроязык, индексы массивов и полноэкранный интерактивный пользовательский интерфейс под названием Display Manager. В 1985 году SAS был переписан на языке программирования Си . Это позволило реализовать архитектуру SAS Multivendor, которая позволяет программному обеспечению работать в UNIX , MS-DOS и Windows . Ранее он был написан на PL / I , Fortran и ассемблере .

В 1980-х и 1990-х годах SAS выпустила ряд компонентов в дополнение к Base SAS. SAS / GRAPH, который производит графику, был выпущен в 1980 году, как и компонент SAS / ETS, который поддерживает эконометрический анализ и анализ временных рядов. Компонент SAS / PH-Clinical, предназначенный для фармацевтических пользователей, был выпущен в 1990-х годах. В 2002 году Управление по санитарному надзору за качеством пищевых продуктов и медикаментов стандартизировало SAS / PH-Clinical для применения новых лекарственных средств. Также были представлены вертикальные продукты, такие как SAS Financial Management и SAS Human Capital Management (тогда они назывались CFO Vision и HR Vision соответственно). JMP был разработан соучредителем SAS Джоном Саллом и группой разработчиков, чтобы воспользоваться преимуществами графического пользовательского интерфейса, представленного в Apple Macintosh 1984 года и впервые выпущенного в 1989 году. Обновленные версии JMP выпускались непрерывно после 2002 г. последний выпуск - 2016 г.

SAS версии 6 использовался на протяжении 1990-х годов и был доступен в более широком диапазоне операционных систем, включая Macintosh , OS / 2 , Silicon Graphics и PRIMOS . SAS представила новые функции через точечные релизы. С 6.06 по 6.09 был представлен пользовательский интерфейс, основанный на парадигме Windows, и добавлена ​​поддержка SQL. Версия 7 представила систему доставки вывода (ODS) и улучшенный текстовый редактор. В последующих выпусках ODS были улучшены. Например, в версии 8 было добавлено больше параметров вывода. Количество поддерживаемых операционных систем было уменьшено до UNIX , Windows и z / OS , а также добавлен Linux . SAS версии 8 и SAS Enterprise Miner были выпущены в 1999 году.

Недавняя история

В 2002 году была представлена ​​программа Text Miner. Text Miner анализирует текстовые данные, такие как электронные письма, на предмет шаблонов в приложениях Business Intelligence. В 2004 году была выпущена версия SAS 9.0, получившая название «Project Mercury» и призванная сделать SAS доступным для более широкого круга бизнес-пользователей. Версия 9.0 добавила настраиваемые пользовательские интерфейсы на основе роли пользователя и установила пользовательский интерфейс «укажи и щелкни» SAS Enterprise Guide в качестве основного графического пользовательского интерфейса (GUI) программного обеспечения. Функции управления взаимоотношениями с клиентами (CRM) были улучшены в 2004 году с помощью SAS Interaction Management. В 2008 году SAS анонсировала Project Unity, предназначенный для интеграции качества данных, интеграции данных и управления основными данными.

SAS Institute Inc против World Programming Ltd - это судебный процесс с разработчиками конкурирующей реализации World Programming System , в которых утверждалось, что они частично нарушили авторские права SAS, реализовав ту же функциональность. Это дело было передано из Высокого суда Соединенного Королевства в Европейский суд 11 августа 2010 года. В мае 2012 года Европейский суд вынес решение в пользу World Programming, установив, что «функциональность компьютерной программы и язык программирования не может быть защищен авторским правом ".

Бесплатная версия была представлена ​​для студентов в 2010 году. В том же году был выпущен SAS Social Media Analytics, инструмент для мониторинга социальных сетей, анализа вовлеченности и настроений . В том же году был представлен SAS Rapid Predictive Modeler (RPM), который создает базовые аналитические модели с помощью Microsoft Excel . В JMP 9 в 2010 году был добавлен новый интерфейс для использования языка программирования R из JMP и надстройка для Excel. В следующем году в рамках партнерства с Teradata и EMC Greenplum стало доступно высокопроизводительное вычислительное устройство . В 2011 году компания выпустила Enterprise Miner 7.1. С октября 2013 года по октябрь 2014 года компания представила 27 продуктов для управления данными и обновила еще 160 продуктов. На глобальном форуме SAS 2015 года компания анонсировала несколько новых продуктов, предназначенных для различных отраслей, а также новое программное обеспечение для обучения.

Дата выхода

С 1972 года у SAS было много выпусков. Начиная с выпуска 9.3, SAS / STAT имеет собственную нумерацию выпусков.

Выпускать Дата Комментарий
72 Январь 1972 г.
76 Июль 1976 г.
79,5 Апрель 1981 г.
82,4 Январь 1983 г.
4.06 Март 1984 г.
5,03 Июль 1986 г.
6.01 Январь 1985 г. ПК DOS
6,03 Март 1988 г.
6.06 Март 1990 г.
6,07 Апрель 1991 г.
6,08 Март 1993 г.
6.09 Октябрь 1993 г.
6.10 Октябрь 1994
6,11 Октябрь 1995 г.
6,12 Ноябрь 1996
7.0 Октябрь 1998
8.0 Ноябрь 1999 г.
8.1 Июль 2000 г.
8,2 Март 2001 г.
9.0 Октябрь 2002 г.
9.1 Декабрь 2003 г.
9.1.3 Август 2004 г.
9.2 Март 2008 г. СТАТИСТИКА 9.2
9,2 м2 Апрель 2010 г. СТАТИСТИКА 9.22
9,3 Июль 2011 г. СТАТИСТИКА 9.3
9,3 м2 Август 2012 г. СТАТ 12.1
9,4 Июль 2013 СТАТУС 12.3
9,4M1 Декабрь 2013 СТАТ 13.1
9,4 м2 Август 2014 г. СТАТУС 13.2
9,4 м3 Июль 2015 г. STAT 14.1
9,4М4 Ноябрь 2016 СТАТИСТИКА 14.2
9,4М5 Сентябрь 2017 г. СТАТУС 14.3
9,4М6 Ноябрь 2018 г. STAT 15.1
9,4М7 Август 2020 г. СТАТ 15.2

Программные продукты

По состоянию на 2011 год самый большой набор продуктов SAS - это линия для сбора информации о клиентах . Многочисленные модули SAS для Интернета, социальных сетей и маркетинговой аналитики могут использоваться для профилирования клиентов и потенциальных клиентов, прогнозирования их поведения, управления и оптимизации коммуникаций. SAS также предоставляет SAS Fraud Framework. Основная функция платформы - отслеживать транзакции в различных приложениях, сетях и партнерах и использовать аналитику для выявления аномалий, указывающих на мошенничество. SAS Enterprise GRC (Governance, Risk and Compliance) обеспечивает моделирование рисков, анализ сценариев и другие функции для управления и визуализации рисков, соблюдения нормативных требований и корпоративных политик. Существует также набор продуктов SAS Enterprise Risk Management, предназначенный в первую очередь для банков и финансовых организаций.

Продукты SAS для мониторинга и управления операциями ИТ-систем вместе именуются SAS IT Management Solutions. SAS собирает данные о производительности и использовании различных ИТ-активов, а затем создает отчеты и анализирует их. Продукты SAS Performance Management объединяют и предоставляют графическое отображение ключевых показателей эффективности (KPI) на уровне сотрудников, отделов и организаций. Пакет продуктов SAS Supply Chain Intelligence предлагается для нужд цепочки поставок, таких как прогнозирование спроса на продукцию, управление распределением и запасами и оптимизация ценообразования. Существует также набор программного обеспечения «SAS for Sustainability Management» для прогнозирования экологических, социальных и экономических последствий и определения причинно-следственных связей между операциями и воздействием на окружающую среду или экосистему.

У SAS есть наборы продуктов для конкретных отраслей, таких как правительство, розничная торговля, телекоммуникации и аэрокосмическая промышленность, а также для оптимизации маркетинга или высокопроизводительных вычислений .

Бесплатное университетское издание

SAS также предлагает бесплатную университетскую версию, которую может загрузить любой желающий для некоммерческого использования. Первое объявление об этом бесплатном университетском издании, похоже, появилось в газетах 28 мая 2014 года.

Сравнение с другими продуктами

В статье 2005 года для Journal of Marriage and Family, в которой сравниваются статистические пакеты от SAS и его конкурентов Stata и SPSS , Алан К. Акок написал, что программы SAS обеспечивают «необычайный диапазон задач анализа данных и управления данными», но их трудно использовать и учиться. Между тем, SPSS и Stata были легче для изучения (с лучшей документацией), но обладали менее способными аналитическими возможностями, хотя их можно было расширить с помощью платных (в SPSS) или бесплатных (в Stata) надстроек. Акок пришел к выводу, что SAS лучше всего подходит для опытных пользователей , в то время как случайные пользователи больше всего выиграют от SPSS и Stata. Сравнение, проведенное Калифорнийским университетом в Лос-Анджелесе , дало аналогичные результаты.

Такие конкуренты, как Revolution Analytics и Alpine Data Labs, рекламируют свои продукты как значительно более дешевые, чем у SAS. В сравнении 2011 года Дуг Хеншен из InformationWeek обнаружил, что стартовые сборы для этих трех компаний одинаковы, хотя он признал, что стартовые сборы не обязательно были лучшей основой для сравнения. Бизнес-модель SAS не так сильно зависит от начальных сборов за свои программы, вместо этого она сосредоточена на доходах от ежегодной абонентской платы.

Принятие

По данным IDC, SAS является крупнейшим держателем доли рынка «продвинутой аналитики» с 35,4% рынка по состоянию на 2013 год. Она является пятым по величине держателем доли рынка программного обеспечения для бизнес-аналитики (BI) с долей 6,9% и крупнейший независимый поставщик. На рынке бизнес- аналитики он конкурирует с такими конгломератами, как SAP BusinessObjects , IBM Cognos , SPSS Modeler , Oracle Hyperion и Microsoft Power BI . Компания SAS была включена в Квадрант лидеров Gartner для инструментов интеграции данных, а также для бизнес-аналитики и аналитических платформ. Исследование, опубликованное в 2011 году в BMC Health Services Research, показало, что SAS использовался в 42,6% анализов данных в исследованиях в сфере здравоохранения на основе выборки из 1139 статей, взятых из трех журналов.

Оконные функции SQL это, пожалуй, самая мистическая часть SQL для многих веб-разработчиков. Нередко встретишь и тех, кто и вовсе никогда о них не слышал. Да что греха таить, я сам продолжительное время не знал об их существовании, решая задачи далеко не самым оптимальным способом.

Оконные функции это функции применяемые к набору строк так или иначе связанных с текущей строкой. Наверняка всем известны классические агрегатные функции вроде AVG , SUM , COUNT , используемые при группировке данных. В результате группировки количество строк уменьшается, оконные функции напротив никак не влияют на количество строк в результате их применения, оно остаётся прежним.

Привычные нам агрегатные функции также могут быть использованы в качестве оконных функций, нужно лишь добавить выражение определения "окна". Область применения оконных функций чаще всего связана с аналитическими запросами, анализом данных.

Из чего состоит оконная функция

Лучше всего понять как работают оконные функции на практике. Представим, что у нас есть таблица с зарплатами сотрудников по департаментам. Вот как она выглядит:


В связи с пандемией коронавируса необходимо оптимизировать расходы путем сокращения сотрудников или понижения их зарплат. Ваш вечнонедовольный директор приходит к вам с просьбой выяснить кто получает больше всего в каждом департаменте. Как поступить? Можно использовать агрегатные функции, в нашем случае MAX , чтобы выяснить максимальную зарплату в каждом отделе:

Результат выполнения запроса:


Чтобы узнать кто эти "счастливчики" на сокращение можно выделить запрос в подзапрос и объединить с исходной таблицей путём JOIN:


Но тут вы вспоминаете, что эту же задачу можно решить, используя оконные функции, которые вы проходили на одной из лекций по SQL в универе в бородатом году. Как? Используя всё ту же агрегатную функцию MAX , задав "окно". Окном в нашем случае будут сотрудники одного департамента (строки с одинаковым значением в колонке department).

Окно задаётся через выражение OVER (PARTITION BY <колонки>), т.е. строки мы как бы группируем по признаку в указанных колонках, конкретно в этом случае по признаку принадлежности к департаменту в компании. Результат запроса:


Чтобы отфильтровать потенциальных кандидатов на сокращение можно выделить запрос в подзапрос:

Результат будет точно таким же как и при объединении. Итак, с чувством собственного величия, ощущая себя цифровым палачом вы отправляете результат своему начальнику. Он смотрит на вывод и говорит, что у Аркадия из IT отдела зарплата 300 000, но другой сотрудник в этом же отделе может получать 295 000, разница между ними будет несущественна. Покажи мне пропорцию зарплат в отделе относительно суммы всех зарплат в этом отделе, а также относительно всего фонда оплаты труда!

Как решать? Можно пойти тем же путём, используя подзапросы:


На этой таблице видно, что зарплата Нины это 71% расходов на HR отдел, но лишь 10.5% от всего ФОТ, а вот Аркадий выделился, конечно. Его зарплата это 41% от зарплаты всего IT отдела и 21% от всего ФОТ! Идеальный кандидат на сокращение 😈 Но не кажется ли вам, что SQL запрос малость сложный? Давайте попробуем его написать через оконные функции:

Кратко, понятно, содержательно! Выражение OVER() означает, что окном для применения функции являются все строки, т.е. SUM(gross_salary) OVER() , означает что сумма будет посчитана по всем зарплатам независимо от департамента в котором работает сотрудник.

Что дальше

В примере выше мы использовали исключительно агрегатные функции как оконные, но в стандарте SQL есть исключительно оконные функции, которые невозможно использовать как агрегатные, это значит, что их невозможно применить при обычной группировке. Вот лишь часть оконных функций, доступных в PostgreSQL:

  • first_value
  • last_value
  • lead
  • lag
  • rank
  • dense_rank
  • row_number

Со всеми доступными оконными функциями можно ознакомиться в официальной документации PostgreSQL.

Использование оконных функций

В задаче определения самого высокооплачиваемого сотрудника мы использовали агрегатные функции MAX , SUM , давайте рассмотрим чисто оконную функцию first_value . Она возвращает первое значение согласно заданного окна, т.е. применимо к нашей задаче она должна вернуть имя сотрудника у которого самая высокая зарплата в департаменте.

last_value делает то же самое только наоборот, возвращает самую последнюю строчку. Давайте найдём с помощью неё самого низкооплачиваемого сотрудника в департаменте.


Если внимательно взглянуть на результат выполнения запроса, то можно понять, что он неверный. Почему? А потому что мы не указали диапазон/границы окна относительно текущей строки. По умолчанию, если не задано выражение ORDER BY внутри OVER , то границами окна являются все строки, если ORDER BY задан, то границей для текущей строки будут все предшествующие строки и текущая, в терминах SQL это ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW . В этом можно убедиться, если внимательно взглянуть на результат выполнения крайнего запроса.

Визуально это выглядит примерно как на картинке ниже.


   

Жесткий диск – это самый ценный компонент в любом компьютере. Ведь на нем хранится информация, с которой работает компьютер и пользователь, в том случае, если речь идет о персональном компьютере. Человек, каждый раз садясь за компьютер, рассчитывает на то, что сейчас пробежит экран загрузки операционной системы, и он приступит к работе со своими данными, которые выдаст «на гора» из своих недр винчестер. Если же речь идет о жестком диске, или даже об их массиве в составе сервера, то таких пользователей, которые рассчитывают получить доступ к личным, или же рабочим данным, - десятки, сотни и тысячи. И вся их спокойная работа или же отдых и развлечения зависит от этих устройств, которые постоянно хранят в себе данные. Уже из этого сравнения видно, что запросы к жестким дискам домашнего и промышленного класса предъявляются неравнозначные – в первом случае с ним работает один пользователь, во втором – тысячи. Получается, что второй жесткий диск должен быть надежнее, быстрее, устойчивей первого во много раз, ведь с ним работают, на него надеются множество пользователей. В этой статье будут рассмотрены типы используемых в корпоративном секторе жестких дисков и особенности их конструкции, позволяющие добиться высочайшей надежности и производительности.

SAS и SATA диски – такие похожие и такие разные

До недавнего времени, стандарты жестких дисков промышленного класса и бытового, различались значительно, и были несовместимы – SCSI и IDE, в настоящее время ситуация изменилась – на рынке в подавляющем большинстве находятся жесткие диски стандарта SATA и SAS (Serial Attached SCSI). Разъем SAS является универсальным и по форм-фактору и совместим с SATA. Это позволяет напрямую подключать к системе SAS как высокоскоростные, но при этом небольшой емкости, (на момент написания статьи – до 300 Гб) накопители SAS, так и менее скоростные, но в разы более емкие, накопители SATA (на момент написания статьи до 2 Тб). Таким образом, в одной дисковой подсистеме можно объединить жизненно важные приложения, требующих высокой производительности и оперативного доступа к данным, и более экономичные приложения с более низкой стоимостью в пересчете на гигабайт.

Подобная конструктивная совместимость выгодна как производителям задних панелей, так и конечным пользователям, ведь при этом снижаются затраты на оборудование и проектирование.

То есть, к разьемам SAS можно подключить как SAS устройства, так и SATA, а к разъемам SATA подключаются лишь SATA устройства.

SAS и SATA – высокая скорость и большая емкость. Что выбрать?

SAS-диски, пришедшие на смену дискам SCSI полностью унаследовали их основные характеризующие винчестер свойства: скорость вращения шпинделя (15000 rpm) и стандарты объема (36,74,147 и 300 Гб). Тем не менее, сама технология SAS значительно отличается от SCSI. Коротко рассмотрим основные отличия и особенности:Интерфейс SAS использует соединение «точка-точка» — каждое устройство соединено с контроллером выделенным каналом, в отличие от него, SCSI работает по общей шине.

SAS поддерживает большое количество устройств (> 16384), в то время как интерфейс SCSI поддерживает 8, 16, или 32 устройства на шине.

SAS интерфейс поддерживает скорость передачи данных между устройствами на скоростях 1,5; 3; 6 Гб/с, в то время как у интерфейса SCSI скорость шины не выделена на каждое устройство, а делится между ними.

SAS поддерживает подключение более медленных устройств с интерфейсом SATA.

SAS конфигурации значительно легче в монтаже, установке. Такая система проще масштабируется. Кроме того, SAS винчестеры унаследовали надежность жестких дисков SCSI.

При выборе дисковой подсистемы - SAS или SATA нужно руководствоваться тем, какие функции будут выполняться сервером или рабочей станцией. Для этого нужно определиться со следующими вопросами:

1. Какое количество одновременных разноплановых запросов будет обрабатывать диск? Если большое – Ваш однозначный выбор – диски SAS. Так же, если Ваша система будет обслуживать большое количество пользователей - выбирайте SAS.

2. Какое количество информации будет храниться на дисковой подсистеме Вашего сервера или рабочей станции? Если более 1-1,5 Тб – стоит обратить внимание на систему на базе SATA винчестеров.

3. Каков бюджет, выделяемый на покупку сервера или рабочей станции? Следует помнить, что помимо SAS дисков потребуется SAS контроллер, который тоже нужно учитывать.

4. Планируете ли вы, в последствие, рост объема данных, рост производительности или усиление отказоустойчивости системы? Если да, то Вам понадобиться дисковая подсистема на базе SAS, она проще масштабируется и более надежна.

5. Ваш сервер будет работать с критически важными данными и приложениями – Ваш выбор – SAS диски, рассчитанные на тяжелые условия эксплуатации.

Надежная дисковая подсистема, это не только качественные жесткие диски именитого производителя, но и внешний дисковый контроллер. О них пойдет речь в одной из следующих статей. Рассмотрим диски SATA, какие разновидности этих дисков бывают и какие следует использовать при построении серверных систем.

SATA диски: бытовой и промышленный сектор

SATA диски, используемые повсеместно, от бытовой электроники и домашних компьютеров до высокопроизводительных рабочих станций и серверов, различаются на подвиды, есть диски для использования в бытовой технике, с низким тепловыделением, энергопотреблением, и как следствие, заниженной производительностью, есть диски – среднего класса, для домашних компьютеров, и есть диски для высокопроизводительных систем. В этой статье мы рассмотрим класс винчестеров для производительных систем и серверов.

Эксплуатационные характеристики

HDD серверного класса

HDD desktop класса

Скорость вращения

7,200 об/мин (номинальная)

7,200 об/мин (номинальная)

Объем кэша

32 МБ

32 МБ

Среднее время задержки

4,20 мс (номинальное)

6,35 мс (номинальное)

Скорость передачи данных

Чтение из кэша накопителя (Serial ATA)

максимум 3 Гб/с

максимум 3 Гб/с

Физические характеристики

Емкость после форматирования

1 000 204 МБ

1 000 204 МБ

Емкость

1 ТБ

1 ТБ

Интерфейс

SATA 3 Гб/с

SATA 3 Гб/с

Кол-во доступных пользователю секторов

1 953 525 168

1 953 525 168

Габариты

Высота

25,4 мм

25,4 мм

Длина

147 мм

147 мм

Ширина

101,6 мм

101,6 мм

Вес

0,69 кг

0,69 кг

Ударопрочность

Ударопрочность в рабочем состоянии

65G, 2 мс

30G; 2 мс

Ударопрочность в нерабочем состоянии

250G, 2 мс

250G, 2 мс

Температура

В рабочем состоянии

от -0° C до 60° C

от -0° C до 50° C

В нерабочем состоянии

от -40° C до 70° C

от -40° C до 70° C

Влажность

В рабочем состоянии

относительная влажность 5-95%

относительная влажность 5-95%

В нерабочем состоянии

относительная влажность 5-95%

относительная влажность 5-95%

Вибрация

В рабочем состоянии

Линейная

20-300 Гц, 0,75 g (от 0 до пика)

22-330 Гц, 0,75 g (от 0 до пика)

Произвольная

0,004 g/Гц (10 - 300 Гц)

0,005 g/Гц (10 - 300 Гц)

В нерабочем состоянии

Низкая частота

0,05 g/Гц (10 - 300 Гц)

0,05 g/Гц (10 - 300 Гц)

Высокая частота

20-500 Гц, 4,0G (от 0 до пиковой)

20-500 Гц, 4,0G (от 0 до пиковой)

В таблице представлены характеристики жестких дисков одного из ведущих производителей, в одной колонке приведены данные SATA винчестера серверного класса, в другой обычного SATA винчестера.

Из таблицы мы видим, что диски различаются не только по характеристикам быстродействия, но и по характеристикам эксплуатационным, которые напрямую влияют на продолжительность жизни и успешной работы винчестера. Следует обратить внимание на то, что внешне эти жесткие диски отличаются малозначительно. Рассмотрим, какие технологии и особенности позволяют это сделать :

- Усиленный вал (шпиндель) жесткого диска, у некоторых производителей закрепляется с двух концов, что уменьшает влияние внешней вибрации и способствует точному позиционированию блока головок во время операций чтения и записи.

- Применение специальных интеллектуальных технологий, позволяющих учитывать как линейную так и угловую вибрацию, что уменьшает время позиционирования головок и увеличивает производительность дисков до 60%

-Функция устранения ошибок по времени работы в RAID массивах – предотвращает выпадение жестких дисков из RAID, что является характерной особенностью обычных жестких дисков.

- Корректировка высоты полета головок в совокупности с технологией предотвращения соприкосновения с поверхностью пластин, что приводит к значительному увеличению срока жизни диска.

- Широкий спектр функций самодиагностики, позволяющих заранее предсказать тот момент, когда жесткий диск выйдет из строя, и предупредить об этом пользователя, что позволяет успеть сохранить информацию на резервный накопитель.

-Функции, позволяющие снизить показатель невосстановимых ошибок чтения, что увеличивает надежность серверного жесткого диска, по сравнению с обычными жесткими дисками.

Говоря о практической стороне вопроса, можно уверенно утверждать, что специализированные жесткие диски в серверах «ведут себя» намного лучше. В техническую службу происходит в разы меньше обращений по нестабильности работы RAID массивов и отказам жестких дисков. Поддержка производителем серверного сегмента винчестеров происходит намного оперативнее, чем обычных жестких дисков, в связи с тем, что приоритетным направлением работы любого производителя систем хранения данных является промышленный сектор. Ведь именно в нем находят применение самые передовые технологии, стоящие на страже Вашей информации.

Аналог SAS дисков:

Заказать сборку сервера на базе SAS или аналогом SAS жеских дисков Вы можете в нашей компании "Статус" в Санкт-Петербурге, также, купить или заказать SAS жеские диски в Санкт-Петербурге Вы можете:

sas

SAS (Serial Attached SCSI) - последовательный компьютерный интерфейс, разработанный для подключения различных устройств хранения данных, например, жёстких дисков и ленточных накопителей. SAS разработан для замены параллельного интерфейса SCSI и использует тот же набор команд SCSI.

SAS обратно совместим с интерфейсом SATA: устройства SATA II и SATA 6 Gb/s могут быть подключены к контроллеру SAS, но устройства SAS нельзя подключить к контроллеру SATA. Последняя реализация SAS обеспечивает передачу данных со скоростью до 12Гбит/с на одну линию. К 2017-му году ожидается появление спецификации SAS со скоростью передачи данных 24Гбит/с

SAS сочетает преимущества интерфейсов SCSI (глубокая сортировка очереди команд, хорошая масштабируемость, высокая помехозащищённость, большая максимальная длина кабелей) и Serial ATA(тонкие, гибкие дешёвые кабели, возможность горячего подключения, топология типа «точка-точка», позволяющая достигать большей производительности в сложных конфигурациях) с новыми уникальными возможностями – такими, как продвинутая топология подключения с использованием хабов, именуемых SAS-расширителями (SAS- экспандерами), подключение к одному диску двух SAS-каналов (как для повышения надёжности, так и производительности), работа на одном контроллере дисков как с SAS, так и с SATA-интерфейсом.

В сочетании с новой системой адресации это позволяет подключать до 128 устройств на один порт и иметь до 16256 устройств на контроллере, при этом не требуются какие-либо манипуляции с перемычками и т.п. Снято ограничение в 2 Терабайта на объём логического устройства.

Максимальная длина кабеля между двумя SAS-устройствами –10 м при использовании пассивных медных кабелей.

Собственно под протоколом передачи данных SAS подразумевается сразу три протокола - SSP (Serial SCSI Protocol), обеспечивающий передачу SCSI-команд, SMP (SCSI Management Protocol), работающий с управляющими SCSI-командами и отвечающий, к примеру, за взаимодействие с SAS-расширителями, и STP (SATA Tunneled Protocol), с помощью которого реализована поддержка SATA-устройств.

Производимые в данный момент SAS контроллеры имеют внутренние разъёмы типа SFF-8643 (так же может называться mini SAS HD), но все еще могут встретиться разъемы типа SFF-8087 (mini SAS), на который выведено 4 SAS канала.

Контроллер с четырьмя внутренними портами SFF-8643 и двумя внешними SFF-8644


Контроллер с четырьмя внутренними портами SFF-8643 и двумя внешними SFF-8644

Внешний вариант интерфейса использует разъём SFF-8644, но все еще может встретиться разъем SFF-8088. Он так же поддерживает четыре SAS канала.

SAS контроллеры полностью совместимы с SATA дисками и SATA-корзинами/бэкплейнами – подсоединение обычно осуществляется при помощи кабелей : кабелей SFF-8643 - Multilane SAS/SATA. Кабель выглядит примерно вот так:

SFF-8643


SFF-8643 -> 4 x SAS/SATA

Обычно SAS корзины/объединительные панели (backplane) снаружи имеют SATA-разъёмы и в них всегда можно вставлять обычные SATA диски, поэтому их (такие корзины) обычно и называют SAS/SATA.

Однако существуют реверсивные варианты такого кабеля для подключения бэкплейна с внутренними разъёмами SFF-8087 к SAS-контроллеру, имеющему обычные SATA-разъёмы. Между собой такие кабели невзаимозаменяемы.

SAS диски нельзя подключить к SATA контроллеру или установить в SATA корзину/объединительную панель (backplane).

Отличия в физическом интерфейсе между SAS и SATA-дисками


Отличия в физическом интерфейсе между SAS и SATA-дисками

Для подключения SAS дисков к контроллеру с внутренними разъёмами SFF-8643 или SFF-8087 без использования SAS корзин необходимо использовать кабель типа SFF-8643->SFF-8482 или SFF-8087->SFF-8482 соответственно.

Существующие версии интерфейса SAS (1.0, 2.0, и 3.0) имеют совместимость между собой, то есть диск SAS2.0 можно подключать к контроллеру SAS 3.0 и наоборот. Кроме того будущая версия 24 Gb/s так же будет иметь обратную совместимость.

Читайте также: