Sas business intelligence это

Обновлено: 07.07.2024

As name suggests it’s the Intelligence one gains from the business; about the business.

Typically it is achieved by various Data warehousing, Data mining and reporting tools and techniques.

These tools and techniques help the system to provide right information to right people at right time and right format. So decision makers can more concentrate on their business of making decisions instead of wasting time in digging plies of enterprise data.

How SAS deals with Business Intelligence?

SAS has developed end to end business intelligence solution named as SAS Enterprise Intelligence Platform. It enables the users to extract and transform enterprise wide data into fully integrated reporting warehouse, leading to more usable business data and more effective decision making.

With the way; the platform is structured and the way metadata (The metadata is explored in details at the below sections) is handled; it becomes feasible to represent the single version of truth to the intended users.

SAS stores the data only once which and shares its metadata across all the applications dealing with that data which might be ETL tool trying to update that data or data mining tool trying to dig out that data for some ad-hoc queries or might be reporting tool producing monthly report for the business.

After all what is METADATA?

This question teased me a lot since my college days. Metadata is often referred as ‘data about data’; but I would like to say it as it is nothing but additional information of your data.

Usually many applications which deal with the DATA need some basic information about it from their perspective; for example a database system where you are going to save the data needs to know how user wants the data to be saved? So when you fire a create table command on the database is nothing but you give that information to the database system. In more specific term you define the table structure which is gets recognized as tables Metadata.

In another example when some reporting application needs to produce the weekly report it needs the information about the fields on the report, format of those fields which are going to be represented to the user; what all database tables its going to deal with; in which library or schema they are located etc. etc. All those terms are referring nothing other than metadata.

So it is same with SAS as well; In the context of SAS; metadata is the information about all the resources used in the provision of BI. For example it would be

The name of the column rather than the actual values stored within it.

Information about How to read in data from non SAS location.

Description of report content rather than the actual report itself.

Details of the access rights of all users.

A description of the source and target tables used in data integration jobs; as well as details of all the transformations.

SAS Metadata Repository

It is the location where all this metadata is saved in some specific format.

SAS stores its metadata in centralised repository; which in turn is managed by SAS Metadata Server. This metadata is then shared with all the applications under SAS Open Metadata Architecture. This helps SAS in achieving single storage of data and consistency of the information among all the applications using it.

Не так давно я столкнулся с задачей по переходу на новую BI-систему для нашей компании. Поскольку мне пришлось погрузиться довольно глубоко и основательно в данный вопрос, я решил поделиться с уважаемым сообществом своими мыслями на этот счет.

image


На просторах интернета есть немало статей на эту тему, но, к моему большому удивлению, они не ответили на многие мои вопросы по выбору нужного инструмента и были несколько поверхностны. В рамках 3 недель тестирования мы опробовали 4 инструмента: Tableau, Looker, Periscope/Sisense, Mode analytics. Про эти инструменты в основном и пойдет речь в данной статье. Сразу оговорюсь, что предложенная статья — это личное мнение автора, отражающее потребности небольшой, но очень быстро растущей IT-компании :)

Несколько слов о рынке


Сейчас на рынке BI происходят довольно интересные изменения, идёт консолидация, крупные игроки облачных технологий пытаются укрепить свои позиции путем вертикальной интеграции всех аспектов работы с данными (хранение данных, обработка, визуализация). За последние несколько месяцев произошло 5 крупных поглощений: Google купил Looker, Salesforce купил Tableau, Sisense купил Periscope Data, Logi Analytics' купил Zoomdata, Alteryx купил ClearStory Data. Не будем дальше погружаться в корпоративный мир слияний и поглощений, стоит лишь отметить, что можно ожидать дальнейших изменений как в ценовой, так и в протекционистской политике новых обладателей BI-инструментов (как недавно нас обрадовал инструмент Alooma, вскоре после покупки их компанией Google, они перестают поддерживать все источники данных, кроме Google BigQuery :) ).

Немного теории

Итак, начать я хотел с небольшой теоретической части, ибо куда нынче без теории. Как говорит нам Гартнер, BI система — это термин, объединяющий программные продукты, инструменты, инфраструктуру и лучшие практики, который позволяет улучшать и оптимизировать принимаемые решения [1]. Под это определение попадают в частности и хранение данных и ETL. В рамках данной статьи я предлагаю сосредоточиться на более узком сегменте, а именно на программных продуктах для визуализации и анализа данных.

В пирамиде создания ценности для компании (я имел смелость предложить очередное изложение этой очевидной структуры на Рис. 0) инструменты BI находятся после блоков хранения записей и предварительной обработки данных (ETL).

Это важно понимать — лучшей практикой в данном случае является разделения задач ETL и BI. Помимо более прозрачного процесса работы с данными, вы также не окажетесь привязанными к одному программному решению и сможете подобрать наиболее подходящий инструмент под каждую из задач ETL и BI. При грамотно выстроенном ETL-процессе и оптимальной архитектуре таблиц данных можно в целом закрыть 80% всех насущных вопросов бизнеса без использования специального ПО. Это, конечно, потребует значительного вовлечения аналитиков и DS. Поэтому приходим к главному вопросу: а что нам, собственно, нужно в первую очередь от программного продукта BI?

image


Рис. 0

Ключевые критерии при выборе программного продукта BI

Как мы уже с вами поняли, все ключевые метрики и показатели деятельности компании в целом можно взять напрямую из аналитических таблиц в базе данных, предварительно подготовленных в рамках ETL-процесса (о том, как оптимально построить ETL-процесс, я расскажу в следующей статье, а пока приведу тизер, почему это так важно: по опросу Kaggle, главная сложность, с которой сталкивается половина DS — это грязные данные [2]). Основной проблемой в этом случае, очевидно, будет трудоемкость и неэффективность использования времени аналитиков. Вместо создания полноценного продукта, аналитики/DS будут все свое время готовить показатели, считать метрики, сверять расхождения в цифрах, искать ошибки в SQL-коде и заниматься прочей бесполезной деятельностью. Здесь я убежден, что главное чем должны заниматься аналитики/DS — это создание продукта, приносящего ценность компании в долгосрочной перспективе. Это может быть как расчетный/предиктивный сервис, результат которого — это часть основного продукта компании (например, алгоритм расчета стоимости/времени поездки) или, скажем, алгоритм распределения заказов по клиентам, так и полноценный аналитический отчет, выявляющий причины оттока пользователей и снижения MAU.

Поэтому основным критерием выбора аналитической системы должна быть возможность максимально разгрузить аналитиков от ad hoc-задач и текучки. Как этого можно добиться? По сути, есть два варианта: а) автоматизировать, б) делегировать. Под вторым пунктом я имею ввиду популярное нынче словосочетание Self Service — дать бизнесу возможность копаться в данных самому.

То есть, аналитики настраивают один раз программный продукт: создают кубы данных, настраивают автоматическое обновление кубов (например, каждую ночь), автоматическую отправку отчетов, готовят несколько мастер дашбордов и обучают пользователей, как пользоваться продуктом. Дальше бизнес обеспечивает свои дополнительные потребности самостоятельно, путем расчета необходимых ему показателей в различной агрегацией и фильтрацией данных с помощью простой и понятной опции drag&drop.

Помимо простоты процесса составления отчетов важна также скорость выполнения запросов. Никто не будет ждать 15 минут, пока загрузится предыдущий месяц данных или показатели для другого города. Для решения этого вопроса существует несколько общепринятых подходов. Один из них — это создание OLAP(online analytical processing) кубов данных. В OLAP кубах типы данных разделяются на измерения (dimensions) — это поля, по которым можно делать агрегации (например, город, страна, продукт, временные интервалы, тип оплаты. ), и меры (measures) — это расчетные метрики для измерений (например, количество поездок, выручка, количество новых пользователей, средний чек, . ). Кубы данных — это довольно мощный инструмент, позволяющий очень быстро выдавать результат за счет предварительно агрегированных данных и рассчитанных метрик. Обратной стороной OLAP кубов является тот факт, что все данные заранее собраны и не изменяются до следующей сборки куба. Если вам понадобится агрегация данных или метрика, которая не была изначально рассчитана, или если вам необходимы более свежие данные, то куб данных надо пересоздавать .

Другое решение для повышения скорости работы с данными — это in-memory solutions. In Memory Database (IMDB) разработана для обеспечения максимальной производительности, когда есть достаточно оперативной памяти для хранения данных. В то время как реляционные БД разработаны для обеспечения максимальной производительности, когда данные не полностью помещаются в оперативную память, и медленные операции ввода-вывода на диске должны выполняться в режиме реального времени. Многие современные инструменты объединяют оба этих решения (например, Sisense, Tableau, IBM Cognos, MicroStrategy, и др.).

До этого мы с вами говорили о простоте и удобстве использования инструментов BI для бизнес пользователей. Важно и настроить удобный процесс разработки и релиза дашбордов для аналитиков/DS. Здесь ситуация аналогична любому другому ИТ-продукту — необходим быстрый и удобный процесс развертывания (rapid deployment time), а также продуманность процесса разработки, тестирования, code review, релиза, version control, team collaboration. Все это объединяется понятием workflow.

Таким образом мы приходим к ключевым требованиям к программному продукту BI. Эти же требование легли в основу скор-карты, на основании которой мы в итоге выбрали поставщика продукта.

Таблица 1. Критерии выбора инструмента BI.

Требование Описание Значимость (min=1, max=5)
1 UX + drag&drop Необходим понятный и доступный бизнес-пользователям интерфейс с возможностью drag&drop для создания отчетов 5
2 Data handling Как хранятся и обрабатываются данные системой. Это те самые механики, как OLAP и in-memory solutions, о которых мы говорили выше. Чем быстрее и проще организован доступ к данным — тем лучше. 5
3 Workflow Необходим быстрый и удобный процесс развертывания (rapid deployment time). Также code review, version control, development & release. 5
4 Visualization Набор доступных визуализаций данных. Чем больше различный вариантов представления данных — тем лучше. 4
5 Support Доступность поддержки, SLA на реагирование на запрос. 3
6 Statistics Возможность использования статистических методов, интеграция с Python. 2
7 Price Здесь все понятно, Лебовский :) 4

Итоговая таблица результатов голосования внутри нашей команды выглядит следующим образом:

Таблица 2. Итоги голосования по выбору инструмента BI.

Требование Значимость Tableau Looker Periscope Mode
1 UX + drag&drop 5 4.3 4.6 2.7 2.8
2 Data handling 5 4.4 3.5 3.6 2.3
3 Workflow 5 3.1 4.8 3.8 3.3
4 Visualization 4 3.8 3.7 3.4 2.1
5 Support 3 3.7 4.2 3.8 3.4
6 Statistics 2 2.3 2.2 2.5 2.8
7 Price 4 4 2 4 3
Итого 3.77 3.79 3.43 2.79

Со стороны бизнес-пользователей (они тоже принимали участие в выборе продукта) голоса разделились примерно поровну между Tableau и Looker. В итоге выбор был сделан в в пользу Looker. Почему именно Looker и какие принципиальные различия между инструментами, мы сейчас обсудим.

Детальное описание инструментов

Итак, приступим к описанию BI-инструментов.

Tableau

    UX + drag&drop.
    Tableau довольно старый инструмент, на рынке с 2003 года, и есть ощущение, что интерфейс с тех пор не сильно изменился. Вас могут испугать всплывающие окна и выпадающие опции в стиле Windows XP (Рис. 1, Рис. 2). Но довольно быстро можно привыкнуть и освоить базовую функциональность инструмента. Tableau многим напоминает продвинутую версию Excel, у него есть вкладки (worksheets) и дашборды (Dashboards) — объединение визуализаций, полученных на worksheets. Опция drag&drop довольно простая в использовании, легко настраиваются и меняются фильтры на графиках (Рис. 3, Рис. 4). У Tableau есть две версии услуги: Desktop и Desktop+Online. Desktop более старомодная — это, по-сути, продвинутый Excel. Online версия за период тестирования довольно часто призадумывалась и это иногда заканчивалось обновлением страницы без сохранения вашей работы.


Рис. 1

image


Рис. 2



Рис. 3



Рис. 4

Кубы данных можно настроить на локальной версии Tableau Desktop и загрузить или обновить их на сетевом сервере, в таком случае все дашборды, построенные на предыдущей версии сборки куба автоматически обновятся. Обновление кубов можно настроить автоматически, например, ночью. Все измерения и меры (dimensions and measures) задаются заранее при сборке куба и не меняются до следующей версии сборки. Вместе с использованием кубов данных в Tableau есть возможность обращаться напрямую к базе данных, это называется Live connection, в таком случае скорость будет гораздо ниже, но и данные будут более актуальные. Процесс сборки куба данных довольно простой, главное — выбрать правильные поля для сборки нескольких таблиц (joins) (Рис. 5).

image


Рис. 5

Looker

    UX + drag&drop.
    Looker относительно молодая компания, основана в 2012 году. UX нативно понятный и простой для пользователя, drag&drop реализована удобно (Рис. 7).

image


Рис. 7

image


Рис. 8

image


Рис. 9

image


Рис. 10

image


Рис. 11

Periscope

    UX + drag&drop.
    Periscope довольно простой в использовании инструмент с ограниченной функциональностью. Здесь тоже есть функция drag&drop, но фильтры к разным чартам придется создавать отдельно, что неудобно (Рис. 12). Для создания чуть более сложных запросов без SQL не обойтись.

image


Рис. 13

Mode Analytics

    UX + drag&drop.
    Mode — самый простой из рассмотренных инструментов. Его ключевым отличием является интегрированность с Python и возможность создавать аналитические отчеты на основе Jupyter Notebook (Рис. 14). Если у вас не выстроен процесс создания аналитических отчетов с использованием Jupyter Notebook, то данный инструмент может быть вам полезен. Mode — скорее дополнение к полноценной BI-системе, его функциональность очень ограничена, для целей создания дашбордов можно использовать таблицы не более 27 тысяч строк, что сильно ограничивает возможности инструмента (Рис. 15). В противном случае, вам необходимо писать отдельные SQL-запросы для каждого графика, чтобы агрегировать данные и получить на выходе таблицу меньшей размерности для визуализации (Рис. 16).

image


Рис. 14

image


Рис. 15

image


Рис. 16

Выводы

К выбору провайдера BI инструмента необходимо подойти основательно, заручившись поддержкой со стороны бизнес пользователей и определив основные критерии выбора инструмента (желательно, в виде скор карты). Приведенные в данной статье критерии ориентированы в первую очередь на повышение эффективности работы с данными, упрощение процесса извлечения информации, повышения качества визуализации данных и снижение нагрузки на аналитиков.

Tableau делает анализ данных интуитивно понятным и простым в использовании. С помощью функции перетаскивания вы можете редактировать и создавать свои аналитические диаграммы без глубокого понимания структур данных. Это позволяет людям визуализировать идеи и делиться ими со своими командами.

QlikView — это продукт для самообслуживания, позволяющий пользователям искать и исследовать аналитические приложения. С помощью механизма ассоциативного индексирования данных QlikView пользователи могут легко генерировать идеи, комбинируя различные базы данных в одно нажатие.

SAP Business Objects — это отчетность и анализ BI. Подключается к фоновым ресурсам, которые содержат множество приложений для отчетов. Это позволяет пользователям создавать и внедрять модели прогнозной аналитики для генерации информации и прогнозирования тенденций маркетинга.

IBM Cognos Analytics — это аналитическая платформа самообслуживания, которая включает расширенный интеллект. Интерактивные информационные панели упрощают анализ данных. Он также имеет широкий спектр функций анализа, включая гипотетический анализ, расширенный анализ, аналитическую отчетность и анализ тенденций. Кроме того, Cognos Analytics позволяет пользователям взаимодействовать с информацией со своих мобильных устройств или даже в автономном режиме.

Платформа Microsoft Business Intelligence — это комплексное решение, включающее в себя роль аналитических служб, служб интеграции, служб основных данных, служб отчетов и т. Д. Службы Analysis Services и Reporting Services могут быть установлены как автономные серверы. Они также могут быть фермы SharePoint.

Oracle Business Intelligence 14c — это служба бизнес-аналитики, которая обеспечивает доступ ко всей связанной информации. Сервер будет обслуживать другие требования, включая анализ данных, отчеты и аналитические приложения.

Yellowfin — это набор продуктов, состоящий из BI, анализа данных и отчетности. Пользователи могут генерировать действенные идеи и делиться с коллегами в форме рассказывания историй. Его аналитический пакет состоит из 5 компонентов, включая сигналы, информационные панели, историю, обнаружение данных и подготовку данных. Кроме того, вы можете встроить Yellowfin в свое приложение. И это обеспечивает большую гибкость для настройки.

WebFOCUS — это генератор информации. Это позволяет пользователям создавать панель мониторинга на основе данных, собранных в различных форматах. Он также позволяет пользователям просматривать данные, получать полезную информацию, создавать отчеты и обмениваться результатами с соавторами.

TIBCO Spotfire — это комплексное программное обеспечение BI, обеспечивающее такие функции, как сбор данных, анализ и визуализация. Отличительной особенностью TIBCO является то, что он позволяет пользователям устанавливать свой собственный KPI и отправлять уведомления на iPhone/Android, что делает возможной работу в Windows.

SAS Business Intelligence (SAS BI) является частью решения SAS Enterprise. Программное обеспечение предоставляет аналитику в реальном времени, которая позволяет лицам, принимающим решения, отслеживать свои бизнес-показатели и получать действенную информацию. Программное обеспечение состоит из шести модулей, которые включают Visual Analytics, Visual Statistics, Office Analytics, Enterprise Guide и Enterprise BI Server.

TARGIT Decision Suite является единственной платформой бизнес-аналитики, которая предлагает инструменты визуального обнаружения данных, бизнес-аналитику, отчетность и информационные панели. Это отличный вариант для отчетов о продажах, поскольку он позволяет манипулировать данными несколькими способами. Он подключается к CRM и ERP, что делает весь процесс интерактивным.

От бизнес-отчетов и обнаружения данных до производительности мобильных устройств и телеметрии в режиме реального времени, только MicroStrategy предоставляет организациям полный спектр возможностей, необходимых им для преобразования своих данных в реальный интеллект и перехода к интеллектуальному бизнесу.

Board — это полнофункциональная система бизнес-аналитики, которая объединяет управление производительностью и бизнес-аналитику. Это позволяет пользователям извлекать источники данных и составлять отчеты. Он также имеет многоязычный пакет для многонациональных компаний для предоставления отчетов на другом языке. Благодаря функциям сбора и анализа данных компании могут принимать решения

Компания Sisense получила награду Best Business Intelligence Award за награду Supreme Software Award за 2018 и 2018. Вы можете просматривать данные с панели управления с помощью функции перетаскивания. Преобразование данных в проницательные графики и диаграммы. Он обладает большими возможностями для компаний различных размеров, включая гиганты Fortune 500, такие как Sony, ESPN и даже NASA.

Statsbot позволяет просматривать бизнес-показатели из базы данных SQL без сложной настройки, как другие инструменты BI. Пользователи высоко оценили его легкое подключение к Mixpanel, Salesforce и серверу SQL. В дополнение к этому Statsbot также позволяет использовать такие инженерные методы, как контроль версий и повторное использование кода, для создания чистой и устойчивой логики преобразования ваших данных.

Necto Telecom может раскрыть тенденции, скрытые под данными. Он позволяет настраивать оповещения и уведомления для KPI, что очень удобно для лиц, принимающих бизнес-решения, чтобы не отставать от бизнес-показателей на ходу. Он способен обрабатывать несколько источников данных и объединять их в один. Хороший выбор, если вам нужно создать сложный анализ и отчеты.

Платформа интеллектуального анализа данных InetSoft объединяет моделирование данных в реальном времени и визуализацию данных. Это обеспечивает быструю и итеративную разработку представлений данных, таких как интерактивные информационные панели и отчеты с идеальной точностью до пикселей. Динамические модели данных не только предлагают разработанные представления данных, но также позволяют «гражданским разработчикам» составлять представления данных самообслуживания. Механизм аналитики данных Apache Hadoop / Spark Deployable обеспечивает неограниченный рост для расширенного интеллектуального анализа данных.

Birst — это облачное решение для BI и аналитики, которое объединяет идеи нескольких групп и помогает принимать обоснованные решения. Ваш адаптивный пользовательский интерфейс предоставляет вам множество возможностей для самостоятельного анализа и использования данных.

Domo — это облачная система, поэтому нет необходимости скачивать или устанавливать ее. С Dome вы можете управлять извлечением, преобразованием и загрузкой (ELT) на двигателе. Он также имеет широкий спектр коннекторов приложений, которые позволяют интегрировать данные в помещениях.

SAS разрабатывался в Государственном университете Северной Каролины с 1966 по 1976 год, когда был включен институт SAS. SAS получила дальнейшее развитие в 1980-х и 1990-х годах с добавлением новых статистических процедур, дополнительных компонентов и введения JMP . Интерфейс "укажи и щелкни" был добавлен в версию 9 в 2004 году. Продукт для анализа социальных сетей был добавлен в 2010 году.

СОДЕРЖАНИЕ

Технический обзор и терминология

SAS - это программный пакет, который может добывать, изменять, управлять и извлекать данные из различных источников, а также выполнять их статистический анализ. SAS предоставляет графический пользовательский интерфейс «укажи и щелкни» для нетехнических пользователей и многое другое на языке SAS .

В программах SAS есть шаги DATA, которые извлекают и обрабатывают данные, и шаги PROC, которые анализируют данные. Каждый шаг состоит из серии утверждений.

Шаг DATA содержит исполняемые операторы, которые приводят к тому, что программное обеспечение выполняет действие, и декларативные операторы, которые предоставляют инструкции для чтения набора данных или изменения внешнего вида данных. Шаг DATA состоит из двух этапов: компиляции и выполнения. На этапе компиляции обрабатываются декларативные операторы и выявляются синтаксические ошибки. После этого на этапе выполнения последовательно обрабатывается каждый исполняемый оператор. Наборы данных организованы в таблицы со строками, называемыми «наблюдениями», и столбцами, называемыми «переменными». Кроме того, у каждой части данных есть дескриптор и значение.

Шаг PROC состоит из операторов PROC, которые вызывают именованные процедуры. Процедуры выполняют анализ и составление отчетов по наборам данных для создания статистики, анализа и графиков. Существует более 300 названных процедур, каждая из которых содержит значительный объем программной и статистической работы. Операторы PROC также могут отображать результаты, сортировать данные или выполнять другие операции.

Макросы SAS - это фрагменты кода или переменных, которые кодируются один раз и используются для выполнения повторяющихся задач.

Данные SAS можно публиковать в HTML, PDF, Excel, RTF и других форматах с помощью системы доставки вывода, которая была впервые представлена ​​в 2007 году. SAS Enterprise Guide - это интерфейс SAS, основанный на принципах «укажи и щелкни». Он генерирует код для управления данными или автоматического выполнения анализа и не требует опыта программирования SAS.

Программный пакет SAS состоит из более чем 200 компонентов. Некоторые из компонентов SAS включают:

  • Базовый SAS - Основные процедуры и управление данными
  • SAS / STAT - Статистический анализ
  • SAS / GRAPH - Графика и презентация
  • SAS / OR - Операционные исследования
  • SAS / ETS - Эконометрика и анализ временных рядов
  • SAS / IML - язык интерактивных матриц
  • SAS / AF - Средство приложений
  • SAS / QC - Контроль качества
  • SAS / INSIGHT - интеллектуальный анализ данных
  • SAS / PH - Анализ клинических испытаний
  • Enterprise Miner - интеллектуальный анализ данных
  • Руководство для предприятий - редактор кода на основе графического интерфейса и менеджер проектов
  • SAS EBI - набор приложений бизнес-аналитики
  • SAS Grid Manager - менеджер вычислительной среды SAS grid.

История

Происхождение

Разработка SAS началась в 1966 году после того, как Университет штата Северная Каролина повторно нанял Энтони Барра для программирования своего программного обеспечения для анализа дисперсии и регрессии, чтобы оно могло работать на компьютерах IBM System / 360 . Проект финансировался Национальным институтом здоровья . и изначально предназначалась для анализа сельскохозяйственных данных с целью повышения урожайности сельскохозяйственных культур. К Барру присоединился студент Джеймс Гуднайт , который разработал статистические процедуры программного обеспечения, и они стали руководителями проекта. В 1968 году Барр и Гуднайт интегрировали новые процедуры множественной регрессии и дисперсионного анализа . В 1972 году, после выпуска первой версии SAS, проект лишился финансирования. По словам Goodnight, это произошло потому, что NIH хотел финансировать только проекты с медицинскими приложениями. Гуднайт продолжал преподавать в университете за зарплату в 1 доллар и доступ к мэйнфреймам для использования в проекте, пока в следующем году он не был профинансирован университетскими статистиками Южных экспериментальных станций . Джон Салл присоединился к проекту в 1973 году и внес свой вклад в эконометрику программного обеспечения, временные ряды и матричную алгебру. Еще одна ранняя участница, Кэролл Г. Перкинс, внесла свой вклад в раннее программирование SAS. Джолейн В. Сервис и Джейн Т. Хелвиг создали первую документацию SAS.

Первые версии SAS были названы в честь года их выпуска. В 1971 году SAS 71 был выпущен ограниченным выпуском. Он использовался только на мэйнфреймах IBM и имел основные элементы программирования SAS, такие как этап DATA и наиболее распространенные процедуры на этапе PROC. В следующем году была выпущена полная версия SAS 72, в которой был представлен оператор MERGE и добавлены функции для обработки недостающих данных или объединения наборов данных. В 1976 году Барр, Гуднайт, Салл и Хельвиг вывели проект из штата Северная Каролина и включили его в состав SAS Institute, Inc.

Разработка

SAS был переработан в SAS 76 с открытой архитектурой , допускающей компиляторы и процедуры. Операторы INPUT и INFILE были улучшены, чтобы они могли читать большинство форматов данных, используемых мэйнфреймами IBM. Также добавлено создание отчетов с помощью операторов PUT и FILE. Также была добавлена возможность анализа общих линейных моделей и процедура FORMAT, которая позволяла разработчикам настраивать внешний вид данных. В 1979 году в SAS 79 была добавлена ​​поддержка операционной системы CMS и введена процедура DATASETS. Три года спустя SAS 82 представил ранний макроязык и процедуру APPEND.

SAS версии 4 имел ограниченные возможности, но сделал SAS более доступным. Версия 5 представила полный макроязык, индексы массивов и полноэкранный интерактивный пользовательский интерфейс под названием Display Manager. В 1985 году SAS был переписан на языке программирования Си . Это позволило реализовать архитектуру SAS Multivendor, которая позволяет программному обеспечению работать в UNIX , MS-DOS и Windows . Ранее он был написан на PL / I , Fortran и ассемблере .

В 1980-х и 1990-х годах SAS выпустила ряд компонентов в дополнение к Base SAS. SAS / GRAPH, который производит графику, был выпущен в 1980 году, как и компонент SAS / ETS, который поддерживает эконометрический анализ и анализ временных рядов. Компонент SAS / PH-Clinical, предназначенный для фармацевтических пользователей, был выпущен в 1990-х годах. В 2002 году Управление по санитарному надзору за качеством пищевых продуктов и медикаментов стандартизировало SAS / PH-Clinical для применения новых лекарственных средств. Также были представлены вертикальные продукты, такие как SAS Financial Management и SAS Human Capital Management (тогда они назывались CFO Vision и HR Vision соответственно). JMP был разработан соучредителем SAS Джоном Саллом и группой разработчиков, чтобы воспользоваться преимуществами графического пользовательского интерфейса, представленного в Apple Macintosh 1984 года и впервые выпущенного в 1989 году. Обновленные версии JMP выпускались непрерывно после 2002 г. последний выпуск - 2016 г.

SAS версии 6 использовался на протяжении 1990-х годов и был доступен в более широком диапазоне операционных систем, включая Macintosh , OS / 2 , Silicon Graphics и PRIMOS . SAS представила новые функции через точечные релизы. С 6.06 по 6.09 был представлен пользовательский интерфейс, основанный на парадигме Windows, и добавлена ​​поддержка SQL. Версия 7 представила систему доставки вывода (ODS) и улучшенный текстовый редактор. В последующих выпусках ODS были улучшены. Например, в версии 8 было добавлено больше параметров вывода. Количество поддерживаемых операционных систем было уменьшено до UNIX , Windows и z / OS , а также добавлен Linux . SAS версии 8 и SAS Enterprise Miner были выпущены в 1999 году.

Недавняя история

В 2002 году была представлена ​​программа Text Miner. Text Miner анализирует текстовые данные, такие как электронные письма, на предмет шаблонов в приложениях Business Intelligence. В 2004 году была выпущена версия SAS 9.0, получившая название «Project Mercury» и призванная сделать SAS доступным для более широкого круга бизнес-пользователей. Версия 9.0 добавила настраиваемые пользовательские интерфейсы на основе роли пользователя и установила пользовательский интерфейс «укажи и щелкни» SAS Enterprise Guide в качестве основного графического пользовательского интерфейса (GUI) программного обеспечения. Функции управления взаимоотношениями с клиентами (CRM) были улучшены в 2004 году с помощью SAS Interaction Management. В 2008 году SAS анонсировала Project Unity, предназначенный для интеграции качества данных, интеграции данных и управления основными данными.

SAS Institute Inc против World Programming Ltd - это судебный процесс с разработчиками конкурирующей реализации World Programming System , в которых утверждалось, что они частично нарушили авторские права SAS, реализовав ту же функциональность. Это дело было передано из Высокого суда Соединенного Королевства в Европейский суд 11 августа 2010 года. В мае 2012 года Европейский суд вынес решение в пользу World Programming, установив, что «функциональность компьютерной программы и язык программирования не может быть защищен авторским правом ".

Бесплатная версия была представлена ​​для студентов в 2010 году. В том же году был выпущен SAS Social Media Analytics, инструмент для мониторинга социальных сетей, анализа вовлеченности и настроений . В том же году был представлен SAS Rapid Predictive Modeler (RPM), который создает базовые аналитические модели с помощью Microsoft Excel . В JMP 9 в 2010 году был добавлен новый интерфейс для использования языка программирования R из JMP и надстройка для Excel. В следующем году в рамках партнерства с Teradata и EMC Greenplum стало доступно высокопроизводительное вычислительное устройство . В 2011 году компания выпустила Enterprise Miner 7.1. С октября 2013 года по октябрь 2014 года компания представила 27 продуктов для управления данными и обновила еще 160 продуктов. На глобальном форуме SAS 2015 года компания анонсировала несколько новых продуктов, предназначенных для различных отраслей, а также новое программное обеспечение для обучения.

Дата выхода

С 1972 года у SAS было много выпусков. Начиная с выпуска 9.3, SAS / STAT имеет собственную нумерацию выпусков.

Выпускать Дата Комментарий
72 Январь 1972 г.
76 Июль 1976 г.
79,5 Апрель 1981 г.
82,4 Январь 1983 г.
4.06 Март 1984 г.
5,03 Июль 1986 г.
6.01 Январь 1985 г. ПК DOS
6,03 Март 1988 г.
6.06 Март 1990 г.
6,07 Апрель 1991 г.
6,08 Март 1993 г.
6.09 Октябрь 1993 г.
6.10 Октябрь 1994
6,11 Октябрь 1995 г.
6,12 Ноябрь 1996
7.0 Октябрь 1998
8.0 Ноябрь 1999 г.
8.1 Июль 2000 г.
8,2 Март 2001 г.
9.0 Октябрь 2002 г.
9.1 Декабрь 2003 г.
9.1.3 Август 2004 г.
9.2 Март 2008 г. СТАТИСТИКА 9.2
9,2 м2 Апрель 2010 г. СТАТИСТИКА 9.22
9,3 Июль 2011 г. СТАТИСТИКА 9.3
9,3 м2 Август 2012 г. СТАТ 12.1
9,4 Июль 2013 СТАТУС 12.3
9,4M1 Декабрь 2013 СТАТ 13.1
9,4 м2 Август 2014 г. СТАТУС 13.2
9,4 м3 Июль 2015 г. STAT 14.1
9,4М4 Ноябрь 2016 СТАТИСТИКА 14.2
9,4М5 Сентябрь 2017 г. СТАТУС 14.3
9,4М6 Ноябрь 2018 г. STAT 15.1
9,4М7 Август 2020 г. СТАТ 15.2

Программные продукты

По состоянию на 2011 год самый большой набор продуктов SAS - это линия для сбора информации о клиентах . Многочисленные модули SAS для Интернета, социальных сетей и маркетинговой аналитики могут использоваться для профилирования клиентов и потенциальных клиентов, прогнозирования их поведения, управления и оптимизации коммуникаций. SAS также предоставляет SAS Fraud Framework. Основная функция платформы - отслеживать транзакции в различных приложениях, сетях и партнерах и использовать аналитику для выявления аномалий, указывающих на мошенничество. SAS Enterprise GRC (Governance, Risk and Compliance) обеспечивает моделирование рисков, анализ сценариев и другие функции для управления и визуализации рисков, соблюдения нормативных требований и корпоративных политик. Существует также набор продуктов SAS Enterprise Risk Management, предназначенный в первую очередь для банков и финансовых организаций.

Продукты SAS для мониторинга и управления операциями ИТ-систем вместе именуются SAS IT Management Solutions. SAS собирает данные о производительности и использовании различных ИТ-активов, а затем создает отчеты и анализирует их. Продукты SAS Performance Management объединяют и предоставляют графическое отображение ключевых показателей эффективности (KPI) на уровне сотрудников, отделов и организаций. Пакет продуктов SAS Supply Chain Intelligence предлагается для нужд цепочки поставок, таких как прогнозирование спроса на продукцию, управление распределением и запасами и оптимизация ценообразования. Существует также набор программного обеспечения «SAS for Sustainability Management» для прогнозирования экологических, социальных и экономических последствий и определения причинно-следственных связей между операциями и воздействием на окружающую среду или экосистему.

У SAS есть наборы продуктов для конкретных отраслей, таких как правительство, розничная торговля, телекоммуникации и аэрокосмическая промышленность, а также для оптимизации маркетинга или высокопроизводительных вычислений .

Бесплатное университетское издание

SAS также предлагает бесплатную университетскую версию, которую может загрузить любой желающий для некоммерческого использования. Первое объявление об этом бесплатном университетском издании, похоже, появилось в газетах 28 мая 2014 года.

Сравнение с другими продуктами

В статье 2005 года для Journal of Marriage and Family, в которой сравниваются статистические пакеты от SAS и его конкурентов Stata и SPSS , Алан К. Акок написал, что программы SAS обеспечивают «необычайный диапазон задач анализа данных и управления данными», но их трудно использовать и учиться. Между тем, SPSS и Stata были легче для изучения (с лучшей документацией), но обладали менее способными аналитическими возможностями, хотя их можно было расширить с помощью платных (в SPSS) или бесплатных (в Stata) надстроек. Акок пришел к выводу, что SAS лучше всего подходит для опытных пользователей , в то время как случайные пользователи больше всего выиграют от SPSS и Stata. Сравнение, проведенное Калифорнийским университетом в Лос-Анджелесе , дало аналогичные результаты.

Такие конкуренты, как Revolution Analytics и Alpine Data Labs, рекламируют свои продукты как значительно более дешевые, чем у SAS. В сравнении 2011 года Дуг Хеншен из InformationWeek обнаружил, что стартовые сборы для этих трех компаний одинаковы, хотя он признал, что стартовые сборы не обязательно были лучшей основой для сравнения. Бизнес-модель SAS не так сильно зависит от начальных сборов за свои программы, вместо этого она сосредоточена на доходах от ежегодной абонентской платы.

Принятие

По данным IDC, SAS является крупнейшим держателем доли рынка «продвинутой аналитики» с 35,4% рынка по состоянию на 2013 год. Она является пятым по величине держателем доли рынка программного обеспечения для бизнес-аналитики (BI) с долей 6,9% и крупнейший независимый поставщик. На рынке бизнес- аналитики он конкурирует с такими конгломератами, как SAP BusinessObjects , IBM Cognos , SPSS Modeler , Oracle Hyperion и Microsoft Power BI . Компания SAS была включена в Квадрант лидеров Gartner для инструментов интеграции данных, а также для бизнес-аналитики и аналитических платформ. Исследование, опубликованное в 2011 году в BMC Health Services Research, показало, что SAS использовался в 42,6% анализов данных в исследованиях в сфере здравоохранения на основе выборки из 1139 статей, взятых из трех журналов.

Читайте также: