Sas enterprise miner что это

Обновлено: 06.07.2024

Программный продукт SAS Enterprise Miner (разработчик SAS Institute Inc., [102]) - это интегрированный компонент системы SAS , созданный специально для выявления в огромных массивах данных информации, которая необходима для принятия решений . Разработанный для поиска и анализа глубоко скрытых закономерностей в данных SAS , Enterprise Miner включает в себя методы статистического анализа, соответствующую методологию выполнения проектов Data Mining ( SEMMA ) и графический интерфейс пользователя. Важной особенностью SAS Enterprise Miner является его полная интеграция с программным продуктом SAS Warehouse Administrator , предназначенным для разработки и эксплуатации информационных хранилищ, и другими компонентами системы SAS . Разработка проектов Data Mining может выполняться как локально, так и в архитектуре клиент-сервер .

Назначение пакета SAS Enterprise Miner . Пакет SAS Enterprise Miner позволяет оптимизировать процесс Data Mining в целом, начиная от организации доступа к данным и заканчивая оценкой готовой модели [104].

Пакет поддерживает выполнение всех необходимых процедур в рамках единого интегрированного решения с возможностями коллективной работы и поставляется как распределенное клиент-серверное приложение , что особенно удобно для осуществления анализа данных в масштабах крупных организаций. Пакет SAS Enterprise Miner предназначен для специалистов по анализу данных, маркетинговых аналитиков, маркетологов, специалистов по анализу рисков, специалистов по выявлению мошеннических действий, а также инженеров и ученых, ответственных за принятие ключевых решений в бизнесе или исследовательской деятельности.

Пакет SAS Enterprise Miner обеспечивает эффективную обработку огромных объемов данных и предоставляет простые способы публикации результатов анализа для различных аудиторий, что позволяет встраивать эти модели в бизнес-процессы предприятия.

Обзор программного продукта

Пакет SAS Enterprise Miner 5.1 поставляется в виде современной распределенной клиент-серверной системы для Data Mining или для углубленного анализа данных в крупных организациях. Пакет позволяет оптимизировать процессы анализа данных, поддерживая все необходимые шаги в рамках единого решения, а также возможности гибкого сотрудничества больших рабочих групп в рамках единого проекта. Система обеспечивает расширенную интеграцию с системами управления данными и развертывания моделей, а благодаря широкому спектру выбора конфигурации пакета в зависимости от требований бизнеса нет необходимости приобретать системы специализированных решений.

Графический интерфейс (GUI) для анализа данных

В пакете SAS Enterprise Miner реализован подход, основанный на создании диаграмм процессов обработки данных и позволяющий устранить необходимость ручного кодирования и ускорить разработку моделей благодаря методике Data Mining SEMMA . Среда для формирования диаграмм процессов обработки данных пакета SAS Enterprise Miner устраняет необходимость ручного кодирования, диаграммы выступают в качестве самоописательных шаблонов, которые можно изменять или применять для решения новых проблем, не повторяя анализ с самого начала. Существует возможность обмена диаграммами между аналитиками в масштабах предприятия.

Графический пользовательский интерфейс пакета является интерфейсом типа "указать и щелкнуть". С его помощью пользователи могут выполнить все стадии процесса Data Mining от выбора источников данных, их исследования и модификации до моделирования и оценки качества моделей с последующим применением полученных моделей, как для обработки новых данных, так и для поддержки процессов принятия решений. Главное окно SAS Enterprise Miner представлено на рис. 23.1.

SAS Enterprise Miner – это платформа для оптимизации процесса интеллектуального анализа данных при разработке описательных и прогнозных моделей с использованием структурированных алгоритмов и визуальных показателей оценки.

Программный продукт SAS Enterprise Miner (рус. САС Энтерпрайз Майнер) от компании SAS предназначен для интеллектуального анализа данных. Программа позволяет получить информацию, способствующую лучшему принятию решений на основе данных и фактов, оптимизирует процесс интеллектуального анализа данных для быстрой разработки моделей, понимания ключевых взаимосвязей и поиска наиболее важных паттернов в бизнесе. Данное ПО преимущественно подходит средним и крупным предприятиям, а также НКО.

Аналитическая система SAS Enterprise Miner позволяет пользователям создавать модели с помощью блок-схем, прогностического моделера, исследовательских алгоритмов и программного кода.

Создание аналитической модели в аналитическом программном обеспечении SAS Enterprise Miner

Создание аналитической модели в аналитическом программном обеспечении SAS Enterprise Miner

Визуализация статистической выборки в виде графика в программе SAS Enterprise Miner

Визуализация статистической выборки в виде графика в программе SAS Enterprise Miner

Визуализация показателей бизнес-процессов в системе статистического анализа данных SAS Enterprise Miner

Визуализация показателей бизнес-процессов в системе статистического анализа данных SAS Enterprise Miner

Программный код с аналитической модели в программном продукте для исследования данных SAS Enterprise Miner

Программный код с аналитической модели в программном продукте для исследования данных SAS Enterprise Miner


SAS Enterprise Miner — решение для построения сложных аналитических моделей. Набор методов интеллектуального анализа данных, который позволяет извлечь из массива данных ценную практическую информацию для принятия решений в различных сферах.

SAS Enterprise Miner применяться для решения таких задач, как обнаружение случаев мошенничества, минимизация финансовых рисков, оценка и прогнозирование потребностей в ресурсах, повышение эффективности маркетинговых кампаний и снижение оттока клиентов.

2019: Возможности. Особенности

(Данные актуальны на февраль 2019 года)

Возможности SAS Enterprise Miner

  • Широкий набор инструментов для интеллектуального анализа данных

Гибкая система методов, приспособленная к решению задач различной сложности. Решение преобразует первичные данные в информацию для дальнейшего использования аналитиками, статистами, бизнес-менеджерам и ИТ-специалистами. Цельность процесса и используемых методов позволят различным специалистам объединять усилия и повышать эффективность применяемых решений.

SAS Enterprise Miner предоставляет аналитикам и data scientists (специалисты по интеллектуальному анализу данных) самодокументируемую проектную среду, которая ускоряет время разработки моделей и объединяет все этапы анализа данных, помогая получить наилучшие результаты.

Решение автоматизирует длительный процесс скоринга и генерирует код для всех стадий внедрения модели на языках программирования SAS, C, Java или PMML. Такой код может быть в дальнейшем использован множеством интерактивных и пакетных сред как внутри SAS, так и в веб-приложениях, в базах данных и напрямую в бизнес-процессах. Эта функция поможет сэкономить время и предотвратить ошибки, возможные при ручном внедрении.

  • Простое и быстрое извлечение полезной информации

С помощью инструмента SAS Rapid Predictive Modeler бизнес-пользователи, обладающие лишь начальными знаниями в моделировании, генерируют прогнозные модели для различных бизнес-целей. Аналитические результаты могут быть легко интерпретированы на основе простых и понятных графиков и таблиц, раскрывая необходимую для принятия решений информацию.

Метрики оценки качества моделей, построенные различными способами, могут быть выведены в сводной таблице, что облегчает их сравнение. Итоговые диаграммы процесса моделирования могут использоваться в качестве самостоятельно шаблона, который удобно редактировать, обновлять и применять к новым бизнес-задачам, а описание модели содержит информацию о том, какой вклад внесла каждая независимая переменная в итоговый результат. Кроме того, точность модели основывается на базе современных алгоритмов, учитывающих отраслевую специфику методов, что гарантирует высокую степень стабильности и надежности результатов.

SAS Enterprise Miner – набор методов интеллектуального анализа данных, который позволяет извлечь из массива данных ценную практическую информацию для принятия решений в различных сферах.

SAS Enterprise Miner применятся для решения таких задач, как обнаружение случаев мошенничества, минимизация финансовых рисков, оценка и прогнозирование потребностей в ресурсах, повышение эффективности маркетинговых кампаний и снижение оттока клиентов.

Возможности SAS Enterprise Miner

  • Широкий набор инструментов для интеллектуального анализа данных

Гибкая система методов, приспособленная к решению задач различной сложности. Решение преобразует первичные данные в информацию для дальнейшего использования аналитиками, статистами, бизнес-менеджерам и ИТ-специалистами. Цельность процесса и используемых методов позволят различным специалистам объединять усилия и повышать эффективность применяемых решений.

SAS Enterprise Miner предоставляет аналитикам и data scientists (специалисты по интеллектуальному анализу данных) самодокументируемую проектную среду, которая ускоряет время разработки моделей и объединяет все этапы анализа данных, помогая получить наилучшие результаты.

Решение автоматизирует длительный процесс скоринга и генерирует код для всех стадий внедрения модели на языках программирования SAS, C, Java или PMML. Такой код может быть в дальнейшем использован множеством интерактивных и пакетных сред как внутри SAS, так и в веб-приложениях, в базах данных и напрямую в бизнес-процессах. Эта функция поможет значительно сэкономить ваше время и предотвратить ошибки, возможные при ручном внедрении.

  • Простое и быстрое извлечение полезной информации

С помощью инструмента SAS Rapid Predictive Modeler бизнес-пользователи, обладающие лишь начальными знаниями в моделировании, генерируют прогнозные модели для различных бизнес-целей. Аналитические результаты могут быть легко интерпретированы на основе простых и понятных графиков и таблиц, раскрывая необходимую для принятия решений информацию.

Метрики оценки качества моделей, построенные различными способами, могут быть выведены в сводной таблице, что значительно облегчает их сравнение. Итоговые диаграммы процесса моделирования могут использоваться в качестве самостоятельно шаблона, который удобно редактировать, обновлять и применять к новым бизнес-задачам, а описание модели содержит информацию о том, какой вклад внесла каждая независимая переменная в итоговый результат. Кроме того, точность модели основывается на базе современных алгоритмов, учитывающих отраслевую специфику методов, что гарантирует высокую степень стабильности и надежности результатов.

Преимущества SAS Enterprise Miner

  • Продвинутые методы прогнозного и описательного моделирования.
  • Удобный и понятный интерфейс, позволяющий пользователям самостоятельно создавать модели анализа и прогнозирования.
  • Автоматизированный процесс регламентного применения моделей.
  • Возможность пакетной обработки сложных процессов.
  • Быстрый сбор и подготовка данных, их агрегация и исследование.
  • Простота масштабирования и настройки решения.
  • Высокая производительность системы даже при работе с большим массивом разрозненных данных.

Другие решения SAS для продвинутой аналитики:

    – сбор и глубокий анализ информации о клиентах.
    – интерактивные инструменты для визуальной и продвинутой аналитики.
    – система оценки кредитных рисков.
    – набор решений для оптимизации розничных цен.


История возникновения

Для начала в сотый раз обратимся к рейтингу ресурса TIOBE, дабы отыскать в нём нашего сегодняшнего героя. SAS располагается на “предлидирующем” 21 месте, что, согласитесь, для data-языка великолепный результат. Так что давайте познакомимся с ним поближе.


Итак, Джеймс Гуднайт (James Goodnight) в 1976 году окончил Университет Северной Каролины, тут же приложил свою руку к созданию небольшой аналитической компании SAS Institute и вот уже 40 лет он ее CEO. SAS - аббревиатура от Statistical Analysis System, что полностью описывает основное направление деятельности компании.

Естественно, для того, чтобы эффективно обрабатывать большие потоки информации потребовался не только качественный программный продукт, но и соответствующий язык. И им стал SAS. Изначально это был довольно примитивный набор шаблонных запросов для группировки данных, но со временем SAS стал полноценным и достаточно популярным языком программирования.

В общем-то с этого момента можно было бы смело вести историю языка, программного обеспечения и всей компании, как единого целого, но в 2002 году объявился идеологический конкурент - World Programming System (WPS), который в своей деятельности не просто стал использовать язык SAS, но и разработал для него собственный компилятор и IDE.

Разумеется, вскоре началась судебная тяжба, которая в итоге создала интересный прецедент для всего IT-сообщества: WPS выиграл суд, доказав, что авторское право не нарушается, если используется синтаксис и функциональность языка, но не используются исходные коды. Таким образом, язык SAS отчасти избежал участи MATLAB, сорвав ярлык “вещи в себе”.

Кстати, сегодня SAS Institute - не просто преуспевающая компания с оборотом в несколько миллиардов долларов в год, но и одно из наиболее привлекательных мест для работы. Так, в 2013 году SAS заняла второе место в рейтинге “привлекательности” компаний США, пропустив вперёд лишь Google.

Краткая справка

Впрочем, оставим дела компании и обратимся непосредственно к языку. Чтобы вы визуально представляли его внешний вид, вот небольшой отрывок кода, содержащий вывод на экран таблицу данных:

PROC PRINT DATA = models NOOBS;
WHERE Type = "Mountain";
FORMAT Price DOLLAR6.;
TITLE "Current Models of Mountain Bicycles";
RUN;

Основным конкурентом SAS является язык R, причём стоит признать, что последний имеет солидное преимущество. Во-первых, он был создан позднее, соответственно избежал многих проблем роста. Во-вторых, и это наверное главный фактор, он бесплатный, в то время как SAS требует дорогое программное обеспечение. Впрочем, давайте взглянем на преимущества и недостатки SAS в сравнении с главным конкурентом.

Простой синтаксис, быстрое обучение “с нуля”;

Отладка кода проходит значительно проще, чем на R;

Интеграция с БД (Oracle/Teradata);

Удобный формат выходных данных (особенно таблиц);

Мощная поддержка со стороны компании SAS;

Многолетний успешный опыт эксплуатации компаниями разной величины, с разными задачами и разным объёмом входных данных. В частности, России SAS используют ОАО “РЖД”, МТС, ЦБ РФ, а также ведущие банки, среди которых Сбербанк, Альфабанк, Тинькофф и многие другие.

Профессиональное использование языка предполагает покупку программного продукта;

Исходники многих исполняемых алгоритмов SAS не являются публичными, следовательно изучение работы языка сильно ограничено;

SAS значительно уступает в производительности R;

С точки зрения объёма кода SAS также зачастую сильно проигрывает (иногда в несколько раз).

При этом надо понимать, что далеко не во всех сферах SAS и R являются прямыми конкурентами. Взгляните на следующее изображение:


Из него отчётливо видно, что в Data Science SAS сильно проигрывает не только R, но и Python. Но вот в анализе данных, предполагающем дальнейшие прогнозы, SAS занимает лидирующую позицию.

Программный продукт

Для того, чтобы оценить степень размаха в прикладных программах, с которым придётся столкнуться желающему освоить SAS в полном объёме, можно посетить официальный раздел с перечислением пакетов заглавной IDE. Впрочем, здесь прослеживается аналогия с уже упомянутым продуктом MATLAB/Simulink, где также имеется большое количество надстроек, но по сути подавляющее большинство из них имеет строгую специализацию. Так что изначально стоит сфокусироваться лишь на 4 следующих:

SAS Visual Analytics - инструмент для визуализации ваших данных;

SAS Enterprise Miner - инструмент для машинного обучения;

Enterprise / Text Miner - пакет надстроек, аналогичный SAS Visual Analytics, но с большим упором на упрощение любых внутренних взаимодействий;

SAS ETS Module - система прогнозирования.

Если вы вдруг сейчас подумали, что возможно стоит прикупить пару из них, то вот стоп-сигнал: SAS Enterprise Miner, к примеру, обходится крупным компаниям более чем в 100 тысяч долларов. Пакет Analytics будет значительно дешевле, около 8,5 тысяч, но разве от этого легче?

Обучение

Впрочем, это не означает, что постигнуть азы SAS невозможно. Компания активно продвигает свой продукт среди студентов, причём абсолютно бесплатно. Достаточно мощную пробную версию SAS University Edition можно скачать перейдя по ссылке.

Также на официальном сайте у вас есть возможность записаться на экспресс-курсы по изучению языка (причём на русском языке). Рекомендуемая длительность обучения в каждом разделе составляет 3 дня, требования и программу можно посмотреть прямо рядом с торжественной кнопкой записи.

В общем, было бы желание.

Работа

Откровенно говоря, получить работу конкретно SAS-специалисту в России будет очень сложно. Как правило, SAS идёт как жирный плюс. но не как основная специализация. Тем не менее, если вам удастся набраться практического опыта работы с SAS хотя бы в течение 2 лет, хотя бы базово освоить SQL, VB и прочие полезности, то вы сможете смело рассчитывать на зарплату не менее 80 тысяч рублей в месяц. Причём речь не только о столице, стоимость программного продукта SAS как бы подсказывает работодателю не экономить в поисках дешёвой рабочей силы. Но, как уже было сказано, нужную вакансию ещё придётся поискать.

Литература

Нет смысла перечислять лучшие иностранные книги по SAS, так как все они собраны в одном месте, прямо на официальном сайте компании. Особое внимание стоит уделить пошаговому самоучителю, описанию возможностей языка и IDE, а также справочнику новичка.

Что касается ресурсов на русском языке, то тут, разумеется, всё значительно сложнее, но кое-что всё же есть. Помимо официального сайта, лекции Дмитрия Звежинского помогут тем, кто пока не познал английский язык на хорошем уровне, на официальные курсы записывать не хочет, но SAS изучить отчаянно желает.

На этом краткое знакомство считаем оконченным. А вы сталкивались когда-нибудь с языком SAS? Какие впечатления?

Освоить востребованную профессию в Data Science можно всего за полтора года на курсах GeekBrains. После учёбы вы сможете работать по специальностям Data Scientist, Data Analyst, Machine Learning, Engineer Computer Vision-специалист или NLP-специалист.

Читайте также: