Сравнение excel и statistica

Обновлено: 06.07.2024

Продукты линейки STATISTICA – это мощнейшие инструменты для анализа данных, визуализации, прогнозирования, нейросетевых вычислений, data mining, контроля качества.

Продукты STATISTICA полностью переведены на русский язык, включая справочное руководство и документацию!

Продукты серии STATISTICA различной комлектации Desktop, Analyst, Modeler, Data Scientist включают широкий спектр мощных аналитических инструментов, состоящий из следующих блоков (см. раздел Новая комплектация):


STATISTICA Base

Широкий набор основных статистик и графических инструментов в понятном интерфейсе со всеми преимуществами, простотой и мощностью технологий STATISTICA.

STATISTICA Advanced

Включает все возможности STATISTICA Base, а также мощные инструменты для построения линейных/нелинейных моделей – STATISTICA Advanced Linear/Nonlinear Models, многомерные технологии анализа данных STATISTICA Multivariate Exploratory Techniques, инструменты для анализа мощности и вычисления объема выборки STATISTICA Power Analysis and Interval Estimation.

STATISTICA Quality Control (QC)

Включает STATISTICA Base, модуль для анализа мощности STATISTICA Power Analysis and Interval Estimation, а также промышленный блок модулей: Карты Контроля Качества – STATISTICA Quality Control Charts, Анализ Процессов – STATISTICA Process Analysis, Планирование Экспериментов – STATISTICA Design of Experiments .

STATISTICA Advanced + QC

Включает все возможности STATISTICA Advanced и STATISTICA Quality Control.

STATISTICA Automated Neural Networks

Единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык.

STATISTICA Data Miner

Включает возможности STATISTICA Advanced, STATISTICA Automated Neural Networks, а также предоставляет самый полный набор мощнейших и простых в использовании инструментов для data mining.

STATISTICA ULTIMATE ACADEMIC BUNDLE (SUAB)

Содержит весь набор аналитических инструментов, включая Data Miner, Text Miner, Data Visualization и др. Функционал системы SUAB предоставляет студентам возможность работы не только с базовыми версиями продуктов серии STATISTICA, но и специализированными модулями для решения задач в промышленности, retail, финансовой сфере и др.

Корпоративные продукты STATISTICA: В чем преимущество корпоративных систем?


STATISTICA Enterprise

Совмещает эффективный интерфейс для доступа к центральному многопользовательскому репозиторию данных, средства для совместной работы пользователей и мощный функционал статистического анализа данных, доступный в различных продуктах линейки STATISTICA. Иными словами, STATISICA Enterprise является платформой для любого продукта линейки STATISTICA, предоставляющей несравненные преимущества корпоративной работы.

STATISTICA Enterprise/QC

Является корпоративной платформой для продуктов, основанных на промышленных модулях (STATISTICA QC, STATISTICA Advanced+QC) и представляет собой уникальную комбинацию возможностей, которые не представлены ни в одной другой SPC-системе.

Расширенные версии продуктов STATISTICA:

  • Масштабируемость и производительность Hadoop
  • Создание выборок с помощью MapReduce
  • Поиск на движке Lucene/SOLR
  • Углубленная аналитика Mahout
  • Работа с текстом Natural Language Processing
  • Возможность работы в «облаках»

Специализированные продукты STATISTICA:

  • Rules Builder – создание гибких правил в проектах обработки данных,
  • Weight of Evidence – утилита создания оптимальных категориальных факторов для предиктивных моделей.

Затрудняетесь в выборе оптимального продукта? Специалисты StatSoft с радостью ответят на все возникающие вопросы. Свяжитесь с нами любым удобным для Вас способом или заполните электронную форму.

Вы также можете заказать бесплатную выездную презентацию или online встречу, в рамках которых специалисты StatSoft познакомят Вас с возможностями продуктов STATISTICA в Вашей области.

В настоящее время в продаже имеется русифицированная версия системы STATISTICA 10 и новая англоязычная версия системы STATISTICA 13.

При установке системы Вы можете выбрать как 64-битную версию STATISTICA, так и 32-битную.

Любой из продуктов линейки STATISTICA представляется в 3 категориях:

  • Однопользовательские версии
  • Сетевые версии
  • Корпоративные системы

Однопользовательские версии

Однопользовательские версии программных продуктов STATISTICA устанавливаются и могут быть использованы только на одном рабочем месте. Лицензии на однопользовательские версии STATISTICA предоставляются пользователю бессрочно.

Обращаем внимание, что однопользовательские версии не поддерживают работу через протокол RDP, т.е. через Удаленный рабочий стол и в рамках терминальных сессий. Сетевые версии STATISTICA не имеют такого ограничения.

Сетевые версии

Сетевые лицензии имеют тип Concurrent. При использовании Concurrent версии Вам предоставляется возможность установить систему на неограниченное число рабочих мест, но при этом количество рабочих мест, где может одновременно использоваться система, соответствует количеству приобретенных Вами лицензий.

Для приобретения сетевой версии необходимо, чтобы все компьютеры находились в одной локальной сети и имели один общий для всех рабочих станций сервер. Обращаем Ваше внимание, что комплектация модулей пакета внутри одной сетевой версии отличаться не может.

Лицензии на использование сетевых версий продуктов (начиная с 10-й версии STATISTICA) выдаются на один год с момента предоставления пользователю инсталляционных кодов. Продление лицензий и услуг технической поддержки на каждый последующий год производится после уплаты ежегодного 20% взноса общей стоимости всех установленных программ. Ежегодный взнос за второй год оплачивается через год после установки.

Возможен также вариант бессрочного приобретения сетевых версий на особых условиях.

Опционально cетевая лицензия может иметь возможность заимствования – Borrowing-лицензия. Использование Borrowing-лицензии позволяет временно откреплять (заимствовать) лицензию от общей сети и пользоваться STATISTICA во время отсутствия подключения. Например, borrowing-лицензия позволяет пользователю на время командировки открепить лицензию и запускать программу со своего ноутбука, вне зависимости от местонахождения.

Корпоративные системы

Любой продукт линейки STATISTICA может быть приобретен в качестве корпоративной системы (STATISTICA Enterprise/QC – корпоративная система на основе промышленных продуктов, STATISTICA Enterprise – корпоративная система на основе любых других продуктов), внедрение которой дает организации несравненное преимущество в удобстве совместной работы.

У Вас может возникнуть вопрос, чем корпоративная система отличается от обычной сетевой лицензии? Важным преимуществом корпоративных систем является наличие возможностей для совместной работы групп пользователей, доступ к центральному многопользовательскому репозиторию данных. Подробнее о корпоративных системах.

Лидеры мирового рынка, ведущие образовательные и научные учреждения России используют продукты STATISTICA, прошли обучение в Академии Анализа Данных StatSoft:

Bayer, Bosch, HP, Mars Inc., Microsoft Corporation, Pepsi, Pfizer, Procter & Gamble, Starbucks Coffee Company, Volvo, ИНГОССТРАХ, ИНТЕР РАО ЕЭС, ЛУКОЙЛ-ИНФОРМ, Московский государственный университет им. М.В. Ломоносова, МТС, НИИ нейрохирургии им. Бурденко, НИУ ВШЭ, Норильский никель, Сибнефть, Спорт-Мастер, ТНК-ВР, Центральный Банк Российской Федерации, Шеринг-Плау и многие другие.

"STATISTICA широко используется в различных прикладных областях анализа данных и окупила себя на первой же решенной при ее помощи задаче. Программа легко интегрируется с имеющимися базами данных, что делает работу с ней быстрой, удобной и продуктивной".

Константин Иванюк,
менеджер по бизнес-анализу отдела продаж, Sun Interbrew, Украина

"STATISTICA Neural Networks зарекомендовал себя как очень удобное решение для задач многомерного статистического анализа на базе нейросетевых моделей, не требующее от пользователя глубоких знаний по нейросетям, позволяющее быстро добиться хорошего результата, доступное и не математику: геологу, технологу.

Вообще, основное свойство продуктов линейки STATISTICA: мощность, простота в использовании, наглядность и эффективность, и при этом, небольшая стоимость".

Борцов Константин,
заместитель начальника Управления информационных технологий и автоматизации, Казцинк

"Мы очень довольны внедрением STATISTICA Enterprise на нашей производственной линии. Инструменты создают наглядную систему управления производственным процессом, облегчают непрерывный процесс улучшения качества, уменьшают время, затрачиваемое на доступ к данным".

Pierre Mazoué,
менеджер по контролю качества, 3M Beauchamp, France

"STATISTICA удобна и для учебной работы, и для прикладных исследований. Кроме того, в системе замечательно реализованы графические методы – методы первостепенной важности для статистики и анализа данных. И самое главное – содержательная часть пакета опирается на точные теоретические изыскания в области статистики. Немаловажным элементом выбора является и то, что пакет сопровождается в России статистически грамотным коллективом".

Чепурин Е.В.,
зам. декана экономического отделения мехмата, МГУ им. М.В. Ломоносова

Стоимость и порядок приобретения

Всю информацию о стоимости программных продуктов Вы можете получить у наших менеджеров, связавшись с нами любым удобным для вас способом или заполнив электронную форму.

Наши технические специалисты помогут Вам выбрать оптимальную комплектацию модулей STATISTICA для решения Ваших задач. Подробнее о предпродажных консультациях.

Вузам и государственным организациям предоставляются скидки.

В письме указать наименование ПО, версию ПО (русскоязычная или англоязычная версия), область/задачи Вашей деятельности, Ваши реквизиты (для юр. лиц): точное название организации, адрес, контактный телефон, Ф.И.О. ответственного лица, ИНН и КПП Вашей организации.

Специальные цены для вузов и государственных учреждений

В данный момент компания StatSoft Russia проводит специальную ценовую политику, основной задачей которой является предоставление вузам и государственным организациям возможности приобретения наших программных продуктов по приемлемым для них ценам с максимально возможными скидками.

Для приобретения продуктов STATISTICA со скидкой необходимо заполнить соответствующий бланк:

Как было показано в главах 1-8, пакет MS Excel благодаря простоте работы с ним и большому количеству полезных встроенных функций и процедур он позволяет решать многие простые прикладные задачи, связанные с обработкой данных. Но при этом потребность в серьезных методах прикладной статистики и анализа данных у пользователей MS Excel не всегда остается удовлетворенной.

Поэтому в большом количестве разрабатываются спе­циальныестатистические пакеты. На мировом рынке наиболее успешным программным средством такого рода, по мнению авторитетных специалистов, является пакет прикладных программ STATISTICA, который по сравнению с другими программа­ми предоставляет пользо­вателям наиболее богатые возможности по обработке данных. Росту популярности системы STATISTICA в нашей стране способ­ствует появление русифицированной версии, распространяемой компанией STATSOFT RUSSIA, г. Москва.

От большинства других про­граммных продуктов для Windows система STATISTICA выгодно отличается тем, что состоит из отдель­ных программ - модулей, каждый из которых содержит конк­ретный метод обработки данных. Кроме того, данные из Excel можно легко импортировать в STATISTICA или работать в системе непосредственно с файлами Excel.

Работа с Таблицами данных

Таблицы данных STATISTICA основаны на технологии мультимедийных таблиц, разработанной компанией StatSoft. Система работает как с исходными данными, так и с численными и текстовыми результатами анализов. Таблица данных STATISTICA является двумерной таблицей, которая может содержать практически неограниченное число наблюдений (строк) и переменных (столбцов), при этом каждая ячейка может содержать неограниченное количество символов. Данные в системе STATISTICA организованы в виде набора наблюдений и переменных.

Окно таблицы данных состоит из нескольких основных частей.

Заголовок окна. В области «Заголовок окна» отображается название таблицы данных вместе с принятым стандартным расширением (.sta), а также содержится число переменных и наблюдений.

Информационное поле располагается в верхнем левом углу окна таблицы данных. Для того, чтобы выделить всю таблицу данных, следует нажать в нижнем правом углу области «Информационное поле». Для ввода или редактирования текста в области «Информационное поле» следует нажать дважды.

Заголовок. Дважды нажмите в области Заголовок, сверху окна над именами переменных, для того, чтобы ввести или изменить текстовую информацию. Для выделения самой области Заголовок (например, при форматировании) нажмите в верхнем левом углу (указатель мыши при этом принимает вид ). Нажмите CTRL+ENTER или ALT+ENTER для ввода новой строки (иногда вам необходимо увеличить высоту поля для того, чтобы видеть несколько строчек текста).

Имена наблюдений. Эти ячейки, расположенные в левой части окна Таблицы данных, содержат имена для каждого наблюдения. Для ввода или редактирования текста дважды нажмите на любом Имени наблюдения. Для выделения самих Имен наблюдений (например, при форматировании) нажмите один раз в левой части Имени наблюдения (указатель мыши при этом принимает вид ). Для того чтобы выделить всю строку наблюдения (для редактирования), нажмите один раз в средней или правой части Имени наблюдений (указатель мыши при этом принимает вид ). Для выделения блока Имен наблюдений, (не выделяя сами строки), выберите команду Выбрать только имена наблюдений в контекстном меню Таблицы данных. Для автоматической подгонки ширины полей Имен наблюдений дважды нажмите на правой границе любого поля Имя наблюдения (указатель мыши при этом принимает вид ). На рисунке выше ячейки Имена наблюдений содержат первые инициалы и фамилии респондентов. Заметим, что Имена наблюдений необязательно присутствуют в окне Таблицы данных, и вы можете их скрыть (отключите опцию Показать имена наблюдений в меню Вид). В том случае, если их нет, отображаются только номера наблюдений.

Имена переменных. Эти ячейки, расположенные в верхней части каждого столбца, содержат имена переменных. Для просмотра спецификаций отдельной переменной дважды нажмите в поле Имя переменной. Для выделения самого поля Имя переменной (например, при форматировании) нажмите один раз в верхней части поля Имя переменной (указатель мыши при этом принимает вид , вместо ). Для выделения всего столбца переменной (например, при редактировании) нажмите один раз в нижней части поля Имя переменной (указатель мыши при этом принимает вид ). Для автоматической подгонки ширины столбца дважды нажмите на правой границе поля Имя переменной (указатель мыши при этом принимает вид ). На рисунке выше первые две ячейки Имя переменной содержат текст Gender и Advert. Вы можете также использовать опции поля Имя переменной для отображения номеров переменных вместо имен, для отображения длинных имен переменных и/или названия типов переменных в Таблице данных. Все эти функции доступны в меню Вид - Имена переменных.




Данные (и редактирование внутри ячеек). Оставшаяся область Таблицы данных содержит сами данные, представленные в виде наблюдений и переменных. Кроме того, можно включать в Таблицу данных любых другие внедренные или связанные объекты (например, мультимедийные объекты, Макросы). Текст в ячейках может иметь практически неограниченную длину (обычно в настройках системы STATISTICA она ограничена 1,000 символами для предотвращения случайной вставки большого объема нежелательной информации в одну ячейку).


SPSS называется Статистическим пакетом для социальных наук. SPSS является основным участником рынка с точки зрения инструментов статистической упаковки, которые можно эффективно использовать в качестве производной для манипулирования данными и их хранения. Он в основном используется для пакетной обработки с точки зрения интерактивных пакетов и неинтерактивных пакетов.

Это был продукт, инкубированный SPSS Inc., затем он был приобретен IBM в 2009 году, и он переходит под зонтик и был переименован в IBM SPSS Statistics в версии 2015 года. В настоящее время он имеет стабильную сборку V-2015.

SPSS поставляется с версией с открытым исходным кодом под названием PSPP. Он справедливо обслуживает процесс статистики и разработки методов манипулирования данными с очень немногими исключениями, которые используются для профессионального манипулирования большими порциями данных. У него очень хороший атрибут с версией с открытым исходным кодом, срок действия которого не истечет в будущем, вы можете продолжать использовать то же самое время, которое хотите использовать.

SPSS предоставляет графику, которая имеет больше аналитических функций. После того как вы создали стандартную графику в SPSS, вы можете выделить данные или диапазоны и т. Д. SPSS также позволяет выводить графику в виде файлов HTML5 / .mht. Это делает их доступными через веб-браузер.

Excel позволяет пользователю хранить информацию в табличном формате и взаимодействовать со своими данными бесконечным количеством способов. Наиболее распространенной является сортировка и фильтрация данных, а также использование формул и сводных таблиц для манипулирования данными для создания новых идей.

Excel также позволяет использовать несколько методов импорта и экспорта данных, что позволяет интегрировать их в рабочие процессы. У этого также есть своя собственная способность программирования автоматизировать шаги или создать Ваши собственные пользовательские функции, известные как VBA.

Excel - это инструмент, используемый для ввода данных и создания записей, который может использоваться в дальнейшем для дальнейшего использования и манипулирования в соответствии с требованиями пользователя, и, будь то манипулирование или управление данными, он является очень жизнеспособным инструментом. Он также предоставляет гибкость в использовании внешней базы данных для анализа, составления отчетов и т. Д., Что позволяет сэкономить много времени. Excel с последними версиями имеет высокие графические инструменты и методы визуализации.

Сравнение лицом к лицу между SPSS и EXCEL


Ниже приведены 8 лучших отличий SPSS от EXCEL

Ключевые различия между SPSS и EXCEL

Ниже приведены списки точек, описывающих ключевые различия между SPSS и EXCEL.

1. SPSS - это инструмент, используемый для вычислений, которые состоят из различных предметов, таких как хранилища данных и форматы данных. В то время как Excel также включает в себя математические понятия, такие как статистика, алгебра, исчисление, расширенная статистика и т. Д.,

2.SPSS дает нам знания о том, как процесс встроен в пакеты и работает, а также об управлении памятью в областях программирования. Excel дает нам представление о том, как данные могут быть использованы для изучения того, как данные будут храниться, обрабатываться и обрабатываться, чтобы уменьшить избыточность и сделать ее значимой для дальнейшего использования.

3.SPSS дает нам подробное представление об использовании вычислительных хранилищ и эффективности системы памяти. Excel показывает, как извлечь информацию и знания из данных в различных форматах.

4. Подразделы SPSS включают вычисления, вероятностные теории, рассуждения, дискретные структуры и базу данных. Excel включает в себя гораздо более сложные и простые математические операции и аналитику.

5.SPSS - это основной инструмент для обработки и статистического анализа, а Excel - стандартное приложение для обработки данных.

6.SPSS полностью об эффективном использовании методов манипулирования данными для получения хороших результатов, а Excel - о безопасной обработке и хранении данных.

7.SPSS - это полностью пакетная обработка со статистикой, в то время как Excel - это метод вычисления и формирования данных.

8.SPSS развивается с использованием передовых концепций, а IBM предлагает более эффективные и передовые алгоритмы. Excel растет день ото дня, что усложняет его обработку и эффективное обслуживание, но все еще требует гораздо больших улучшений.

9. SPSS имеет дело со статистическими алгоритмами, уделяющими больше внимания манипулированию данными. Excel представляет собой сочетание математики и хранения данных в нескольких форматах.

SPSS против EXCEL Сравнительная таблица

Ниже приведена таблица сравнения между SPSS и EXCEL.

Вывод - SPSS против EXCEL

Наконец, заключаем, что есть огромная разница между SPSS и Excel. Excel - это программное обеспечение для работы с электронными таблицами, SPSS - это программное обеспечение для статистического анализа.

В Excel вы можете выполнить некоторый статистический анализ, но SPSS более мощный. SPSS имеет встроенные инструменты манипулирования данными, такие как перекодирование, преобразование переменных, и в Excel у вас много работы, если вы хотите выполнить эту работу.

SPSS позволяет выполнять сложную аналитику, такую ​​как факторный анализ, логистическая регрессия, кластерный анализ и т. Д. И т. Д.

В SPSS каждый столбец является одной переменной, Excel не обрабатывает столбцы и строки таким образом (при обработке тома и строк SPSS больше похож на Access, чем на Excel).

Excel не дает вам бумажный след, где вы можете легко воспроизвести точные шаги, которые вы сделали. Это также становится громоздким для использования, когда число переменных и наблюдений начинает становиться действительно большим.

Но и SPSS, и EXCEL служат вам в своих областях исключительно хорошо. Итак, и SPSS, и EXCEL являются королями своей территории.

Рекомендуемая статья

Это было руководство по различиям между SPSS и EXCEL, здесь мы обсудили их значение, сравнение между собой, ключевые различия и выводы. Вы также можете посмотреть следующие статьи, чтобы узнать больше -

Statistica построена на основе COM (Component Object Model ) модели, фактически это набор взаимодействующих между собой COM-компонентов, каждый из которых имеет уникальный идентификатор и может использоваться другими программами, включая Excel.

Объекты библиотек Statistica полностью открыты и доступны для всех совместимых сред программирования Visual Basic в других приложениях

Если вы хотите запустить анализ Statistica из Visual Basic другого приложения (например, Excel), вам сначала нужно загрузить необходимые библиотеки Statistica (например, с помощью параметра «References» в меню «Tools » редактора Visual Basic приложения), и, во-вторых, создать объект типа Statistica.Application.

Затем вы можете создавать объекты анализа, которые являются частью объекта Statistica.Application (нейросети, регрессию, графики).

Данный вариант доступен при наличии лицензии Statistica Enterprise.

Описанный далее метод позволяет легко и быстро, без создания макросов, совместить Excel-документ с его функционалом и возможности Statistica.

В этом способе не требуется лицензия Statistica Enterprise.

Для начала необходимо запустить Statistica и нажать на значок с папкой и надписью Открыть.


Выбираем файл, в котором содержатся данные.


Далее нужно выбрать вариант Открыть как Рабочую книгу Excel.


В окне Statistica открывается таблица с привычным Excel-интерфейсом, где можно использовать любые его функции.

Помимо этого, наверху отображается строка, которая предоставляет доступ ко всем модулям Statistica.


Нейронные сети

Шаг 1 – запуск анализа и выбор переменных

Чтобы воспользоваться нейронными сетями Statistica нужно выбрать Анализ, а затем Автоматизированные Нейронные Сети.


В открывшемся окне можно указать интересующие нас диапазоны строк и столбцов таблицы. В нашем случае можно оставить всё по умолчанию.


Далее появляется окно, где можно изменить тип данных, если он неверно распознался. В нашем случае все столбцы действительно имеют числовой формат, поэтому соглашаемся.


Будем обучать модель регрессии.


В качестве зависимой переменной укажем S/R eff, а в качестве независимых – исследуемые параметры.


Шаг 2 – указание подвыборок

На вкладке Подвыборки (ПНС и АНС) укажем вариант со случайными подвыборками:

Для обучения выделим 70% данных, а для тестирования – 30%.



Шаг 3 – задание первоначальных гиперпараметров

Выберем автоматизированные сети.


Поскольку размер выборки не очень большой (примерно 70 объектов), число нейронов тоже сделаем небольшим (1-10). Будем обучать 20 моделей, из которых оставим 5 лучших.



Уберём функции активации на последнем слое, которые выдают ответ в диапазоне [0,1] или [-1,1].


Шаг 4 – обучение и анализ результатов

Обучаем и смотрим на результаты.


Здесь в столбце Архитектура можно увидеть количество скрытых нейронов, а в последующих трёх столбцах – качество модели на обучающей, валидационной и тестовой подвыборках.

Можно видеть, что качество на обучающей и тестовой подвыборках весьма высоко, это значит, что моделям удалось отыскать реальные зависимости в данных.

Шаг 5 – выбор лучших моделей

Лучшее качество на тестовой выборке показала модель под номером 2: 0,992442.

Выберем эту модель и более подробно исследуем её результаты.

Нажмём на кнопку Выбрать\Снять сети.


В открывшемся окне выбираем сеть с номером 2 и нажимаем ОК.


Шаг 6 – анализ чувствительности

Анализ чувствительности позволяет оценить важность каждой переменной для обученной модели.

Перейдём на вкладку Итоги анализа и выберем глобальный анализ чувствительности.



Числа в построенной таблице показывают, во сколько раз увеличится ошибка модели, если убрать соответствующую входную переменную из анализа. Если отношение меньше единицы, то удаление соответствующей переменной улучшает качество работы сети.

Можно видеть, что ответы модели наиболее чувствительны к переменным Temperature и Settling, то есть к температуре и времени оседания. Таким образом, удаление этих переменных сильно ухудшит качество рассматриваемой модели.

При этом по показателю чувствительности нельзя определить, как именно влияют переменные на предсказанное значение, увеличивают или уменьшают его. Проверить это можно экспериментально, задав модели наблюдения с разными значениями исследуемой переменной.



По результатам модели при увеличении температуры и времени оседания эффективность процесса возрастает.

Шаг 7 – графический анализ предсказаний

На вкладке Графики построим диаграмму рассеяния для целевой переменной и выхода нейронной сети.



Точки расположены вдоль прямой с незначительными отклонениями. Это значит, что модель хорошо восстановила зависимость в исходных данных. Об этом говорит и R2-коэффициент этой модели, который близок к единице.

Шаг 8 – анализ остатков

Посмотрим на гистограмму остатков.




Распределение остатков слабо похоже на нормальное, так как наблюдаются два пика.

Шаг 9 – вычисление среднего абсолютного остатка

Найдём среднее значение ошибки.



Выделим столбец с абсолютными остатками и найдём среднее значение.



Шаг 10 – сохранение моделей

Сохраним обученную модель, чтобы её можно было повторно использовать в дальнейшем.





Вернуться назад в окно с Excel-интерфейсом можно при помощи опции Окна на вкладке Главная:


Шаг 11 – применение модели к новым данным

Сохранённую модель можно применить к новым данным для получения результатов.

Допустим, мы открыли файл, содержащий новые данные (способом, описанным в пункте Интеграция Excel и Statistica).



Чтобы применить обученную ранее нейронную сеть, нужно в верхней строке выбрать Анализ, Автоматизированные нейронные сети.




В открывшемся окне в этот раз нужно выбрать Загрузить модели из предыдущих анализов и нажать Загрузить сети.

Далее нужно выбрать сохранённую модель и нажать Открыть.


В окне нового анализа, как и в последующем окне, наживаем ОК.



Теперь можно применять нейросеть к новым данным. Чтобы получить предсказания, нужно нажать Предсказанные.



Выводы

Имеется возможность за несколько нажатий кнопки без лишних усилий соединить интерфейс Excel и широкий спектр возможностей Statistica и применить различные методы анализа к данным, представленным в Excel-документе.

Приложение 1

Если вы хотите запустить анализ Statistica из Visual Basic другого приложения (например, Excel), вам вначале нужно загрузить необходимые библиотеки Statistica (часто с помощью параметра «References» в меню «Tools » редактора Visual Basic приложения), и, во-вторых, создать объект типа Statistica.Application.

Затем вы можете создавать объекты анализа, которые являются частью объекта Statistica.Application.

Этот вариант доступен при наличии лицензии Statistica Enterprise.

Так, например, чтобы получить доступ к функциям библиотеки Statistica Basic Statistics из Microsoft Excel, вы должны использовать такой код Visual Basic:


Set x = CreateObject("Statistica.Application")

Set a = x.Analysis(scBasicStatistics, _


Обратите внимание, что теперь x является объектом типа Statistica.Application; a - объект типа Statistica.Application.Analysis.


Когда вы запускаете программу из редактора программ Statistica Visual Basic (SVB), вы можете опустить явное объявление объекта Statistica.Application и просто написать:

Set a = Analysis(scBasicStatistics, _


Когда вы запускаете программу из Statistica, программа «знает», что объект анализа является частью текущего Statistica.Application.

Вы также можете создать новый Statistica.Application; например, запустить следующую программу из SVB:Sub Main


' Launch a new application; assign the new
' application object to x.
Set x = New Application
' Declare variables (objects) so we can assign
' the input data Spreadsheet after we launched
' the application; note that we could also launch
' the Statistica Basic Statistics module with an
' optional data file name parameter; however, for
' illustration purposes we will maintain an explicit
' object for the Spreadsheet.
Dim InputDocument As StaDocuments
Dim InputFile As Spreadsheet
Set InputDocument=x.Spreadsheets
' Here the input data Spreadsheet is opened, and
' the newly opened document object assigned to
' variable InputFile.
Set InputFile=InputDocument.Open( _
Path & "\Examples\Datasets\exp.sta")
' Next we launch the Statistica Basic Statistics
' module; note that we could have also launched it
' with an optional input data file parameter; i.e.
' Set a = x.Analysis(scBasicStatistics, _
' Path & "\Examples\Datasets\exp.sta")
Set a = x.Analysis(scBasicStatistics, InputFile)
' Make the application visible, the input data
' Spreadsheet visible, and the analysis (start-up
' dialog) visible.
InputFile.Visible=True
x.Visible=True
a.Visible=True
' Here we could add additional code to perform
' computations with this or other modules.
End Sub

Эта программа создаст (запустит) новое приложение Statistica; затем он откроет файл входных данных и запустит модуль базовой статистики Statistica.

Все объекты, объявленные в этой программе, становятся видимыми, поэтому, когда это будет сделано, вы увидите новое приложение Statistica, файл входных данных (электронную таблицу) и панель запуска для модуля базовой статистики.

Источники

1. В.П.Боровиков. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003. – 688 с.: ил.

2. В.П.Боровиков. Нейронные сети, Горячая Линия Телеком, 2008

3. В.П.Боровиков. Популярное введение в современный анализ данных и машинное обучение на STATISTICA , Горячая Линия Телеком, 2018

Читайте также: