Современные компьютерные технологии виды статистических пакетов

Обновлено: 04.07.2024

Математические методы статистики становятся всё более популярными в психологии. Объясняется это просто: математическая статистика даёт специалистам-практикам мощный, хорошо разработанный аппарат для объективного анализа результатов педагогического, медицинского, психологического обследований и выработки практических рекомендаций.
Стандартные статистические методы включены в состав популярных электронных таблиц, таких как Excel, Lotus 1-2-3, Quattro Pro, а также в математические пакеты общего назначения, например Mathcad, Maple и др. Однако гораздо большими возможностями обладает специализированное программное обеспечение – статистические программные продукты (СПП).
В настоящее время международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.

Содержание

1. Обзор статистических пакетов 6
1.1. SAS 8
1.2. SPSS для Windows 11
1.3. SYSTAT 12
1.4. MINITAB 15
1.5. STATISTICA 16
2. Расчетная часть 20
Задание № 1 20
Задание №2 22
Задание №3 23
Задание №4 25
Заключение 26
Список использованных источников 27

Вложенные файлы: 1 файл

IT в экономикеке.docx

Министерство образования и науки РФ

Федеральное государственное автономное образовательное учреждение

высшего профессионального образования

«Российский государственный профессионально-педагогический университет»

Институт менеджмента и экономической безопасности

Кафедра экономики предпринимательства

по дисциплине: Информационные технологии в экономике

Исполнитель: Подылина Е.. студент Х курса, группа ХХХХ

Руководитель: ХХХХ, к.э.н., профессор, доцент

(Ф.И.О., должность, уч. степень, уч. звание)

Работа допущена к защите «__»______2013г.

Работа защищена «__»_______2013г. с оценкой

1. Обзор статистических пакетов 6

1.2. SPSS для Windows 11

1.5. STATISTICA 16

2. Расчетная часть 20

Список использованных источников 27

В развитых странах практически любое решение: политическое, финансовое, техническое, научно-исследовательское и даже бытовое решение принимается только после всестороннего анализа данных. Поэтому изучение прикладной статистики и методов анализа данных является неотъемлемым компонентом образования на всех уровнях, а компьютерные пакеты для аналитических исследований и прогнозирования являются настольным рабочим инструментом любого специалиста, так или иначе связанного с информационной сферой.

Исключительно важное значение при выполнении психологического исследования имеет психометрическая обработка результатов экспериментальных исследований. Современные компьютерные программы обработки данных предлагают богатый набор способов такого преобразования, замечательным образом расширяющий возможности анализа данных.

О ценности полученных эмпирических данных нельзя судить без серьезного математического анализа, без использования современных информационных компьютерных технологий, применение которых свидетельствует не только об умении исследователя применять статистические методы исследования, но и о достоверности полученных результатов и возможности их использования в практике.

Исследователю необходимо умение организовать эмпирические данные, обработать и проинтерпретировать, что невозможно без применения математических методов и современных компьютерных программ, применение которых сейчас становится нормой для исследователя.

Математические методы статистики становятся всё более популярными в психологии. Объясняется это просто: математическая статистика даёт специалистам-практикам мощный, хорошо разработанный аппарат для объективного анализа результатов педагогического, медицинского, психологического обследований и выработки практических рекомендаций.

Стандартные статистические методы включены в состав популярных электронных таблиц, таких как Excel, Lotus 1-2-3, Quattro Pro, а также в математические пакеты общего назначения, например Mathcad, Maple и др. Однако гораздо большими возможностями обладает специализированное программное обеспечение – статистические программные продукты (СПП).

В настоящее время международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.

Как правило, статистические пакеты имеют следующую структуру:

1. Блок описательной статистики и разведочного анализа исходных данных: анализ резко выделяющихся значение исследуемого признака, восстановление пропущенных значений, частотная обработка исходных данных (построение гистограмм, полигонов частот, вычисление выборочных средних дисперсий и т.д.), проверка статистических гипотез об однородности исследуемых совокупностей, оценка критериев согласия, визуализация распределения статистических данных и др.;

  • Блок статистического исследования динамики и зависимостей: дисперсионный и ковариационный анализ, корреляционно-регрессионый анализ, анализ временных рядов и др.;
  • Блок классификации и снижения размерности: дискриминантный анализ, статистических анализ смесей распределений, кластерный анализ и другие;
  • Блок методов статистического анализа нечисловых данных и экспертых оценок: анализ таблиц сопряженности, логлинейные модели, ранговые методы и др.;
  • Блок планирования эксперимента и выборочных исследований;
  • Блок вспомогательных программ.

Пакеты статистической обработки позволяют изучать тенденции изменения числовых данных и оценивать уровень достоверности результатов. Под статистической обработкой понимается использование методов однофакторного и двухфакторного анализа, статистических показателей (вариация, среднее, медиана, мода и т.д.), частотного распределения, корреляционного и регрессионного анализа и т.д.

Обзор статистических пакетов

На рынке математического обеспечения в эпоху больших компьютеров лидировали несколько статистических пакетов - BMDP, SAS и SPSS. Это объяснялось тем, что фирмы-разработчики достаточно быстро реагировали на достижения в области анализа данных и ими был накоплен большой запас прочности, позволивший далеко оторваться от конкурентов. С появлением персональных компьютеров, новых языков программирования и технологий лидировавшим фирмам пришлось решать сложную задачу: создавать пакет для ПК заново или адаптировать уже существующую программу к требованиям "маломощных" компьютеров. Вместе с тем, богатые графические возможности ПК дали шанс менее известным фирмам сравнительно быстро создать новые, ныне очень популярные, программные средства анализа данных. В этот период появился пакет STATGRAPHICS (STATistical GRAPHICs System) фирмы Manugistics. Он настолько выигрышно отличался от других статистических пакетов удобством пользовательского интерфейса, что завоевал огромную популярность и в дальнейшем задал основные ориентиры для развития всей индустрии в целом. За последние годы, наконец, появились Windows-версии наиболее известных статистических систем. А корпорации SPSS и Manugistics выпустили версии для Windows 95/NT и продолжают наращивать огромный потенциал своих систем.

Для того, чтобы статистический пакет общего назначения был удоб­ным и эффективным в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он:

1. содержал достаточно полный набор стандартных статистических методов;

2. был достаточно простыми для быстрого освоения и использо­вания;

3. отвечал высоким требованиям к вводу, преобразованиям и орга­низации хранения данных как в самом пакете, так и обмену с широко распространенными базами данных ( dBase , Lotus 1-2-3 и т.п.);

4. имел широкий набор средств графического представления дан­ных и результатов.

5. имел подробную документацию, хорошо продуманную с учетом интересов как начинающего пользователя, так и специалиста-статистика.

Наконец, немаловажное значение имеет цена пакета. Профессио­нальные западные статистические пакеты ( SAS , BMDP и т.д.) обычно стоят от 2 до 10 тысяч долларов и более. Эти пакеты позволяют обраба­тывать гигантские объемы данных, включают средства описания задач на встроенном языке и дают возможность построения на их основе систем обработки информации для целых предприятий.

Пакеты, рассчитанные на массового пользователя, стоят дешевле — обычно 500—1500 долларов. Эти пакеты отличаются от профессио­нальных прежде всего ориентацией на индивидуального пользователя: преимущественно диалоговым режимом работы, наличием ограничений по объему обрабатываемых данных и т.д. Имеются и более дешевые пакеты (200-300 долларов и ниже), но они обычно обладают весьма скромными возможностями.

Отечественные статистические пакеты стоят существенно дешевле, как правило, их цена составляет от 200 до 500 долларов.

В отличие от западных, многие отечественные пакеты в гораздо большей степени подходят для нужд среднего российского пользователя. Здесь основные операции обычно сразу обозримы из головных меню, а рутинные процедуры выполняются с минимумом действий и разветвлений по принципу: «прямым путем – к понятному результату».

Наиболее развитой системой контекстной экранной помощи включающей объемный справочник-гипертекст и экспертную систему по выбору метода статистического анализа, обладает пакет STADIA . Здесь каждый числовой статистический вывод сопровождается короткой и понятной интерпретацией (впрочем, более искушенный в статистике пользователь может сделать интерпретацию результатов сам, благо все данные для этого также выводятся на экран).

В пакете Мезозавр реализована оригинальная система экспертной оценки сложных моделей временных рядов. Система Эвриста выделяется живо и изобретательно написанной документацией, которая читается как захватывающее повествование о возможностях статистических методов.

Все три пакета аккумулируют передовой опыт российской науки, что не удивительно: их создавали ведущие специалисты Академии наук и Московского университета. Они стабильно распространяются и эксплуатируются сотнями пользователей на протяжении целого ряда последних лет.

Замечание. Периодически на выставках и семинарах можно встретить и другие российские программы анализа данных (например, достаточно интересный интегрированный пакет «Термит» г. Кемерово, представленный на выставке SofTool -93).

STATISTICA - это универсальная интегрированная система, предназначенная для статистического анализа, визуализации данных и разработки пользовательских приложений. Программа содержит широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе. Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента.

Пользователями системы являются крупнейшие университеты, исследовательские центры, компании, банки всего мира, государственные учреждения.

Система STATISTICA может служить не только эффективным инструментом для научных исследований, но и чрезвычайно удобной средой для обучения методам статистического анализа. Система STATISTICA активно используется в учебном процессе в таких вузах, как МГУ, МГИЭМ, МЭСИ, МФТИ, МИФИ, МГТУ им. Баумана, СПбГУЭФ и многих других.

Пакет STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения.

Пользователь может добавить собственную панель инструментов с тем или иным методом статистического анализа. Несомненным достоинством пакета является возможность дописывать (наращивать) систему при помощи встроенного языка программирования.

STATISTICA Neural Networks - универсальный и мощный нейронно-сетевой пакет. Он дает возможность автоматически получать эффективные и правильные решения для широкого круга задач, в которых использование традиционных статистических методов затруднено, например, из-за отсутствия априорных моделей или конкретных гипотез.

Универсальный российский статистический пакет STADIA - за 12 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.

Следует обратить внимание на удивительную компактность пакета STADIA : он требует в несколько раз меньше места на диске, чем его конкуренты, и при этом не уступает, а часто и превосходит их по своим функциональным возможностям.

Пакет работает на любом IBM-совместимом компьютере (от 286 и выше) и в любой среде Windows от 3.11 и выше. Для Windows NT и Windows 2000 существует специальная модификация. Программа занимает на диске 4.1 Мб и требует минимальной памяти от 8 Мб.

Возможности:

1. исчерпывающий набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений.

2. полный комплект деловой и научной, 2-х, 3-х и многомерной графики: функции, зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, столбиковые, башенные и круговые диаграммы, установка размеров, надписей по осям и под рисунком и проч.

3. разнообразные преобразования и вычисления, импорт / экспорт данных и результатов;

4. развитая экранная помощь, понятная интерпретация результатов.

Demo -версия программы STADIA обладает всеми возможностями пакета и позволяет обрабатывать данные небольшого объема (до 400 чисел), вводимые с клавиатуры. Тем самым она позволяет самостоятельно и практически овладеть всеми современными методами прикладной статистики, а во многих областях исследования сразу получить научные и практически значимые результаты.

Программный продукт, предназначенный для статистической обработки данных. Отечественные статистические пакеты, представленные на рынке. Статистические пакеты STATA, STADIA, SPSS, STATISTICA и др., их особенности, возможности, преимущества и недостатки.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 30.01.2014
Размер файла 18,5 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Статистический пакет - программный продукт, предназначенный для статистической обработки данных.

Являются надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.

Для успешной работы любой организации в условиях рынка и конкуренции, конечно, необходим тщательный анализ имеющейся информации о создании продукции, её сбыте, эксплуатации, а также анализ информации о конкурентах и т. п. Конечно можно положиться на интуицию, но, скорее всего, правильное решение будет принято, только если у вас имеется огромный многолетний опыт в этой сфере деятельности. Но можно (и даже нужно, несмотря на весь опыт) пойти другим путём -- воспользоваться специальными средствами для обработки информации. И вот здесь-то и потребуется профессионализм -- необходимо правильно выбрать программное обеспечение, корректно ввести информацию, которую вы хотите проанализировать, выбрать методы и алгоритмы для решения именно этой задачи и многое другое.

Можно выделить 2 вида статистических пакетов.

Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP,SAS, CSS, STATISTICA, S-plus, и др. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП: Стат-Эксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др.

Отечественные статистические пакеты, которые устойчиво представлены на рынке в течение последних лет, в значительной степени лишены таких недостатков, которые есть у западных продуктов. Они предполагают наличие широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.

Одним из обязательных этапов любого научного исследования является статистический анализ данных. Продолжительное время анализ медицинских данных был уделом специалистов, так как это требовало серьезной предварительной подготовки. С появлением и совершенствованием современных программ обработки данных статистическая обработка поднялась на новый уровень. Теперь исследователь-медик может и не иметь математической подготовки. Достаточно оперировать статистическими понятиями и, самое главное, правильно выбрать метод анализа. Все осуществимо благодаря компьютеру и новейшим программам.

Все программы статистической обработки данных можно разделить на профессиональные, полупрофессиональные (популярные) и специализированные. Статистические программы относятся к наукоемкому программному обеспечению, цена их часто недоступна индивидуальному пользователю. Профессиональные пакеты имеют большое количество методов анализа, популярные пакеты - количество функций, достаточное для универсального применения. Специализированные же пакеты ориентированы на какую-либо узкую область анализа данных. Создатели программных статистических пакетов заявляют, что их продукт превосходит аналоги. Отсутствие у большинства исследователей времени для освоения нескольких программ, делает непростым ее выбор. В данной статье приведена базовая информация о присутствующих на рынке основных полупрофессиональных программных пакетах пригодных для статистической обработки биомедицинских данных.

STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу.

SPSS (Statistical Package for Social Science). Самый часто используемый пакет статистической обработки данных с более чем 30-и летней историей). Отличается гибкостью, мощностью применим для всех видов статистических расчетов применяемых в биомедицине. Недавно вышла 13-я англоязычная версия. Существует русскоязычное представительство компании которое предлагает полностью русифицированную версию SPSS 12.0.2 для Windows. Появился учебник на русском языке, позволяющий шаг за шагом освоить возможности SPSS, репетитор по статистике на русском языке, помогающий в выборе нужной статистической или графической процедуры для конкретных данных и задач, а также справка по SPSS Base и SPSS Tables. Российский офис SPSS регулярно проводит учебные курсы по анализу данных при помощи программного обеспечения SPSS. На русский язык переведена книга по SPSS, которая вышла в свет в 2002 году в Киевском издательстве «Диасофт» под названием «SPSS 10: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей».

STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт. Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.

STATISTICA. Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения, начиная с 1985 года. STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных следующими специализированными статистическими модулями: Основные статистики и таблицы, Непараметрическая статистика, Дисперсионный анализ, Множественная регрессия, Нелинейное оценивание, Анализ временных рядов и прогнозирование, Кластерный анализ, Факторный анализ, Дискриминантный функциональный анализ, Анализ длительностей жизни, Каноническая корреляция, Многомерное шкалирование, Моделирование структурными уравнениями и др. Несложный в освоении этот статистический пакет может быть рекомендован для биомедицинских исследований любой сложности.

Статистический пакет STATISTIKA

Statistica-- пакет для всестороннего статистического анализа, разработанный компанией StatSoft.

Алгоритмы математической статистики, реализованные в пакете:

Многомерная линейная и нелинейная регрессия;

Дискриминантный и кластерный анализ, деревья классификаций;

Проверка гипотез о виде распределения;

Некоторые алгоритмы непараметрической статистики;

Прогнозирование временных рядов на основе одномерных моделей АРПСС.

Преимущества и недостатки пакета STATISTICA

Преимущества пакета STATISTICA:

- Наибольший из всех изученных пакетов инструментарий визуализации полученных результатов;

- Наличие руссифицированной версии;

- В пакете представлена полная реализация алгоритмов статистической классификации;

- Наличие возможности реализовать и использовать собственные алгоритмы (через написание макросов).

- Алгоритмы интеллектуального анализа данных (Data Mining).

Недостатки пакета STATISTICA:

- Применение пакета требует высокой теоретической подготовки в ТВиМС. статистический обработка данные пакет

- Отсутствие реализации некоторых важных тестов временных рядов (в частности - тестов на стационарность).

В случае парной регрессии уравнение определяется по двум наборам данных, один из которых представляет значения зависимой переменной y, а другой - независимой переменной х. В случае множественной регрессии уравнение определяется по нескольким наборам данных, один из которых представляет значения зависимой переменной y, а другие независимыми переменными х1, х2,, xm. Получение уравнения регрессии происходит в два этапа: подбор вида функции и вычисление параметров функции. Выбор функции, в большинстве случаев, производятся среди линейной, квадратичной, степенной и др. видов функций (табл. 2). К функции предъявляются следующие требования: она должна быть достаточно простой для использования ее в дальнейших вычислениях и график этой функции должен проходить вблизи экспериментальных точек так, чтобы сумма квадратов отклонений y-координаты всех экспериментальных точек от y-координат графика функции была ба минимальной (метод наименьших квадратов). Таблица 2 - Виды функций, применяемых в регрессионных моделях Парная (простая) регрессия Множественная регрессия Линейная регрессия y=ax b, y = а0 a1x1 amxm Квадратичная (параболическая) y=ax2 bx c y= а0 a1x12 am xm2 Степенная y=axb y = а0 x1 a1 x2 a2 xm am Логарифмическая y=al x b, Гиперболическая y = а0 a1 (1/x1) am(1/xm) Экспоненциальная y=aebx где a, b, c - коэффициенты парной регрессии. где а0, a1, a2,,am - коэффициенты множественной регрессии, - объем совокупности, m - количество факторных признаков. ? Какой вид регрессионного анализа (парный или множественный) в большей степени отвечает реальным условиям? ? Можно ли учесть все факторы х1, х2,, xm, в случае множественной корреляции? Для количественной оценки точности построения уравнения регрессии предназначен коэффициент детерминации R2, равный квадрату коэффициента корреляции и указывающий, какой процент изменения функции у объясняется воздействием факторов хk. Чем его значение ближе к 1, тем уравнение точнее описывает исследуемую зависимость. Значимое уравнение (с R2 близким к 1) используется, как правило, для прогнозирования изучаемого явления. Прогноз - это вероятностное суждение о будущем, полученное путем использования совокупности научных методов. Например, прогнозирование финансового состояния выполняется для того, чтобы получить ответы на два вопроса: «как это может быть (какими могут стать финансовые показатели, если не будут приняты меры по их изменению)» и «как это должно быть (какими должны стать финансовые показатели фирмы для того, чтобы ее финансовое состояние обеспечивало высокий уровень конкурентоспособности)». Прогнозирование с целью получения ответа на первый вопрос принято называть исследовательским, на второй - нормативным. Существует два способа прогнозов по уравнению регрессии: в пределах экспериментальных значений (интерполяция) и за пределами (экстраполяция). Применимость всякой регрессионной модели ограничена, особенно за пределами экспериментальной области, т.к. характер зависимости может существенно измениться. Поэтому достоверность исследовательского прогноза может быть невысокой. Однако его выполнение полностью обосновано. 1.2 Статистический пакет S A IS ICA Так как статистические методы находят широкое применение во всех сферах производства, то рынок компьютерных технологий предлагает большое количество прикладных программ, которые позволяют проводить такой анализ.

Иногда это можно сделать, изменив порядок следования команд в коде, предназначенном для проведения атаки. Иногда проще организовать нападение таким образом, чтобы взламывать пакеты выборочно. Так же как антивирусным компьютерным программам нужно постоянное обновление и пополнение новыми образцами кода, этому типу системы обнаружения вторжений необходимо постоянное обновление базы данных образцов нападения. Не ясно, сможет ли когда-нибудь такая база данных не отстать в соревновании с инструментом хакера. Другим принципом работы системы обнаружения вторжений является обнаружение аномалии. IDS осуществляет некоторое статистическое моделирование вашей сети и вычисляет, что является нормой. Затем, если происходит какое-либо отклонение от нормы, она подает звуки тревоги. Здесь все может быть сделано по правилам (система знает, что нормально, и сигнализирует обо всем остальном), с использованием статистики (система статистически вычисляет, что нормально, и сигнализирует обо всем остальном) или с применением методов искусственного интеллекта

SPSS Statistics (Statistical Package for the Social Sciences) -- компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в первую очередь социальных науках.

По сравнению с ранее приведенными пакетами, обладает существенно меньшим инструментарием статистического анализа данных.

Преимущества и недостатки пакета SPSS

Преимущества пакета SPSS:

- Имеются русифицированные версии пакета.

- Позволяет параллельно обрабатывать несколько подвыборок.

- Простота в освоении.

- Имеются специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis). Удобен при обработке результатов опроса.

- Имеется модуль для автоматизации процесса разработки анкеты и ввода результатов опросов (Data Entry).

Недостатки пакета SPSS:

- Отсутствует возможность реализации собственных алгоритмов;

- Существенно уступает в глубине анализа данных.

Список использованной литературы

1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. М.:ИНФРА - М. 2003. 544 с.

3. Тюрин Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. М., 1985. 33 с.

Подобные документы

Спектр задач, которые решают математические программные пакеты (Maple, MathCad, Mathematica и MatLab). Математические исследования, требующие вычислений и аналитических выкладок. Разработка и анализ алгоритмов. Визуализация, научная и инженерная графика.

презентация [148,7 K], добавлен 06.01.2014

Развитие новых информационных и телекоммуникационных технологий. Решение экономической задачи с использованием табличного процессора Microsoft Excel. Возможности Excel при работе с функциями. Математические и статистические пакеты прикладных программ.

курсовая работа [452,8 K], добавлен 01.04.2009

курсовая работа [36,8 K], добавлен 23.06.2011

Сущность понятия "диапазон ячеек". Правила образования выражений. Приоритеты выполнения операций в выражениях. Категории стандартных функций: математические; статистические; логические; финансовые. Стандартные действия, которые можно выполнять с данными.

лабораторная работа [19,0 K], добавлен 11.12.2009

Базы данных, содержащие информацию о графических редакторах. Предметная область, словарь понятий и терминов. Построение функциональных зависимостей. Синтез схемы базы данных на основании функциональных зависимостей. Построение неизбыточного покрытия.

XXI век принято называть веком информационных технологий. Сегодня наблюдается стремительная информатизация всех сфер жизни общества, и игнорировать этот процесс просто невозможно. Информационные технологии окружают нас повсеместно, хотя порой мы этого и не осознаём. В частности наблюдается активное внедрение информационные технологий в сферу социологии [1].

Специфика проведения социологического исследования состоит в том, что исследователям приходится работать с огромными массивами данных, обрабатывать которые вручную задача весьма сложная, трудоёмкая, а иногда и вовсе невозможная. Так, например, в работах А.В. Мальцевой [2,3,4] анализ трансформации социальной структуры общества основывается на информации из производственных баз данных, содержащих сотни тысяч записей, результатах массовых социологический опросов и экспертных оценках. Проведение подобных полномаштабных работ занимает много времени и требует большой точности и аккуратности от исследователя, использование информационных технологий на каждом этапе позволяет автоматизировать часть работ и обеспечить большую точность результатов.

Использование различных программных и технических средств в процессе проведения социологического исследования позволяет решить многие проблемы, получить разнообразную информацию о различных областях жизни современного общества [5,6,7]. Сегодня на рынке существует большое число специализированных программных продуктов, облегчающих процесс проведения социологических исследований на разных этапах, от составления программы исследования до анализа полученных данных и составления отчёта о проделанной работе.

Основными этапами проведения социологического исследования являются три основных этапа: подготовительный этап, сбор данных и анализ данных. На каждом из них, так или иначе, используются различные информационные технологии. Рассмотрим возможности использования информационных технологий на каждом из этих этапов.

Первый этап исследования – подготовительный. На этом этапе происходит формулировка задачи исследования и её осмысление, предварительное изучение объекта исследования: рассмотрение его структуры, функций, целей. Составляется план исследования и разрабатывается программа.

Одним из основных технических средств, использующихся на данном этапе, является сеть Интернет. Она и служит источником информации о рассматриваемом объекте. Однако не всё, что найдено на просторах глобальной сети, можно слепо принимать на веру. Для проведения каких-либо серьёзных научных изысканий требуются надёжные источники информации, какими и являются различные базы и банки социологических данных. Наиболее известными и распространёнными банками социологических данных являются Банк социологических данных Института социологии РАН [9] и Единый архив экономических и социологических данных (ЕАЭСД) [10]. В них хранятся уникальные архивы данных, результаты различных исследований, проводимых ведущими научными центрами страны. Они могут стать незаменимыми источниками данных. Чтобы получить доступ к данным, исследователю нужно всего лишь заполнить специальную форму-запрос, в которой указывается, для какой работы необходимы данные, и выслать эту форму на электронный адрес. Данные предоставляются в формате SPSS, что очень удобно для дальнейшей работы.

На подготовительном этапе происходит разработка программы исследования, что подразумевает большие объёмы бумажной работы. Она предполагает описание целей, задач исследования, постановку проблемы, составление вопросов, если планируется анкетирование, разработку предварительного плана исследования. Наиболее известным инструментом, используемым на этом этапе, являются различные текстовые редакторы, например, Microsoft Office Word, стандартный блокнот Windows, Notepad и т.д. Они позволяет сохранить и упорядочить всю собранную информацию.

Одним из последних пунктов программы исследования является разработка анкеты. Сегодня существуют различные программы и онлайн – сервисы, которые позволяют облегчить процесс составления анкеты.

Ещё сравнительно недавно вопросы анкет и инструкции респондентам писались вручную, либо набирались исследователем в текстовом редакторе, что отнимало много времени, и было не очень удобно. На сегодняшний день существуют много различных возможностей, позволяющих упростить процесс разработки анкеты. Например, такие программы, как Microsoft Office InfoPath. Это средство для создания форм и сбора данных. С помощью этой программы можно создавать различные электронные формы для быстрого сбора информации. Пользователям предоставляется много возможностей для создания форм, в том числе большое количество шаблонов, возможности создания форм с нуля и т.д.

Среди программ для создания анкет можно также выделить такие как Interro-SL, iSpring QuizMaker и др. Эти программы обладают аналогичными функциями. Они также содержат ряд шаблонов, включают возможность составления отчёта по результатам анкетирования, который может быть представлен в табличной и графической форме.

Помимо этого, зачастую для создания анкет исследователи используют различные онлайн - сервисы. Преимуществом таких сервисов является полная анонимность респондентов. Благодаря этому люди охотнее соглашаются принять участие в опросе. Наиболее известными сервисами в среде социологов являются формы Google, сервис WebAnketa, Анкетёр, CreateSurvey, Анкетолог, Aeterna и многие другие. Они позволяют буквально за несколько простых шагов создать несложную анкету, что и является причиной их большой популярности. Также в процессе заполнения таких анкет автоматически формируется первичная статистика. Некоторые сервисы, как например формы Google, включают различные графические средства для представления результатов анкетирования.

Следующий этап проведения социологического исследования – сбор данных, или так называемый «полевой» этап. Интенсивность применения различных информационных технологий на этом этапе зависит от того, какой метод сбора данных выбран. Если это анкета или опрос, то, как уже сказано выше, может быть использован текстовый редактор для конструирования вопросов, специализированная программа, или онлайн - сервис. Анкеты могут быть разосланы респондентам с помощью программы электронной почты. Это удобно в том случае, когда опрашиваемый находится за тысячи километров от исследователя, или количество опрашиваемых слишком велико. Фиксировать ответы респондентов удобно в табличном редакторе или в базе данных, что впоследствии может облегчить анализ полученных данных.

Если в качестве метода сбора данных выбрано интервью, здесь возможны разные варианты. При личном контакте с респондентом на помощь исследователю придут такие технические средства как диктофон, видео камера и т.п. Съёмка видеокамерой позволяет фиксировать не только ответы респондентов, но и их жесты, интонации, мимику, всё, что может отражать истинное отношение респондента к предмету обсуждения. Если респондент находится на значительном расстоянии и личное присутствие на интервью невозможно, то вопросы можно переслать с помощью программы электронной почты. Кроме того, сегодня есть возможность проведения интервью с помощью программы бесплатных видеозвонков Skype

Видеосъёмка также окажет значительную помощь исследователю при проведении фокус-групп. В процессе проведения фокус-группы модератор не имеет возможности следить за всеми участниками сразу, поэтому в процессе дискуссии, как правило, ведётся аудио- и видеозапись. Это помогает в дальнейшем лучше понять отношение участника фокус-группы к тому или иному вопросу.

После проведения исследования наступает этап обработки и анализа полученных данных. На этом этапе исследователю необходимо систематизировать массив полученных в результате анкетирования и опроса данных, расшифровать видеозаписи, упорядочить какие-либо количественные данные.

Результатом полевого этапа социологического исследования могут быть различные качественные данные: тексты интервью, материалы групповых дискуссий и т.д. Для анализа этих данных исследовательским комитетом «Системная социология» Российского общества социологов была разработана система Контент-Анализ Про. В данной программе реализованы 2 вида контент-анализа: смысловой и частотный. Смысловой предназначен для анализа смысла текста, подтекста, включённого автором в текст. Частотный - позволяет проанализировать частоту встречаемости в тексте различных фрагментов: слов, предложений и т.д. Существует множество аналогов этой системы. К ним можно отнести такие программы, как ВААЛ, Text Mining и др.

Для анализа количественных данных существует большое количество различных специализированных программ – статистических пакетов, каждый из которых обладает рядом достоинств и недостатков. Для реализации различных задач можно использовать разные статистические пакеты.

В разные статистические пакеты включены разнообразные методы статистики от простой описательной статистики до анализа главных компонент. Согласно существующей классификации, всё многообразие статистических пакетов можно делится на три группы:

  1. Интегрированные методоориентированные пакеты общего назначения. Такие пакеты ещё можно назвать универсальными, т.к они не ориентированы на какую-то конкретную предметную область. Они имеют относительно простой интерфейс, что позволяет работать с пакетом не только профессиональным исследователям, но и обычным пользователям. Но в то же время в таких пакетах содержится широкий диапазон статистических методов. К этой группе пакетов можно отнести SPSS, STATA, STATISTIKA и другие.
  2. Специализированные методоориентированные пакеты. Как правило, эти пакеты содержат методы 1-2 разделов статистики, применяемые в какой-либо предметной области. Зачастую это системы, ориентированные на корреляционно-регрессионный анализ, анализ временных рядов, кластерный или факторный анализ. К специализированным пакетам статистической обработки данных можно отнести отечественные программы STADIA, Олимп и др. Среди зарубежных пакетов можно выделить SAS, BMDP.
  3. Предметно- (или проблемно-) ориентированные пакеты. Эти пакеты предназначены для решения вопросов, связанных с конкретной предметной областью. Они ориентированы на высококвалифицированных специалистов. Зачастую в составе этих пакетов присутствуют оригинальные разработки авторского коллектива. К ним можно отнести такие пакеты, как BioStat, MESOSAUR, DATASCOPE.

Специалисты-социологи зачастую используют в своей работе универсальные и реже специализированные пакеты, наиболее распространёнными из которых являются зарубежные пакеты SPSS, STATA, STATISTICA, STATGTRAPHICS, SYSTAT, S-PLUS и т.п. Среди отечественных аналогов можно выделить STADIA, ЭВРИСТА, ОЛИМП: Стат-Эксперт, MESOSAUR, КЛАСС-МАСТЕР и др. В силу того что проблемно-ориентированные пакеты предназначены для высококвалифицированных профессионалов, они мало распространены и используются только при проведении каких-либо масштабных исследований.

Из перечисленных пакетов в России наиболее распространены следующие: SPSS, STATA, STATISTICA, STADIA, ОЛИМП: Стат-Эксперт др. Рассмотрим каждый из них более подробно.

Программа SPSS, согласно приведённой классификации, относится к пакетам общего назначения, однако обладает большим разнообразием функций.

Пакет является основным для преподавания статистического анализа студентам во многих гуманитарных университетах как зарубежных, так и отечественных.

IBM SPSS Statistics — это интегрированное семейство продуктов для аналитического процесса. Стоит отметить, что практически ежегодно компания выпускает новую версию SPSS, изменяет дизайн, включает новые возможности работы с пакетом. На сегодняшний день выпущена 23 версия пакета. Программа SPSS состоит из модулей. В базовом модуле содержится большой набор статистических процедур, который может быть дополнен за счет встраиваемых дополнительных модулей .

Пакет IBM SPSS Statistics поставляется в пяти редакциях:

Также к статистическим пакетам общего назначения относится программа STATA. Это пакет для решения задач в различных прикладных областях: экономике, медицине, социологии. Первая версия продукта появилась на рынке в 1985г. На сегодняшний день выпущена 13 версия программы.

STATA поставляется в четырёх редакциях:

  • Stata/MP
  • Stata/SE
  • Stata/IC
  • Small Stata

Stata традиционно являлась пакетом, который управляется при помощи команд, вводимых с клавиатуры, и работает в графическом или оконном режиме. Позднее в версии программы Stata 8 появился графический интерфейс пользователя для ввода команд. Stata также может оперировать с командной строкой на системах аналогичных UNIX. Количество переменных, которое можно вносить в программу Stata ограничено количеством 2047 в стандартной поставке Stata (IC), но может быть значительно большим в программе Stata/SE. Количество наблюдений ограничено только размерами памяти.

Также в пакете представлен широкий спектр графических возможностей, к которым относится построение графиков, схем, диаграмм. Графики могут экспортироваться в различном формате для включения в документы.

Ещё один не менее популярны статистический пакет STATISTICA, продукт компании StatSoft. Он относится к пакетам общего назначения. Компания StatSoft Russia – эксклюзивный представитель американской компании StatSoft Inc. на территории России и стран СНГ. Основным продуктом компании является пакет STATISTICA, первый релиз которого состоялся в 1997г. и сегодня выпущена уже 12.5 версия. Система STATISTICA Enterprise позволяет решать задачи анализа данных, data mining, text mining, визуализации, контроля качества в режиме реального времени».

Пакет «Олимп: СтатЭксперт», разработанный специалистами ТОО «Росэкспертиза», относится к категории специализированных методо-ориентированных пакетов, но не менее широко используется в различных социологических исследованиях. Программа продолжает развиваться и сегодня. Она предназначена для автоматизации обработки статистических данных. Данный пакет ориентирован на широкий круг пользователей, от новичков до профессиональных исследователей. Пакет “ОЛИМП” предоставляет большие возможности по статистическому анализу данных, от ввода первичных данных, их проверки и визуализации до проведения расчетов и анализа результатов. Средства графического отображения данных позволяют строить различные виды диаграмм и графиков.

Программа поставляется в базовом и профессиональном вариантах, которые отличаются набором методов. В базовый вариант включены методы анализа и прогнозирования одномерных временных рядов, средства описательной статистики количественных данных, регрессионный и корреляционный анализ. В профессиональную версию включены более сложные статистические процедуры, среди которых кластерный, спектральный и кросс - спектральный анализ, обработку нечисловой информации и т.д.

Помимо традиционных алгоритмов анализа, в пакет включены также авторские алгоритмы.

Пакет STADIA также относится к категории специализированных методо-ориентированных пакетов. Он разработан ведущими специалистами Московского Государственного Университета им.М.В.Ломоносова в конце 70-х годов. В отличие от SPSS пакет не поддерживает обработку миллионов наблюдений, но достаточно хорошо справляется с данными выборочных обследований нескольких сотен или тысяч респондентов. Пакет ориентирован на конкретные статистические расчёты и построение сопутствующих графиков во всех областях прикладной статистики.

В 2009 г. STADIA включена в качестве одного из рекомендуемых программных средств в Государственный образовательный стандарт РФ.

Для более наглядного представления возможностей различных пакетов в рамках данного исследования был проведён сравнительный анализ основных характеристик представленных статистических пакетов, результаты которого представлены в таблице.

Читайте также: