Возможности и ограничения компьютерных методов обработки данных

Обновлено: 03.07.2024

В статье описываются возможности и ограничения использования в социологии новых источников данных и методов их сбора, обработки и анализа, а именно — цифровых следов и методов машинного обучения. Сначала обсуждаются недостатки классических источников данных — опросов, а затем, в контексте этих недостатков, на основе релевантных исследований анализируются возможности их преодоления с помощью цифровых следов. В качестве главных недостатков опросных данных, которым, в свою очередь, меньше подвержены цифровые следы, выделяются: реактивность, небольшой объем данных и редкая частотность. В контексте описания этих недостатков и способов их преодоления с помощью цифровых следов мы приводим типы исследовательских вопросов, на которые можно ответить только с помощью цифровых следов. После этого рассматриваем ограничения цифровых следов: нерепрезентативность, конструктную валидность, внешние и внутренние вмешивающиеся факторы, нестационарность. Затем, на основе актуальных методологических статей, мы описываем, как учитывать эти ограничения и по возможности корректировать их.

Гимпельсон В. Е. Проблемы рынка труда. WP3. Высшая школа экономики, 2002. № 01. Антипов Е. А. В кн.: Моделирование в задачах городской и региональной экономики: Материалы Всероссийской конференции, посвященной 75-летию со дня рождения первого директора СПб ЭМИ РАН, заместителя председателя Президиума СПб НЦ РАН, профессора Бориса Львовича Овсиевича 24-25 октября 2011 года. СПб.: Издательство Нестор-История, 2011. С. 14-17.

В данной работе предлагается метод использования общедоступной текстовой информации при моделировании коммерческого успеха кинофильмов. Как показывает автор, предложенная система позволяет, сохранив информацию из рейтингов MPAA, снизить корреляцию формирующих ее переменных с другими объясняющими переменными, что обеспечивает более корректную оценку коэффициентов.

В этой работе предлагается новый метод для анализа данных онлайновых социальных сетей. В частности, проанализированы данные сайта Вконтакте. Используя бикластеризацию выявлены группы пользователей со схожими интересами и сообщества пользователей принадлежащих сходным группам. Предпринята попытка использовать интересы пользователей как теги, для того чтобы описывать группы сети Вконтакте.

Антипов Е. А. В кн.: Современные подходы к исследованию и моделированию в экономике, финансах и бизнесе: Материалы 5-й Ежегодной конференции Европейского университета в Санкт-Петербурге и Санкт-Петербургского экономико-математического института РАН. Вып. 5. СПб.: Европейский университет в Санкт-Петербурге, 2011. С. 14-15.

С развитием автоматизированных систем прогнозирования успеха кинофильмов, актуальным представляется вопрос «В одинаковой степени предсказуемы кинофильмы из разных сегментов или нет?». Зная ответ на него, инвестор может либо обходить проблемные сегменты стороной, либо проводить более детальный анализ (в том числе качественный) кинопроектов, попадающих в проблемный сегмент. В статье между собой сравниваются такие методы классификации с обучением, как логистическая регрессия, MLP (Multilayer Perceptron – разновидность нейронных сетей), KNN (k-Nearest Neighbors – метод k ближайших соседей), CART (Classification and Regression Trees), SVM (Support Vector Machines), BP (Boosted Trees) и RF (Random Forest). Кроме того, для ответа на вопрос «В одинаковой степени предсказуемы кинофильмы из разных сегментов или нет?» применяется оригинальная методика выявления сегментов с высокой и низкой ошибкой предсказания. Проведенная диагностика является примером того, как исследователь может оценить однородность качества классификации и понять, для каких сегментов объектов может быть получен удовлетворительный прогноз, а какие сегменты лучше либо избегать, либо привлекать для их оценки экспертов.

Пашкевич А. В. Социология: методология, методы, математическое моделирование. 2010. № 30. С. 131-150. Ozhegov E. M. , Ozhegova A. Economics/EC. WP BRP. Высшая школа экономики, 2017. No. WP BRP 174/EC/2017. В этой работе мы предлагаем новый подход к прогнозированию спроса. Изучаемый рынок театральных услуг отличается тем, что наблюдаемый спрос ограничен вместимостью зала. В этом случае для получения несмещенных оценок параметров функции спроса необходимо учитывать его цензурированность. Присутствие потребительских сегментов с различными целями похода в театр и готовностью платить за отдельные характеристики постановки и показа определяет разнородность предпочтений потребителей на рынке. Мы предлагаем подход к оцениванию спроса, учитывающий его цензурированность и разнородность предпочтений. Функция оценивания базируется на идее деревьев регрессии и классификации и агрегирования бутстраповских предсказаний. Мы расширяем эту идею на случай наличия цензурированной зависимой переменной. Предлагаемый алгоритм предсказывает и объединяет предсказания отдельно для дискретной и непрерывной частей цензурированных данных. Мы демонстрируем более высокую предсказательную силу в терминах точности прогноза нашего алгоритма по отношению к прочим функциям оценивания, не учитывающим цензурирование или разнородность. Предлагаемый подход полезен для нахождения продуктовых сегментов и оптимального ценообразования. Novikov A. , Trofimov M., Oseledets I. stat :: arxiv :: Cornell University. stat :: arxiv :: Cornell University. stat :: arxiv :: Cornell University, 2017

Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. Также подробно рассматриваются современные задачи автоматического извлечения информации из текста такие, как извлечение фактов, извлечения мнений, анализ контента на основе привлечения онтологических ресурсов Веба. Делается вывод о том, что для современного уровня развития компьютерной лингвистики характерно вовлечение все более сложных уровней лингвистического анализа в сферу автоматического анализа, применение гибридных подходов в решении задач компьютерной обработки текстов, совмещающих машинное обучение и алгоритмические методы. При этом уровни сложности современных задач обработки текстов, таких как извлечение временной референции в тексте, анализ структуры дискурса и многие другие, требуют активного привлечения экспертных лингвистических знаний.

Столяренко А. В. , Киселева Н. Н. , Подбельский В. В. Бизнес-информатика. 2010. № 4. С. 60-66. В статье предложен подход к интеграции баз данных и программ анализа данных. Описано его применение при разработке информационно-аналитической системы для автоматизации процесса компьютерного конструирования неорганических соединений. Рассматриваемые принципы интеграции разнородных программных и информационных компонентов могут быть применены и в других предметных областях: в медицине, экономике, промышленности, бизнесе. Под науч. редакцией: P. Perner . Vol. 7377. Berlin; Heidelberg: Springer, 2012.

This book constitutes the refereed proceedings of the 12th Industrial Conference on Data Mining, ICDM 2012, held in Berlin, Germany in July 2012. The 22 revised full papers presented were carefully reviewed and selected from 97 submissions. The papers are organized in topical sections on data mining in medicine and biology; data mining for energy industry; data mining in traffic and logistic; data mining in telecommunication; data mining in engineering; theory in data mining; theory in data mining: clustering; theory in data mining: association rule mining and decision rule mining.

Margarita Kuleva . Humanities. HUM. Basic Research Programme, 2015. No. 85. Под науч. редакцией: М. А. Пильгун Вып. 12. М.: АПК и ППРО, 2012.

В сборнике представлены работы, выполненные в рамках реализации ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009 – 2013 годы. Раскрывается широкий спектр проблем, связанных с различными этическими вопросами организационной, профессиональной и межличностной коммуникации.

Предварительные демографические итоги I полугодия 2016 года анализируются в контексте долговременных тенденций развития населения России. Рассматриваются динамика общей численности населения, роль естественного и миграционного прироста, основные характеристики рождаемости, брачности и разводимости как в целом по России, так и в региональном разрезе.

Опираясь на отечественный и зарубежный опыт, автор пытается показать влияние социальной политики советского периода на становление и развитие социального государства на разных его этапах в ведущих странах Запада, а также последствия разрушения СССР для современного состояния и перспектив социального государства в мире.

Сборник статей посвящен решению важной научной задачи по исследованию развития и формирования социально-экономических отношений в реформируемом обществе. Исследования, представленные в сборнике, отражают многообразие проблем социально-экономического развития общества. Рекомендовано научным работникам, специалистам, аспирантам и студентам, изучающим социально-экономические проблемы.

Под редакцией: И. Иванов , Л. Агеева , Д. Дубоделова и др. М.: МИЭМ, 2012.

Представлены материалы первой международной научно-практической конференции, отражающие современное состояние инновационной деятельности в образовании, науке, промышленности и социально-экономической сфере с позиций внедрения новейших информационных технологий.

Представляет интерес для широкого круга научных работников, преподавателей, аспирантов, студентов и специалистов в области инноватики и современных информационных технологий.

Липасова А. Н. Вестник Российского университета дружбы народов. Серия: Социология. 2016. № 3. С. 637-648.

В статье анализируются и сравниваются несколько подходов к понятию отцовства, присутствующих в западной социологической традиции: биологический детерминизм, социальный конструктивизм и биосоциальная теория. Проблематика отцовства и родительских практик мужчин маргинализирована в современных российских социальных иссследованиях, посвященных семейной тематике, и этот факт закрепляет традиционное неравенство в семейных отношениях, когда роль отца считается вторичной по сравнению с материнской ролью. В западных критических мужских исследованиях, напротив, можно выделить несколько этапов: развитие «поло-ролевой» парадигмы (биологический детерминизм), возникновение концепции гегемонной маскулинности, междисциплинарный этап (биосоциальная теория). В соответствии с подходом биологического детерминизма отец выступает как патриарх, продолжатель рода и ролевая модель для преемников. Социальный конструктивизм рассматривает функции мужчины в семье с точки зрения маскулинного давления и утверждения гегемонии над женщиной и детьми. Биосоциальная теория стремится объединить биологическую детерминированность отцовства с социальным, культурным и личностным контекстом. В статье показано, что эти подходы непосредственно связаны с уровнем развития общества, отношением к институтам семьи и брака, уровню эгалитарности гендерного порядка

Гимпельсон В. Е. Проблемы рынка труда. WP3. Высшая школа экономики, 2002. № 05. Черных А. И. Политическая теория и политический анализ. WP14. Высшая школа экономики, 2012. № 03.

В данной научной работе использованы результаты, полученные в ходе выполнения проекта № 10-01-0009 «Медиаритуалы», реализованного в рамках Программы «Научный фонд НИУ ВШЭ» в 2010-2012 гг.

В статье рассмотрены вопросы миграции и миграционной политики в России с точки зрения СМИ и общественного мнения.

Парусникова А. В. , Брюно А. Д. Институт прикладной математики им. М.В. Келдыша Российской академии наук, 2010. № 39.

В данной работе рассматривается пятое уравнение Пенлеве, которое имеет 4 комплексных параметра α, β, γ, δ. Методами степенной геометрии ищутся асимптотические разложения его решений при x → ∞. При α≠0 найдено 10 степенных разложений с двумя экспоненциальными добавками каждое. Шесть из них - по целым степеням x (они были известны), и четыре по полуцелым (они новые). При α=0 найдено 4 однопараметрических семейства экспоненциальных асимптотик y(x) и 3 однопараметрических семейства сложных разложений x=x(y). Все экспоненциальные добавки, экспоненциальные асимптотики и сложные разложения найдены впервые. Также уточнена техника вычисления экспоненциальных добавок.

Новичков Н. В. Вестник Московского государственного университета культуры и искусств. 2011. № 4. С. 22-30.

Данная статья раскрывает понятия политического управления и культурной политики, их сущность и содержание с точки зрения тенденций развития постиндустриального общества. В частности, обозначено, что культурная политика в настоящее время является основой всей региональной политической деятельности. В статье отмечено, что регионы могут получить значительные конкурентные преимущества в случае успешной реализации культурной политики, что может заложить основу для развития всей новой экономики.

9. Возможности и ограничения параметрических критериев.

Возможности и ограничения параметрических критериев.

Возможности:

4. Позволяют оценить различия в средних полученных в 2х выборках (t-критерий Стьюдента)

5. Позволяет оценить различия в дисперсиях (критерий Фишера)

6. Устанавливают значимые связи между переменными (критерий Пирсона)

Ограничения:

3. Экспериментальные данные должны быть нормально распределены

4. Математически расчеты достаточно сложны и трудоемки

10. Возможности и ограничения непараметрических критериев.

Методы непараметрической статистики

1. Возможности и ограничения непараметрических критериев

1. Алгоритмы расчета критериев Спирмена, Фридмана, Манна-Уитни (U)

Непараметрический критерий – критерий, основанный на оперировании частотами или рангами, не включающие в формулу расчета параметры распределения.

Большинство критериев являются непараметрическими, чаще всего для расчета используются критерии Спирмена (r), Фридмана ( .

Возможности критериев:

1. Коэффициента ранговой корреляции Спирмена - позволяет выявить значимые корреляции между переменными

2. Фридман – позволяет выявить степень выраженности и ранжирования переменных

3. Манна-Уитни – позволяет оценить значимые различия между выборками по степени выраженности показателей (назначение тоже самое, что и у критерия Стьюдента, только критерий Стьюдента – параметрический показатель). Что бы выбрать критерий (Стьюдент или Манна-Уитни), нужно оценить значимые различия между выборками по степени выраженности показателей - асимметрия или эксцесс (если так, что применять признак Манна-Уитни)

Достоинства непараметрических критериев:

1. Математические расчеты просты и не занимают много времени

2. Распределение признака может быть любым, не только нормальным

Ограничение: с их помощью невозможно оценить взаимодействие 2х и более факторов, влияющих на изменение признака, но с этой задачей справляется критерий Фишера (параметрический метод). Этот критерий рассчитывается при дисперсионном факторном анализе.

1 I. Понятие корреляции. Свойства корреляции.
Корреляционные анализ.

1. Понятия корреляции, ее свойства

2. Наглядное изображения корреляционных связей, метод корреляционных плеяд

3. Интерпретация корреляции. Корреляция и причинно-следственная связь

Корреляционный анализ – математические процедуры для изучения статистических связей между признаками изучаемых объектов.

Корреляция означает связь между 2мя переменными, при которой систематическое увеличение одной переменной сопровождается увеличением или уменьшением значением другой переменной.

Свойства корреляции:

1. Направленность – свойство, характеризующее одностороннюю или двустороннюю обусловленность изменения одной величины изменениями другой величины. Односторонняя – Х обусловлено У, но никак не наоборот, двусторонняя – Х и У обуславливают друг друга.

2. Сила (степень тесноты связи) – это свойство, характеризующее степень обусловленности изменений Х значениями У или наоборот. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.

Общая классификация корреляционной связи по силе:

· Сильная связь – r > 0,5

· Умеренная связь – 0.3 < r 0.49

· Слабая (незначительная) – r < 0.29

Частная классификация корреляционных связей:

· Высокая значимая корреляция, соответствующая уровни значимости – р < 0,01

· Значимая связь – р < 0,05

· Тенденция к достоверной связи – р < 0,1

Чем больше объем выборки, тем меньшей величины коэффициент корреляции оказывается достаточно, что бы корреляция была признана достоверной

3. Форма – бывает 2х видов: линейная и нелинейная.

4. Направление – свойство, выражающейся в возрастающей или убывающей функции. направление выражается знаком «-» или «+». По направлению корреляция может быть прямая (положительная) и обратная (отрицательная).

Концепция построения технологических процессов переработки информации зависит от способов обработки данных, которые определяют уровень развития информационной технологии. Одной из первых исторически сложившихся технологий (период 1960-х — середина 1980-х гг.) была технология на основе централизованной обработки данных, которая предполагает выполнение всех работ по обработке данных, начиная со сбора и регистрации в одном центре обработки — вычислительном центре (ВЦ). Пользователь доставляет в ВЦ исходную информацию и получает результаты обработки в виде выходных документов. ВЦ оснащался мощными ЭВМ, позволяющими обрабатывать огромные объемы информации. Позже возникли вычислительные центры коллективного пользования (ВЦКП), позволявшие обслуживать несколько пользователей. Таким образом, на уровне пользователя использовалась только оргтехника, техника передачи данных, остальные вычислительные мощности были собственностью ВЦ.

К достоинствам этого способа обработки можно отнести единство методики обработки с возможностью своевременного ее совершенствования, единые стандарты представления информации, унификацию данных и информационных процедур, простую схему документооборота, единое техническое обеспечение, снимающее проблему сопряжения технических средств, а также возможность для пользователя оперировать большими объемами данных.

Недостатками этого способа являлись: неудобство для пользователя получения информации; перегруженность технических средств, приводящая к сбоям в технологическом процессе; невозможность предоставления всего спектра услуг; необеспеченность должной надежности и защиты информации.

Появление персональных компьютеров, дающих возможность автоматизировать конкретное рабочее место, привело к созданию децентрализованной обработки данных (конец 1980-х — середина 1990-х гг.). Децентрализованная обработка данных предполагает обработку всей информации на оборудовании удаленного пользователя, т.е. непосредственно на рабочем месте служащего, и способствует рассредоточению вычислительных ресурсов и их приближению к местам возникновения и потребления информации, например АРМ бухгалтера, экономиста, операциониста, кредитного работника и т.д.

Таким образом, персональные компьютеры использовались автономно. Хранение данных организуется в виде файлов на отдельных компьютерах. Обмен данными производится с помощью дискет. Для получения сводных показателей производится перезапись информации на один компьютер.

Недостатками такого способа обработки являются дублирование информации, сложность подготовки сводной отчетной документации, техническая совместимость, отсутствие возможности оперативного анализа различных аспектов деятельности организации и др.

В последнее время организация применения компьютерной техники и технологии претерпела значительные изменения, связанные с переходом к созданию интегрированных информационных систем. Данные системы проектируются с учетом согласованного управления данными в пределах предприятия (организации), координации обмена информацией как в пределах отдельных групп пользователей, так и между несколькими организациями, находящимися друг от друга в десятках и сотнях километров. Построение подобных систем основано на распределенной обработке данных — обработке, выполняемой на независимых, но связанных между собой компьютерах, представляющих распределенную систему. Для реализации распределенной обработки данных используются компьютерные сети. Преимуществами распределенной обработки данных являются большое число взаимодействующих между собой пользователей, перераспределение обработки и хранения данных с централизованной базы на локальные, обеспечение возможности параллельной обработки данных пользователями в сети.

В интегрированных информационных системах с распределенной обработкой данных применяются различные виды информационно-технологической архитектуры, зависящие от используемых программных, технических средств, структуры информационных баз данных, типа сетей. Наиболее распространенными видами информационно-технологической архитектуры являются архитектуры «файл-сервер», «клиент—сервер».

Архитектура «файл-сервер» реализуется посредством компьютерных сетей локального типа. Компьютеры в сети делятся на рабочие станции и серверы. На сервере находится информационная база данных сети, на рабочей станции — программные средства, организующие диалог пользователя в сети, и программные средства приложений. Обработка информации происходит на рабочих местах, куда по запросу пользователя считывается (передается по сети) вся требуемая информация; при этом не различается, вся информация нужна или ее часть, т.е. считывается на рабочую станцию весь файл базы данных, без предварительного отбора данных. Таким образом, использование архитектуры «файл-сервер» предполагает, что вся обработка данных выполняется на рабочей станции, а сервер выполняет лишь функции накопителя данных и средств доступа.

Достоинство архитектуры «файл-сервер» — обеспечение высокого уровня защиты данных от несанкционированного доступа. Однако при такой технологии не обеспечивается достаточная скорость обработки информации, так как, во-первых, объемы базы данных обычно достаточно велики и, во-вторых, необходимо постоянно обмениваться данными между сервером и вспомогательными компьютерами (рабочими станциями), полные копии файлов базы данных перемещаются по сети, при этом доступ к ним в режиме корректировки блокируется для других пользователей. Кроме того, к недостаткам можно отнести перегрузку трафика сети и высокие требования к техническому оснащению рабочих станций.

Архитектура «клиент—сервер» позволяет преодолеть непроизводительную пересылку больших информационных потоков в сети. Это достигается за счет разделения программ на две части: клиентскую и серверную. Клиентская часть устанавливается на компьютере рабочего места, серверная — на сетевом сервере. Таким образом, на сервере находятся не только общие базы данных, но и программы поиска и записи. Это позволяет «клиентам» (другим программам, расположенным на рабочих станциях) посылать серверу запрос не на всю информацию из базы данных, а только на нужную, причем частично или полностью обработанную. При этом существенно уменьшается трафик сети, снижается загруженность канала передачи данных.

Архитектура «клиент—сервер» может быть двухзвенной и многозвенной. При двухзвенной архитектуре клиенты непосредственно взаимодействуют с сервером. Многозвенная архитектура отличается существованием еще одного или нескольких звеньев, так называемых серверов приложений или серверов обслуживания, которые являются промежуточными звеньями между клиентами и сервером. Сервер приложений выполняет ряд функций, как системных, так и пользовательских, которые в случае использования двухзвенной архитектуры выполняет либо клиент, либо сервер.

По способу организации обмена данными между клиентом и сервером различают модели «толстого» и «тонкого» клиента.

В модели «толстый клиент» на сервере реализованы главным образом функции доступа к данным, а все прикладные вычисления выполняются на «клиентских» программах, т.е. сервер только отбирает нужные данные и пересылает их на рабочую станцию, где и выполняется их обработка. Результаты обработки пересылаются назад серверу для сохранения их в общей базе данных.

В модели «тонкий клиент» значительная часть прикладной обработки данных выполняется непосредственно на сервере, а на рабочую станцию передаются данные для просмотра в экранных формах и результаты выполнения отчетов.

Организация распределенной обработки данных зависит от способа их распределения. Существуют централизованная, децентрализованная и смешанная организации распределения данных.

1. Централизованная организация данных предполагает наличие на сервере общей базы данных (рис. 5.2). Все операции с базой данных обеспечиваются этим сервером. Каждый клиент сети имеет доступ к единой базе данных с помощью удаленного запроса. Достоинство данной организации — простота поддержки базы данных в актуальном состоянии. К недостаткам можно отнести ограниченность объема внешней памяти, что влияет на размер базы данных, ограничения на параллельную обработку запросов клиентов, нарушение работы клиентов в сети при отказе аппаратных средств.

Рис. 5.2. Централизованная организация данных

2. Децентрализованная организация данных предполагает разбиение общей базы данных на несколько физически распределенных. Каждый клиент имеет доступ к своей БД, которая может быть либо частью общей базы данных (рис. 5.3, а), либо ее копией (рис. 5.3, б).

При разбиении БД каждая ее часть хранится на отдельном сервере. При дублировании БД на каждом сервере сети размещается полная копия БД. Достоинства и недостатки децентрализованной организации данных приведены в табл. 5.1.

3. Смешанная организация данных предполагает объединение двух способов распределения — разбиения и дублирования. При этом сохраняются преимущества и недостатки каждого из этих способов.

Рис. 5.3. Децентрализованная организация данных способом распределения (а) и способом дублирования (б)

Таким образом, интегрированная информационная система базируется на интегрированном использовании персональных компьютеров, специализированных мощных компьютеров (серверов), объединенных каналами связи и единой технологией в единую глобальную корпоративную сеть. Данная технология характерна для крупных предприятий, имеющих разветвленную сеть филиалов или дочерних компаний. При этом в корпоративной сети выделяются два уровня обработки: локальная вычислительная сеть центрального органа управления предприятием и локальная вычислительная сеть филиалов. Центральный офис и филиалы объединяются в единую информационно-вычислительную среду, связь в которой осуществляться по некоммутируемым проводным каналам, оптоволоконным каналам, радио- и спутниковым каналам,

Достоинства и недостатки децентрализованной организации данных

распределения

Достоинства

Сокращение времени ответа на запрос Удовлетворение запросов локальными базами Надежность хранения Доступность данных Работоспособность системы при отказе одного сервера

Увеличение времени ожидания результата запроса при обращении к нескольким серверам Необходимость иметь сведения о размещении данных в различных БД

Быстрота доступа за счет локальности выполнения запросов

Повышенное требование к объему внешней памяти Сложность корректировки баз

а также, в редких случаях, с использованием телефонных коммутируемых соединений. В этом случае база данных корпорации может быть реализована по двум основным архитектурам: как единая централизованная база данных, так и распределенная по уровням (филиалам) вычислительной сети. В первом случае база данных хранится на достаточно мощном и высокопроизводительном центральном сервере (или интегрированной группе серверов) вычислительной системы, доступ к которой осуществляется по каналам связи со стороны удаленных пользователей. Во втором случае база данных ведется как на сервере центрального офиса, так и на серверах филиалов, при этом она автоматически синхронизируется. Обе эти структуры реализуются посредством архитектуры «клиент-сервер».

Развитие технологий не останавливается на создании крупных сетей в рамках одного предприятия или организации. Для согласованной работы всех экономических подразделений региона или страны необходимы более крупные сети. С этой целью ведется работа по объединению сетей предприятий или организаций с региональными сетями: по законодательству, налоговой деятельности, обеспечению банковских расчетов, политическим и деловым новостям, состоянию фондового рынка и т.д. В свою очередь, региональные системы имеют тенденцию к объединению между собой, что необходимо для более качественного управления экономикой страны в целом.

Технические и технологические возможности современного этапа развития научно-технического прогресса позволяют сетям выйти за границы не только регионов, но и стран. С появлением Интернета технологии развиваются во всемирном масштабе. В этой сети информационный поток, вводимый клиентом, получает адрес и автоматически находит кратчайший путь до адресата. При этом при технических или иных сбоях в сети информация находит обходные сети, что позволяет работать ей без перерывов.

Абсолютное большинство школ стремится полнее использовать резервы обучения. И здесь не обойтись без диагностики, без мониторинга.
Для этого надо обрабатывать большой объем информации.

Предлагаемая система компьютерной обработки данных автоматизирует процесс обработки информации.

Назначение:

Система компьютерной обработки данных предназначена для сбора, систематизации, статистической обработки, анализа данных учебного процесса и позволяет:

· обеспечить системный сбор и классификацию информации;

· анализировать огромное количество информации учебного процесса;

· проводить внутри лицейский контроль качества обучения, диагностический анализ, и оценку эффективности обучения;

· делать объективные и обоснованные выводы о степени достижения поставленных целей;

· оперативно принимать решения, способствующие функционированию и развитию лицея, и ставить новые задачи.

Вложение	Размер
sistema_kompyuternoy_obrabotki_dannyh.doc	41 КБ

Предварительный просмотр:

Система компьютерной обработки данных

Научный руководитель: Иняткина Алла Вячеславовна

Предлагаемая система компьютерной обработки данных автоматизирует процесс обработки информации.

обеспечить системный сбор и классификацию информации;
анализировать огромное количество информации учебного процесса;
проводить внутри лицейский контроль качества обучения, диагностический анализ, и оценку эффективности обучения;
делать объективные и обоснованные выводы о степени достижения поставленных целей;
оперативно принимать решения, способствующие функционированию и развитию лицея, и ставить новые задачи.

Система компьютерной обработки данных включает 3 модуля:

Модуль обработки данных о качестве обучения
Модуль обработки итогов успеваемости
Модуль обработки данных о движении

Модуль обработки данных о качестве обучения

Для анализа эффективности образовательного процесса по каждому предмету «входная» информация за 3 последних года вводится в таблицы на 3-х листах: год 1, год 2, год 3.

Все другие показатели успеваемости, таблицы, графики, диаграммы рассчитываются и строятся автоматически.

В начале нового учебного года нужно перевести год, это происходит по нажатию кнопки « Год » на листе «год 1», при этом информация с листа «год 2» переписывается на лист «год 1», а информация с листа «год 3» переписывается на лист «год 2», таблица листа «год 3» очищается, в неё заносятся данные текущего учебного года. Для перевода года написан макрос «Перевод года» (приложение 1).

Таблицы на листах год 1, год 2, год 3 предусмотрены на 7 классов в каждой параллели. Если классов в параллели меньше, остаются незаполненные столбцы. Незаполненные столбцы можно скрыть с помощью кнопки « Скрыть пустые столбцы ». Для скрытия незаполненных столбцов написан макрос «Скрыть пустые столбцы».

Модуль обработки данных о качестве обучения позволяет проводить:

Сравнение качественной успеваемости за 3 года по параллелям (по любому предмету).
Оценку эффективности обучения в текущем году.
Сохранность качества обучения в текущем году.
Сравнительный анализ качественной успеваемости по предмету за текущий и два предыдущих учебных года со средним уровнем общей качественной успеваемости.
Сравнительный анализ успеваемости по результатам итоговых (годовых) контрольных работ с итоговой (годовой) успеваемостью.
Сравнительный анализ качественной успеваемости по учителям.
Сравнительный анализ качественной успеваемости каждого класса параллели со средней успеваемостью по параллели.
Средние показатели качественной успеваемости по параллелям.

Модуль обработки итогов успеваемости позволяет по каждому классу, параллели, ступени получить следующие данные:

Подвести итоги успеваемости: сколько учащихся аттестовано, сколько учащихся не аттестовано, сколько неуспевающих, посчитать количество хорошистов и отличников, абсолютную и качественную успеваемость;
Список неуспевающих с указанием фамилии, класса и предмета;
Количество пропусков всего, количество пропусков по болезни, количество пропусков по уважительной причине и количество пропусков по неуважительной причине;

Для обработки итогов успеваемости учащихся «входная» информация вводится на лист1.

Все другие показатели на листах 2, 3, 4 рассчитываются автоматически.

Модуль компьютерной обработки данных о движении учащихся позволяет получить:

Наполняемость по каждому классу, параллели, ступени;
Список выбывших с указанием класса;
Список прибывших с указанием класса

Информация вводится на «Лист 1» и лист «Кол-во классов» «Системы компьютерной обработки данных о движении учащихся в ОУ». Все другие таблицы заполняются автоматически. Для этого разработаны макросы «Выбыли», «Прибыли», «Наполняемость».

Предлагаемая «Система компьютерной обработки данных» используется для анализа результатов учебного процесса за триместр , полугодие, год.

Анализ результатов учебного процесса нацелен на выделение первоочередных задач обучения, он содержит ряд графиков, которые сравниваются между собой как с эталонами. Сравнение графиков позволяет сделать выводы об уровнях качества обучения на разных параллелях в данной школе.

Читайте также: