Чем заменить excel для анализа данных

Обновлено: 06.07.2024

Когда Excel не достаточно, как использовать Access для анализа данных?

Что делать, если объем данных слишком велик для Excel? Существуют ли другие инструменты, которые могут заменить Excel, но просты в использовании?

Этот вопрос действительно ударил по рукам. Я получил много подобных вопросов. Я отвечу на них сегодня единым образом.

Большой объем данных для отчетности или анализа данных

Более 100 мегабайт, сотни тысяч строк данных в формате Excel: база данных ACCESS + SQL

Если данные не достигают сотен миллионов уровней, используйте инструменты BI для непосредственного анализа

Независимо от того, насколько он большой, он не похож на двоюродного брата или двоюродного брата, его может решить аналитик данных.

Принимая во внимание общее использование Excel в повседневной жизни, эта статья будет в основном рассказывать о программах первого типа и предлагает полный учебник, универсальный и практичный. Используемый инструмент - база данных ACCESS.

Что касается ACCESS, его брата по Excel, того же Microsoft Office, то нетрудно начать, получить основную операцию за неделю.

Это может решить следующие жалобы небольших партнеров, которые выполняют операции с данными:

Хранилище таблиц данных Excel, которые будут обрабатываться в бизнесе, становится все больше и больше, и оно становится медленным, как улитка, когда оно превышает 50 МБ. В это время, если в таблице больше функций IF и VLOOKUP, компьютер будет работать напрямую, если он сталкивается с размером, подобным этому Таблицы Excel, компьютеры уровня сервера не могут быть перегружены, не говоря уже об обработке данных и анализе данных.

 excel , Access ?

Данные Excel с большим объемом данных трудно открыть

При обнаружении таблицы данных Excel с таким большим объемом памяти, как показано на рисунке выше, карта неизбежна. Когда возникают такие трудности, существует ли какое-либо программное обеспечение для анализа данных, которое может обрабатывать файлы большой емкости, в то же время простое в использовании и простое в использовании?

Ответ, конечно: ДА, и тот же брат Excel, ДОСТУП фракции Microsoft Office.

В следующем содержании в качестве примера будет использован общий проект по анализу, и мы стремимся дать партнерам, которые проводят анализ данных, общее представление о ACCESS, чтобы найти идеи и методы для анализа больших объемов данных.

На следующем рисунке показаны четыре основные цели этой статьи, использующие ACCESS для анализа исходных данных таблицы.

 excel , Access ?

Вот два предложения об основной ситуации доступа, а затем использовать практический случай для анализа данных.

1. Основные понятия операторов ACCESS и SQL

Access, полное имя «Microsoft Office Access», является членом Microsoft Office, системы управления реляционными базами данных, выпущенной Microsoft. Он сочетает в себе функции Microsoft Jet Database Engine и графический интерфейс пользователя и является одной из системных программ Microsoft Office. (Из энциклопедии Baidu)

Когда дело доходит до ACCESS, вы должны упомянуть SQL. Только овладев SQL, вы сможете максимизировать функции ACCESS. Полное имя SQL - «Язык структурированных запросов», который является декларативным языком.

Во-первых, помните об этой концепции: «Декларация». По сравнению с языками программирования, известными всем в прошлом, язык SQL является примером для компьютера, который объявляет, какие результаты вы хотите получить из исходных данных, вместо того, чтобы сообщать компьютеру, как получить результаты. Другими словами, настоящее ядро ​​SQL - это ссылка на таблицу.

SELECT first_name, last_name FROM employees WHERE age> =25

Приведенный выше пример прост для понимания. Нам не нужно заботиться о том, откуда берутся данные о сотрудниках. Все, что нам нужно, это данные о сотрудниках в возрасте 25 лет и старше (возраст> = 25).

2. Преимущества ДОСТУПА

Наиболее очевидным преимуществом ACCESS является то, что он может обрабатывать исходные файлы данных большой емкости, которые Excel не может переносить без необходимости владения очень глубоким языком программирования, он чрезвычайно быстр и прост в изучении и использовании.

 excel , Access ?

3. Общие предложения ДОСТУПА

В следующей таблице приведены некоторые часто используемые операторы SQL при использовании ACCESS, которые нетрудно понять.

 excel , Access ?

Названия часто используемых операторов SQL в базе данных ACCESS

Чтобы изучить инструменты анализа данных, наиболее важным является использование практических кейсов для мобилизации знаний о различных фрагментированных инструментах. После полного анализа кейсов вы сможете быстро освоить методы работы этих инструментов.

После краткого ознакомления с инструкциями ACCESS и SQL давайте приступим к практике анализа данных ACCESS!

1. Импорт данных

Следующая таблица является исходным файлом анализа данных ACCESS в этой статье. Объем данных составляет почти 230 МБ. Excel нужно подождать несколько минут, чтобы открыть, и это зависит от настроения компьютера . В целях коммерческой конфиденциальности в этой статье будут использоваться некоторые данные для анализа и работы, а также Сделайте некоторую обработку.


Исходный вопрос данных экспортируется в фоновом режиме

Сначала импортируйте файл в Excel в ACCESS, как показано стрелкой на рисунке ниже:

 excel , Access ?

Импортировать заголовок файла первичных данных Excel

После выполнения описанных выше шагов автоматически генерируется первичный ключ (т. Е. Идентификатор) и получается следующий результат:

 excel , Access ?

Файл исходных данных Excel, импортированный в заголовок ACCESS

2. Анализ времени заказа пользователя

Для анализа периода времени для размещения заказа необходимо преобразовать время, когда пользователь разместил заказ, в час «время». Используемый здесь оператор SQL - это формат, а функция - форматировать выбранное поле. Синтаксис:

формат (поле ссылки, «формат данных»)

Среди них «формат данных» обычно выбирает H (час), D (день), M (месяц) или Y (год) во времени.

Затем используйте функцию подсчета для подсчета идентификатора пользователя, и результатом будет количество заказа.

Обратите внимание, что после использования формата и количества необходимо использовать «AS», чтобы определить его как новое поле, здесь определяются как «период времени» и «количество заказа».

 excel , Access ?

Шаги для анализа заказа

Создайте новый «Query Design» в «Create», нажмите «SQL» в правом нижнем углу, а затем введите следующий оператор в диалоговом окне SQL:

Формат SELECT (время заказа, «ч») AS период, количество (UserID) количество заказа AS

ОТ метаданных

Формат GROUP BY (время заказа, "ч");

Затем нажмите «Выполнить» в разделе «Дизайн», чтобы получить следующий результат:

 excel , Access ?

Распределение заказов в разные периоды

Возьмите пример, чтобы объяснить, как интерпретировать вышеуказанные результаты: если клиент размещает заказ в 12:23, момент времени попадает в период «12», а «12» представляет время 12

13 часов. сегмент. Вы можете использовать функции в статье «Практика работы | Как использовать фоновые данные WeChat для оптимизации операций WeChat для оптимизации операций WeChat», чтобы превратить их в отображение периода времени.

3. Анализ распределения заказов в диапазоне оплаты

Чтобы вычислить интервал оплаты, вам нужно использовать функцию, которая сравнивает X-Switch для крупного рогатого скота, которая должна вычислять последовательность выражений в последовательности, и, если определенное выражение истинно, оно возвращает свое последующее значение.

ПЕРЕКЛЮЧАТЕЛЬ (условие 1, результат 1, условие 2, результат 2, условие 3, результат 3, . условие N, результат N)

Условие 1, Условие 2 и Условие 3: представляют вычисляемое выражение.Если Условие 1 истинно, возвращаемое значение результата 1, если Условие 2 истинно, возвращаемое значение результата 2 и т. Д.

В соответствии с описанным выше способом создайте «Дизайн запроса» в «Создать», нажмите «SQL» в правом нижнем углу и введите следующую инструкцию:

ВЫБЕРИТЕ ИД пользователя, сумму платежа, переключатель (сумма платежа <= 10, «1

10 юаней»,

Сумма платежа <= 20, «11

20 юаней»,

Сумма платежа <= 50, «21

50 юаней»,

Сумма платежа <= 80, "51

80 юаней",

Сумма платежа <= 150, «81

220 юаней»), как диапазон потребления

ОТ метаданных;

После нажатия «Выполнить» получаются следующие результаты:

 excel , Access ?

Вопрос об интервале потребления, соответствующий сумме потребления одного заказа, размещенного целевым пользователем

В настоящее время обработка данных в интервале потребления еще не завершена, поскольку это интервал потребления, соответствующий сумме оплаты каждой записи заказа. Далее мы собираемся аналогично практике сводной таблицы в Excel, в которой интервал потребления помещается в первый столбец, чтобы подсчитать количество заказов в каждом интервале потребления.

Таким образом, как и выше, необходимо создать новый запрос, а имя изменить на «Статистика количества заказов в диапазоне платежей».

Оператор SQL, который необходимо ввести здесь:

ВЫБЕРИТЕ диапазон потребления, количество (UserID) AS количество заказа

ОТ платежного интервала

Диапазон потребления GROUP BY;

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Распределение заказов в различных областях потребления

Затем скопируйте вышеуказанные данные в таблицу Excel и создайте следующую процентную веерную диаграмму, которая может интуитивно анализировать пропорцию заказов в каждом интервале потребления, а затем посмотреть, каков общий уровень потребления пользователями. Разумная оценка операции.

 excel , Access ?

Фан-график доли заказов в каждой области потребления

4. Анализ количества заказов, количества пользователей и объема продаж по регионам

(1) Количество пользователей в каждой области

Это немного хлопотно: количество пользователей рассчитывается косвенно, используя счет «userID», но, поскольку большинство пользователей размещают заказ не менее 2 раз, поэтому, если вы посчитаете его напрямую, результатом будет количество заказа. Ввиду этой ситуации мы должны изменить свое мышление и составить таблицу информации о заказах пользователя, которая не будет дублироваться, то есть таблицу частот заказов, размещаемых каждым идентификатором пользователя.

Создайте новый «дизайн запроса» и назовите его «частота потребления пользователями». Введите следующий оператор в диалоговом окне SQL:

ВЫБЕРИТЕ UserID, COUNT (UserID) AS время потребления, регион

ОТ метаданных

GROUP BY UserID, площадь;

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Таблица частот пользовательских заказов

Таким образом, мы можем использовать эту таблицу частот потребления в качестве трамплина для расчета количества пользователей в каждой области во вновь создаваемой таблице.

Создайте новый «дизайн запроса» и назовите его «количество пользователей в каждой области». Введите следующий оператор в диалоговом окне SQL:

Область SELECT, count (UserID) AS общее количество пользователей

ОТ пользовательской частоты

GROUP BY область;

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Количество пользователей по регионам

(2) Статус заказов и объемов потребления в различных регионах

Создайте новый «Дизайн запроса» и назовите его «Статус заказа по регионам». Введите следующий оператор в диалоговом окне SQL:

Поле SELECT, count (UserID) AS общее количество заказов, сумма (оплата) AS общая сумма, avg (оплата) AS средняя сумма потребления

ОТ метаданных

GROUP BY область;

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Статус заказов и объемов потребления по регионам

Затем интегрируйте количество пользователей в вышеуказанных регионах в эту таблицу, чтобы получить полный обзор работы этих трех регионов. Смотрите таблицу ниже:

 excel , Access ?

Обзор региональных операций

5. Анализ потребительской ценности

Анализ потребительской ценности здесь основан на модели RFM, но он был дополнительно улучшен. На основе первоначального «совокупного объема потребления» введены три «минимальный объем потребления», «максимальный объем потребления» и «средний объем потребления». Этот показатель стремится полностью отражать покупательскую способность потребителей.

Создайте новый «Дизайн запроса» и назовите его «Потребление пользователя». Введите следующий оператор в диалоговом окне SQL:

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Таблица анализа пользовательских значений

После получения таблицы вы можете выполнить кластерный анализ и классифицировать пользователей в соответствии с тремя измерениями R, F и M. Подробнее см. В разделе «[Практика обработки данных] Как использовать анализ данных для выполнения проекта пробной операции» «Нет тупика» обзор? »Эта статья.

Наконец, мы также можем получить общий объем заказов и продаж в этих трех регионах:

Создайте новый «Дизайн запроса» и назовите его «Обзор продаж по регионам». Введите следующий оператор в диалоговом окне SQL:

SELECT count (userID) AS общее количество заказов,

сумма (сумма платежа) как общая сумма платежа,

avg (сумма платежа) AS средняя сумма заказа

ОТ метаданных;

После нажатия «Выполнить» результат будет следующим:

 excel , Access ?

Обзор продаж в трех регионах

Как видно из вышеприведенного случая, если операторы SQL используются немного более умело, ACCESS не будет уступать Excel в обработке данных, и его сильной стороной является обработка больших объемов данных.


Еще вчера слова Big Data были чем-то странным и неизвестным, а сегодня уже телефонные операторы отсеивают из входящих спам. Итак, вот инструменты, которые тебе помогут в работе с данными.


Excel – это не только создание формы, сводные таблицы и VBA. Система настолько велика, что ни один инструмент аналитики не может превзойти ее, гарантируя, что люди могут анализировать данные в соответствии с их потребностями.

Тем не менее, многие люди равнодушны к Excel в виде инструмента для такой задачи. Мы считаем, что Excel – это универсальный игрок. Он справится как с небольшими данными, так и обработкой бигдаты (используя плагин).

Основываясь на мощных возможностях Excel и его пользовательском охвате, можно сказать, что это незаменимый инструмент. Если тебе нужно изучить анализ данных, то Excel, безусловно, является отличным выбором.


Основное направление Tableau – сводные таблицы и диаграммы Excel. Судя по отзывам на рынке и истории развития, этот продукт лучше подходит для визуализации. Крутые графики, дизайн, цвет и пользовательский интерфейс дают ощущение свежести и легкости.

Не так давно разработчики добавили функцию очистки данных и более интеллектуальные функции анализа, т. е. продукт постоянно поддерживается и развивается, что немаловажно.


Orange – это опенсорсный проект, содержащий набор инструментов для визуализации, обработки и анализа данных. Огромный пакет инструментов поможет тебе создать интерактивный рабочий процесс для анализа и визуализации данных с помощью точечных диаграмм, гистограмм, деревьев, дендрограмм, сетей и тепловых карт. Подойдет как для профессиональных аналитиков, так и для обычных юзеров.


Не так давно Power BI был плагином для Excel. Но теперь это самостоятельная единица, которая постоянно обновляется и очень быстро догоняет конкурентов.

В настоящее время Power BI имеет три способа лицензирования: Free, Pro и Premium. Ясное дело, что бесплатная версия не поддерживает полный функционал, но для личного пользования хватит.

Преимущество Power BI заключается в возможностях анализа данных бизнес-модели. Его PowerPivot и язык DAX позволяют реализовать сложный расширенный анализ так же просто, как и написание формул в Excel.


Хотя программные средства специально были заточены под данную задачу, не рассмотреть ЯП было бы глупо. Обладая знаниями в программировании, можно использовать встроенные возможности языка для решения поставленной задачи. Существует море опенсорсных библиотек и дополнений для анализа данных, которые можно “прикрутить” и юзать.

Ты можешь написать код, четко под свои нужды. Например, R и Python являются незаменимыми инструментами для исследователей данных, и они определенно мощнее, чем Excel и BI-инструменты.


NodeXL – это программное обеспечение для анализа данных, визуализации зависимостей и сетей. Вот некоторые возможности:


Это очень крутой инструмент для анализа и визуализации больших наборов данных. Вот некоторые особенности:

  1. фильтрация, суммирование, создание формул;
  2. удобная визуализация данных с обновлением в режиме реального времени;
  3. управление данными из административной части CRM-системы.

Стоит отметить, что Salesforce не относится к бесплатным инструментам, и работа с Big Data потребует покупки. Но если речь идет о паре тысяч записей – никаких проблем. Для этого можно использовать дев-версию или плейграунд.


Еще один из достойных инструментов. Комплекс включает в себя IDE собственной разработки (как нынче модно – своя студия, aka VisualStudio) и сервер для хранения выполненных процессов анализа, расшаривания информации между аналитиками и подготовки результатов для выдачи в веб. Платформа позволит команде быстро оперировать данными из разных источников, запускать проверки моделей машинного обучения, и все это в одном месте с одним набором софта.

Бизнес-аналитик — универсальный боец для работы с анализом рынка и данных, финансовым планированием, бизнес-моделированием. При такой многозадачности помимо качественной работы имеет значение и скорость, и здесь на помощь придут проверенные инструменты и сервисы.

Подготовили подборку инструментов анализа, структурирования, визуализации информации и управления проектами. А также разобрали пару задач, которые можно решить при помощи этих сервисов.

11 полезных инструментов для бизнес-анализа

Константин большухин

Партнёр студии продвинутой аналитики Modelta

Поделился инструментами, которые пригодятся бизнес-аналитику

Excel

Используют для базовых расчётов, работы с таблицами и диаграммами.

В первую очередь нужно научиться использовать функции ВПР, СУММЕСЛИ, СРЗНАЧ, СЧЁТ, а также сводные таблицы, фильтры и графики.

Также будут полезны:

  • Функции «Удалить дубликаты», «Текст по столбцам», «Найти и заменить» — помогут очистить и обработать массив данных и привести их к нужному виду.
  • Сводная диаграмма, Условное форматирование, Проверка данных и спарклайны (диаграммы, встроенные в ячейку Excel) — обеспечат гибкость при создании отчётности или финансовых и математических моделей.
  • Горячие клавиши Ctrl+F/H, Ctrl + Shift + →/←, Ctrl + PgDn / PgUp и другие — сэкономят время.
  • Надстройки Power Query и Power Pivot — помогут подключить данные из базы напрямую в Excel (принцип похож на BI).

Достойна упоминания надстройка VBA, которая помогает писать макросы для автоматизации действий в Excel. Однако сейчас редко кто ей пользуется. Из примеров использования: запуск последовательности расчётов для обновления модели, собирающей данные из нескольких файлов, и выгрузки данных с сайта с последующей обработкой в модели. В последнее время похожие задачи можно решить при помощи R, Python или программ, которые помогают парсить данные или настроить интеграцию без применения кода.

С другими функциями и возможностями Excel стоит разбираться по мере необходимости.

Вместо Excel можно использовать гугл-таблицы, Airtable, таблицы в Notion. Разница в интерфейсе, количестве функций, интеграции с онлайн-сервисами.

Примеры задач, которые помогает решить Excel:

  • составление финансовых моделей и бюджетирования,
  • анализ воронки продаж или лидов,
  • сбор данных и структурирование информации о клиентах и рынке,
  • иногда — отслеживание задач по проекту, в качестве CRM для ведения клиентов или анкеты с вопросами.

PowerPoint или Keynote

Презентации — часть базового инструментария аналитика. Недостаточно просто разобраться в программе — нужно научиться делать качественные презентации.

В первую очередь следует обращать внимание на структурирование презентации, композицию информации на слайде, подбор цветов, картинок и иконок. В освоении помогут видео и курсы от студий разработки презентаций Esprezo, Метаформы, Presium.

Рекомендуем тренировать насмотренность, искать качественные примеры — особенно из консалтинга. Например, отчет McKinsey Global Energy Perspective 2019: Reference Case или отчёт BCG «Исследование развития комфортной городской среды в Москве и ведущих городах мира».

Бесплатный облачный редактор таблиц, который не только предоставляет пользователю большую часть возможностей Excel, но и обладает своими уникальными функциями. Например, интеграцией с другими сервисами Google, групповым чатом и режимом совместного редактирования.

В сервисе есть множество встроенных формул, сводных таблиц и готовых шаблонов. А система управления версиями поможет откатывать нежелательные изменения, если ваша таблица вдруг перестала работать как полагается.

iWork Numbers

Альтернатива Excel, доступная всем пользователям macOS. Вообще, в браузере Numbers можно использовать на любой системе, если у вас есть учётная запись iCloud, но вот мобильная версия есть только для iOS. Numbers поддерживает совместную работу в реальном времени и позволяет импортировать и экспортировать таблицы в форматах Excel. Если у вас есть стилус Apple Pen и iPad, вы можете делать заметки прямо на листе таблицы от руки.

Numbers имеет больше 700 настраиваемых форм, используемых для визуализации данных, и изрядное количество настроек оформления надписей и ячеек. Формирование сводных таблиц и функция анализа данных тоже присутствуют.

LibreOffice Calc

  • Платформа: Windows, Linux, macOS.

Calc — это часть офисного пакета LibreOffice, бесплатного и с открытым исходным кодом. Этот набор программ поставляется вместе с большинством дистрибутивов Linux, но и в Windows с macOS его установить можно.

WPS Office Spreadsheets

  • Платформа: Windows, Linux, macOS, Android, iOS, Web.

Редактор электронных таблиц, входящий в состав китайского офисного пакета WPS Office. Из всех перечисленных альтернатив он больше всего похож на Excel внешне, так что с ним вам не придётся тратить время на переобучение. Он также хорошо совместим с файлами Excel — XLS, XLSX и CSV.

Редактор поддерживает совместную работу, в нём есть больше сотни формул, функция составления сводных таблиц и анализа данных. Единственное, что раздражает в WPS — реклама, но с ней можно смириться.

Zoho Office Sheet

Это бесплатное приложение пригодится тем, кто занимается анализом относительно больших объёмов данных. Zoho позволяет трудиться над одной таблицей 25 пользователям одновременно. Вы можете откатывать нежелательные изменения с помощью системы контроля версий и защищать наиболее важные ячейки в таблице паролем.

Zoho поддерживает составление сводных таблиц и условное форматирование. В приложении есть возможность автоматизировать определённые задачи, например сбор данных и проверку содержимого ячеек. Программа умеет импортировать данные из внешних источников, таких как веб-страницы, ленты RSS или внешние таблицы. Также Zoho позволяет создавать пользовательские функции и записывать макросы.

А пользуетесь ли вы какой-то альтернативой Excel? Расскажите в комментариях.

Читайте также: