Как установить pentaho на windows

Обновлено: 05.07.2024

Когда я запускаю start-pentaho.bat, я получаю следующий результат:

Когда я пытаюсь остановить сервер BI, получаю следующее:

2 ответа

Я установил переменную среды PENTAHO_JAVA_HOME, чтобы она указывала на 64-разрядный JDK, установленный в моей системе, и теперь Pentaho BI Server запускается, как ожидалось.

У меня было такое же поведение, когда я пытался запустить Pentaho BI server community edition версии 5.3 / JRE7 на AMD Athlon / Windows 10 Home (32-разрядная версия). Решение, которое сработало для меня, заключалось в том, чтобы запустить Tomcat как службу Windows следующим образом:

(Примечание: в примечаниях ниже предполагается, что сервер Pentaho BI Server был установлен в C: \ Pentaho)

Отредактируйте переменные системной среды, включив в них следующее:

Если другое приложение использует порт 8080, отредактируйте файл C: \ Pentaho \ biserver-ce \ tomcat \ conf \ server.xml , заменив каждое вхождение порта 8080 новым номером порта, например 8081.

Используя командную строку администратора, перейдите в папку C: \ Pentaho \ biserver-ce \ tomcat \ bin и выполните команду:

В той же командной строке администратора запустите

Для запуска приложения, которое позволяет запускать и выключать службу, а также изменять настройки службы. Откроется графический пользовательский интерфейс приложения.

В приложении измените настройки Tomcat следующим образом:

(a) На вкладке «Ведение журнала» убедитесь, что подкаталог журналов находится в каталоге tomcat, например:

(b) На вкладке «Java» добавьте следующие параметры под существующими строками в текстовом поле «Параметры Java» (откройте C: \ Pentaho \ biserver-ce \ start-pentaho.bat с помощью текстовый редактор и просмотрите настройки 32-битного и 64-битного процессора (ниже приведены для 32-битных процессоров):

(c) На вкладке «Запуск» убедитесь, что значение в текстовом поле «Рабочий путь» указывает на подкаталог \ tomcat \ bin , например:

(см. решение Исключение инициализации Pentaho, предложенное Shivan 7 декабря 2016 г. для получения дополнительной информации).

На вкладке «Общие» нажмите кнопку «Пуск», чтобы запустить Pentaho BI Server.

После использования Pentaho вы изящно завершите работу службы Tomcat, нажав кнопку «Стоп».

Используйте комбинацию клавиш + R для ввода cmd, введите java -version, чтобы проверить среду Java следующим образом:



Выберите подходящую версию и нажмите «Загрузить».


После завершения загрузки распакуйте его, чтобы завершить установку.
Распакуйте, как показано на рисунке:

Pentaho Sever поставляется с tomcat, нажмите start-pentaho.bat, чтобы запустить Pentaho Sever, и дождитесь завершения запуска, как показано на рисунке.



Возможные проблемы
Запуск консоли искажен.
Найдите файл запуска start-pentaho.bat по пути установки, мой путь D: \ pentaho \ pentaho-server \ start-pentaho.bat, откройте редактор с помощью Блокнота. воли
set CATALINA_OPTS = -Xms2048m -Xmx6144m -XX: MaxPermSize = 256m -Dsun.rmi.dgc.client.gcInterval = 3600000 -Dsun.rmi.dgc.server.gcInterval = 3600000 -Dfile. utf8 в кодировке = utf8 -DDI_HOME =% DI_HOME% можно изменить на GBK.

Окончательный текст выглядит следующим образом:


Это место легко понять неправильно. Это проблема tomcat8. Затем измените файл конфигурации tomcat8 и обнаружите, что он не действует. Фактически, при запуске pentaho переназначил переменную среды.

Проверьте, успешно ли установлено pentaho

Введите в адресной строке браузера: localhost: 8080, если вы можете войти на домашнюю страницу pentaho, это означает, что установка прошла успешно, как показано на рисунке:

Нажмите «Войти в качестве оценщика», чтобы увидеть имя пользователя и пароль.
Нажмите любую кнопку Перейти, чтобы войти на главную страницу.

Хотя сервер Pentaho Server был успешно запущен, существует проблема, которую необходимо решить.
насОбнаружено, что HSQLDB используется в журнале запуска.
Много важной информации о сервере Pentaho BI хранится в базе данных, которая по умолчанию использует базу данных HSQLDB, то есть использует ее для хранения собственной базы данных, такой как информация о планировании Quartz, подключение к бизнес-базе данных.

Доступ к информации (источник данных) и т. Д.
HSQLDB не может поддерживать реальные корпоративные приложения, его необходимо заменить в производственной среде. На данный момент база данных сервера Pentaho BI поддерживает HSQLDB, MySQL 5.x, Oracle 10g,

4 типа базы данных, включая Postgres 8.1.x. Стоит отметить, что BI-сервер будет использовать Hibernate для управления вышеуказанным сбором таблиц базы данных, поэтому он поддерживает пользователей для расширения использования других данных.

Тип библиотеки, такой как DB2, SQL Server.
Отчет pentaho поддерживает mongodb в качестве источника данных для анализа данных в mongodb,
чайник pentaho также может чистить и писать mongodb, но, к сожалению, сервер pentaho не поддерживает использование mongodb в качестве базы данных.

Обратитесь к следующей ссылке для настройки базы данных mysql:


Отредактируйте файл D: \ pentaho \ pentaho-server \ pentaho-solutions \ system \ applicationContext-spring-security-hibernate.properties
Основная операция состоит в том, чтобы аннотировать исходную конфигурацию, соответствующую соответствующей конфигурации недавно добавленного mysql
Адресный порт, имя пользователя и пароль должны соответствовать вашей собственной конфигурации mysql.
как показано:


Отредактируйте файл D: \ pentaho \ pentaho-server \ pentaho-solutions \ system \ hibernate \ hibernate-settings.xml
Измените путь hsql.hibernate.cfg.xml в конфигурации на mysql5.hibernate.cfg.xml, как показано на рисунке:


Отредактируйте файл D: \ pentaho \ pentaho-server \ pentaho-solutions \ system \ hibernate \ mysql5.hibernate.cfg.xml
Основная операция - изменить адресный порт, а имя пользователя и пароль должны соответствовать их собственной конфигурации mysql.


Изменить D: \ pentaho \ pentaho-server \ pentaho-solutions \ system \ simple-jndi \ jdbc.properties
Основная операция заключается в изменении пароля учетной записи драйвера адресного порта в соответствии с его собственной корреспонденцией.


Отредактируйте D: \ pentaho \ pentaho-server \ tomcat \ webapps \ pentaho \ META-INF \ context.xml
Основная операция заключается в изменении пароля учетной записи драйвера адресного порта в соответствии с его собственной корреспонденцией.

Полный контент:

Отредактируйте файл D: \ pentaho \ pentaho-server \ tomcat \ webapps \ pentaho \ WEB-INF \ web.xml
Отключите HSqlDB по умолчанию, основная операция удаляет или комментирует следующее содержимое:

Может быть изменен, чтобы разрешить внешний доступ к сети или доступ к имени домена.


Суть OLAP заключается в том, что исходная для анализа информация представляется в виде многомерного куба, и обеспечивается возможность произвольно манипулировать ею и получать нужные информационные разрезы - отчеты. При этом конечный пользователь видит куб как многомерную динамическую таблицу, которая автоматически суммирует данные (факты) в различных разрезах (измерениях), и позволяет интерактивно управлять вычислениями и формой отчета. Выполнение этих операций обеспечивается OLAP-машиной (или машиной OLAP-вычислений). [Источник 1]

Содержание

Установка средств бизнес-аналитики Pentaho Community Edition в Windows

Pentaho - ведущий поставщик инструментов бизнес-аналитики, который включает в себя:

1. BA Server и User Console, используемые для создания аналитического контента, такого как информационные панели и отчеты. Эти инструменты подразделяются на две основные области:

  • Инструменты и плагины для веб-дизайна: конструктор отчетов, анализатор, интерактивная отчетность, дизайнер приборной панели и дизайнер мобильных устройств.
  • Инструменты проектирования на основе клиента: конструктор агрегации, редактор метаданных и инструментарий Schema Workbench

2. Сервер интеграции данных, используемый для создания, планирования и выполнения заданий Extract, Translation and Loading (ETL). Эти компоненты включают:

  • Spoon: Пользовательский интерфейс для создания, расписания и выполнения заданий ETL
  • Плагины, включая Instaview и AgileBI, которые позволяют дизайнеру интерактивно просматривать и моделировать исходные данные и преобразования. [Источник 2]

Установка и настройка Java Runtime Environment

Для запуска Pentaho требуется Java Runtime Environment (JRE) или Java Development Kit (JDK). Версия JRE, которую вы используете, зависит от версии Pentaho Community Edition. Например, Pentaho Community Edition 5.4 не будет работать с JRE 1.8, поэтому я предлагаю вам придерживаться JRE 1.7, если вы планируете установить Pentaho Community Edition 5.x.

Средства разработки Pentaho Community Edition версии 6.x, 7.x и 8.x отлично работают с JRE 1.8.

ВАЖНО: вы должны установить 64-разрядную версию Java Runtime Environment (JRE) или Java Development Kit (JDK).

Установите переменную среды JAVA_HOME


Загрузка платформы платформы бизнес-аналитики Pentaho Community Edition

В этом разделе описывается, как загрузить и установить платформу Business Analytics Community Edition для платформы Pentaho. Платформа BA состоит из веб-сервера Apache Tomcat и сервера приложений Java Servlet. Этот сервер будет работать на порту localhost port 8080 .

Pentaho BI Server можно загрузить непосредственно из SourceForge: pentaho-server-ce-7.1.0.0-12.zip Сохраните загруженный ZIP-файл в папку по вашему выбору. Разархивируйте .zip файл в подходящее место папки на вашей системе, такой как c:\Pentaho .


Убедитесь, что переменная среды JAVA_HOME установлена ​​с помощью команды ECHO


Запустите Pentaho BA Server, запустив программу start-pentaho.bat . Этот скрипт запустит сервер Tomcat на порту 8080, а также запустит сервер HSQLDB.



После запуска вы должны увидеть информацию о регистрации с сервера Tomcat:


Чтобы подключиться к серверу Pentaho BA, откройте веб-браузер и подключитесь к локальному компьютеру на порту 8080 на локальном компьютере (локальном компьютере): localhost: 8080. Войдите с именем пользователя «admin» и пароль «password».


Установка интеграции данных (PDI) Pentaho Community Edition

Скачайте с сайта Sourceforge PDI: pdi-ce-7.1.0.0-12.zip. Извлеките файл .zip в папку:



Перейдите в папку Data-Integration и запустите программу Spoon.bat, чтобы запустить интеграцию данных Pentaho (Kettle).


Установка драйверов MySQL JDBC в интеграции данных Pentaho и инструментов сервера BA

Драйверы JDBC для MySQL называются «Connector / J» [Источник 3]

Посетите официальный сайт MySQL Прокрутите страницу вниз до раздела с параметрами загрузки. Убедитесь, что выбрана «Независимая платформа» Для операционной системы Windows загрузите ZIP-архив. Разархивируйте (де-компресс) архив ZIP: Найдите файл mysql-connector-java-5.1.46-bin.jar (обратите внимание, что он может иметь несколько другое имя в зависимости от версии). Скопируйте этот .jar- файл в соответствующую папку LIB в дистрибутиве Pentaho Community Edition. Для интеграции данных Pentaho целевая папка должна быть .\Pentaho\data-integration\lib, как показано ниже:


Добавление коннектора J в Pentaho (директория data-integration)


Сервер Pentaho BA хранит свои драйверы в папке. \ Pentaho-server \ tomcat \ lib . Убедитесь, что драйвер JDBC MySQL еще не установлен. Если это так, сохраните только самую последнюю копию файла .jar . Например, версия 7.0 сервера Pentaho включает в себя версию MySQL JDBC Driver mysql-connector-java-5.1.17. Однако в этой версии есть некоторые ошибки, поэтому обязательно удалите этот файл mysql-connector-java-5.1.17.jar и замените его на самый последний файл mysql-connector-java-5.1.46-bin.jar .


Добавление коннектора J в Pentaho (директория tomcat)


Теперь, когда драйверы JDBC были скопированы в соответствующие папки, перезапустите сервер Pentaho BA ( start-pentaho ) и запустите инструменты интеграции данных ( Spoon ).

Настройка соединения MySQL в интеграции данных Pentaho

Подготовка таблиц фактов и измерений

Перед началом работы вам потребуются учетные данные для входа в экземпляр MySQL.

1. Установите MySql Server и MySql Workbench (скачайте и сделайте полную установку mysql-installer-community-8.0.11.0).
2. Выполните скрипты для создания схемы и таблиц.
3. Запустите spoon. File > New > Job (Ctrl+Alt+N). Откроется рабочая область задания. Переходим во вкладку View, создаем новое соединение с БД (Database connections > New): вбиваем сервер, БД, пользователя и пароль, даем соединению какое-нибудь имя (у меня fbplayers) и сохраняем (c:\Pentaho\biserver-ce\pentaho-solutions\jobs\fbplayers.kjb). 4. Создаем трансформацию (File > New > Transformation, Ctrl+N). Сохраним ее под именем prepare_tables.ktr. Точно так же как и с заданием (job), добавляем коннект к БД для трансформации. Готово. 5. Переходим во вкладку View и раскрываем раздел Input. Выбираем инструмент Data Grid. Он хорошо подходит, если нужно вынести какие-то поля с небольшим количеством возможных вариантов в отдельные связанные таблицы. Итак, вытягиваем Data Grid в рабочую область и открываем ее для редактирования двойным кликом. Вбиваем название данного шага трансформации (Player Status), начинаем задавать структуру данной таблицы (вкладка Meta) и сами данные (вкладка Data). В структуре имеем 2 поля: 1) Name — id, Type — Integer, Decimal — 11 2) Name — status, Type — String, Length — 10. Во вкладке Data вбиваем 2 строки: 1 — active, 2 — inactive. 6. Переходим в раздел Output и вытягиваем оттуда элемент Table Output. Двойной щелчок, задаем имя элемента как Player Status Dim. Коннект должен отобразиться в следующей строчке. В поле Target Table пишем название таблицы, которая будет создана в БД для хранения статуса игроков: player_status_dim. Ставим чекбокс Truncate Table. Связываем входной и выходной элементы: щелкаем по Player Status и с зажатой кнопкой Shift тянем мышь на Player Status Dim. Связь должна появиться в виде стрелки, соединяющей эти элементы. 7. Создадим новую трансформацию (initial_sql). Не забываем про коннект. Из коллекции элементов выбираем Scripting > Execute SQL Script. В него пишем сборщик дат. Тут же, в этой трансформации, создаем еще SQL-скрипт — для создания таблицы Player Status Dim: 8. Приступаем к основной части нашей миссии — сборке таблицы фактов. Создаем трансформацию (player_fact.ktr). Из вкладки Input кидаем Table Input, из Output — Table Output соответственно. В Table Input пишем SQL-ник. В Table Output указываем имя таблицы — player_fact. Связываем исходную и результирующую таблицы стрелкой. Опять идем в наш job. Из вкладки General добавляем новую трансформацию. Открываем ее, даем имя Prepare Tables и указываем путь до нашей сохраненной трансформации prepare_tables.ktr. 9. То же самое делаем с трансформациями Initial SQL и Player Fact. 10. Закидываем на форму кнопку Start и соединяем элементы в следующей последовательсти: Start > Initial SQL > Prepare Tables > Load Player Fact.

Теперь можно попробовать запустить задание. В панели инструментов жмакаем зеленый треугольник. Если все верно, то около каждого из наших элементов мы увидим зеленую галочку. Можно зайти на свой сервер и проверить, что таблички действительно созданы. Если что-то пошло не так, то лог покажет все ошибки. [Источник 4]

Создание куба и публикация его на сервере

Теперь, когда у нас есть подготовленные данные, займемся, наконец, и OLAP-ом. Для создания olap-кубов у Pentaho есть утилита Schema Workbench.

  1. Скачиваем, распаковываем, закидываем mysql-коннектор в папку drivers, запускаем workbench.bat.
  2. Сразу же заходим в меню Options > Connection. Вводим наши параметры подключения к БД.
  3. Приступаем: File > New > Schema. Сразу сохраним схему (у меня fbplayers.xml). Зададим имя схеме.
  4. Через контекстное меню схемы создаем куб. Назовем его именем сущности, статистику по которой будем считать, т.е. Player.
  5. Внутри куба указываем таблицу, которая будет у нас таблицей фактов: player_fact.
  6. Если выбрать куб Player, то красная строчка внизу правой области подскажет нам, что в кубе должны быть заданы измерения (Dimensions), т.е. те параметры, по которым будут производиться срезы данных.
  7. Итак, добавим первое измерение (по стране). Создаем измерение схемы, даем ему имя Country. Внутри него уже есть 1 иерархия, ей зададим имя Country_Hierarchy. В эту иерархию добавляем таблицу, которая хранит значения измерения Country, т.е. country.
  8. Это моя обычная mysql-таблица со списком стран следующей структуры:
  9. После этого добавляем в иерархию 1 уровень (Add Level). Назовем его Country_Level и свяжем таблицу фактов с этой таблицей измерения: поле table выставляем в country, column — в id, nameColumn — в name. Т.е. это значит, что при сопоставлении ID страны из таблицы фактов ID страны из таблицы country в качестве результата вернется название страны (для читабельности). Остальные поля в принципе можно и не заполнять.
  10. Теперь мы можем вернуться к кубу Player и задать ему только что созданное измерение (через Add Dimension Usage). Задаем имя (Country), source — это наше созданное измерение Country (в выпадающем списке оно и будет пока единственным), а поле foreignKey — main_country_id, т.е. это говорит Pentaho, что когда он видит какой-то main_country_id в таблице фактов, он обращается к таблице измерения (Country) по указанному столбцу (id) и подставляет на место main_country_id значение name.
  11. Осталось только указать кубику, что мы собственно хотим агрегировать-то )) Добавляем в куб меру (Add Measure). Зададим ей имя PlayerCount, агрегатор — distinct-count и поле, по которому будем агрегировать — player_id.
  12. Давайте остановимся на этом ненадолго и проверим, что мы тут наколдовали. Запускаем веб-морду Pentaho: localhost:8080/pentaho (не забываем про start-pentaho.bat). Заходим в File > Manage > Data Sources. Жмем кнопку добавления нового источника. Выбираем тип — Database Table(s). Самое важное, что нам тут нужно — это создать новое соединение (Connection). Задаем имя (Fbplayers) и вбиваем наши данные для доступа к БД. После сохранения Connection’а, жмем везде Cancel, больше нам тут ничего не нужно.
  13. Далее нам нужно опубликовать созданную схему на сервере Pentaho: File > Publish. Задаем урл: localhost:8080/pentaho и вводим пароль на публикацию. Этот пароль задается в файлике c:\Pentaho\biserver-ce\pentaho-solutions\system\publisher_config.xml. Установим этот пароль в 123, например, юзер и пароль стандартные — joe/password. Если все нормально, то после должно отобразиться окно выбора папки, куда сохранять нашу схему. Вводим имя соединения, которое мы создали на прошлом шаге (Fbplayers) в поле «Pentaho or JNDI Source». Создадим папку schema и сохраним файл в нее. Если все прошло нормально, мы должны увидеть радостное окошко.
  14. Заходим на веб-морду, открываем Saiku, выбираем наш куб из выпадающего списка. Видим появившиеся измерение Country и меру PlayerCount. Перетягиваем Country_Level в поле Rows, PlayerCount — в Columns. По умолчанию, на панели Saiku вжата кнопка автоматического выполнения запроса. Обычно стоит ее отжать перед натаскиванием измерений и мер, но это не принципиально. Если автоматическое выполнение отключено, жмем кнопку Run.

Видеоинструкция

Заключение

Компания Pentaho является известным игроком на рынке BI-решений с открытым исходным кодом. Продукт Pentaho состоит из отдельных модулей-компонентов, которые вместе формируют Pentaho BI Platform:

  • Pentaho Reporting - модуль создания и представления отчетов;
  • Pentaho Analysis - модуль для выполнения OLAP-анализа;
  • Pentaho Dashboard - модуль для управления и прогнозирования;
  • Pentaho Data Integration - модуль для интеграции данных из разных источников;
  • Pentaho Data Mining - модуль для поиска скрытых зависимостей в данных.

Pentaho BI Suite представлен в двух версиях:

  • Pentaho Enterprise Edition (EE) - платная
  • Pentaho Community Edition (CE) - бесплатная

Эти версии отличаются уровнем поддержки и наличием продвинутой, хотя и не очень востребованной небольшими компаниями функциональности: кластеризацией, мониторингом производительности и т.д.

Стоит отметить, что кроме BI-продуктов компания Pentaho также предлагает продукты для интеграции данных. Этот DI-продукт (data integration) позволяет переносить данные из одной СУБД в другую, облегчая задачу сопровождения, если компания использует несколько СУБД в разных филиалах или выполняет переход с одной версии СУБД на другую. Кроме того, в ходе переноса данные могут быть преобразованы, если это необходимо, а сами интеграционные сеансы могут выполняться без вмешательства пользователя и по установленному расписанию, когда число активных пользователей СУБД не велико. По умолчанию Pentaho использует движок HSQLDB, т.е. создает и хранит все базы данных в памяти, в том числе тестовую базу sampledata. Это еще нормально для небольших таблиц (таких, как демо), но для боевых данных обычно движок меняют на MySQL или Oracle, например. Основная сила Pentaho, да и всего OLAP, собственно, не в простых выборках, а в срезах по нескольким измерениям одновременно. С увеличением количества метрик запросы могут становиться все более сложными и точечными, отражающими конкретную статическую потребность.

Скачайте и установите Pentaho Community Edition.

Перенесите папку saiku в папку $PENTAHO_HOME$/pentaho-server/pentaho-solutions/system , где $PENTAHO_HOME - папка, в которую установлен Pentaho.

Плагин Saiku по умолчанию не поддерживает последние версии Pentaho Server. Чтобы избежать ошибок при сохранении отчёта, сделайте следующее:

Удалите файлы библиотек cpf-core-6.0.0.0-353.jar и cpf-pentaho5-6.0.0.0-353.jar из папки $PENTAHO_HOME$/pentaho-server/pentaho-solutions/system/saiku/lib .

Скопируйте более новые версии этих библиотек из какой-либо другой папки в вашей версии Pentaho (например, $PENTAHO_HOME$/pentaho-server/pentaho-solutions/system/sparkl/lib или …​/cgg/lib ) в папку $PENTAHO_HOME$/pentaho-server/pentaho-solutions/system/saiku/lib :

Библиотеки cpk-core…​ и cpk-pentaho…​ могут отсутствовать в вашей версии Pentaho. В этом случае используйте только cpf-core и cpf-pentaho .

Войдите в систему и нажмите на кнопку CREATE NEW LICENSE.

В окне создания лицензии выберите тип лицензии COMMUNITY_EDITION.

Сохраните и скачайте файл лицензии. Переименуйте файл в license.lic и скопируйте его в папку $PENTAHO_HOME$/pentaho-server/pentaho-solutions/system/saiku

Скачайте и установите утилиту Pentaho Data Integration.

Измените порт Pentaho по умолчанию на 18081:

Перейдите в папку $PENTAHO_HOME/server/pentaho-server/tomcat/conf

Измените порт Tomcat по умолчанию на 18081 в файле server.xml :

Измените shutdown порт Tomcat по умолчанию на 8015 в файле server.xml , чтобы избежать пересечений с портом CUBA:

Настройте аутентификацию пользователей CUBA в Pentaho:

Скачайте cuba-bi-pentaho-1.6.0.jar и скопируйте его в папку $PENTAHO_HOME$/pentaho-server/tomcat/webapps/pentaho/WEB-INF/lib .

Скачайте cuba-bi-pentaho-1.6.0-plugin.zip, распакуйте архив и скопируйте папку saiku-cuba-bi в папку $PENTAHO_HOME/pentaho-server/pentaho-solutions/system .

Создайте новый файл cuba-pentaho-community-authentication.xml в папке $PENTAHO_HOME/pentaho-server/pentaho-solutions/system со следующим содержимым:

Укажите URL вашего приложения CUBA в свойстве cubaConnectionUrl бина cubaAuthenticationFilter .

Читайте также: