GitHub - dev2dad/elk-bi: Visualizador de datos para la toma de decisiones

Contenido

Introducción
Requerimientos
Configuración
Instalación
Demo
Desarrollo
Contacto

Introducción

¿Qué es ELK?

ELK (por Elasticsearch-Logstash-Kibana) es un stack de componentes open source que comprende:

Elasticsearch - Un motor de búsqueda
Logstash - Una herramienta que recolecta datos de distintas fuentes capaz de analizarlos, mutarlos y grabarlos en Elasticsearch
Kibana - Una interfaz web que da la posibilidad de realizar visualizaciones y búsquedas con la base de datos
MariaDB - Un motor de base de datos

Los datos parseados por Logstash y enviados a Elasticsearch provienen de la ejecución de la sentencia SELECT * FROM lugares_resueltos; que es una vista que incluye los joins necesarios con tablas referenciales para obtener el valor asociado (por ejemplo: provincia). La tabla principal es "lugares".

Requerimientos

docker >= 1.10
docker-compose >= 1.7.1

Configuración

El archivo .env contiene variables de entorno que sirven para configurar el stack en base a necesidades puntuales. Los valores por defecto sirven para levantar el stack entero sin realizar modificaciones

INDEX: el índice de elasticsearch donde se alojarán los datos presentes en MariaDB.
MYSQL_HOST: el hostname del contenedor de MariaDB.
MYSQL_USER: el usuario con permisos (ALL) sobre la base de datos creada al inicio del contenedor.
MYSQL_PASSWORD: la contraseña del usuario nombrado arriba.
DELAY: El tiempo de retardo entre solicitudes de logstash a elasticsearch.
MAX_TRIES: La cantidad máxima de intentos de conexión de logstash a elasticsearch.
ES_PROTO: el protocolo mediante el cual logstash se conectará a elasticsearch.
ES_HOST: el hostname del contenedor de elasticsearch.
ES_PORT: el puerto de elasticsearch al cual logstash realizará la conexión.
ELASTICSEARCH_URL: generalmente la URL compuesta por los 3 anteriores.
MODE: el modo de ejecución de logstash, puede ser "bulk" o "tracker", en caso de no especificarse un modo váido, logstash tomará la decisión del modo en base a la existencia del índice y cantidad de documentos.

Instalación

$ git clone https://github.com/argob/sql2elk
$ docker-compose up

Para evitar el modo interactivo, pasar el parámetro -d"

Una vez levantado el stack, ingresar a la UI de Kibana localhost:5601.
Introducir el nombre del índice (el mismo de la variable $INDEX) en el campo de la sección "Index name or pattern ".
Seleccionar el campo con fecha que ordenará los documentos (por ejemplo "creado") y hacer click en "Create".
Ir a la pestaña "Saved Objects" y hacer click en "Import".
Seleccionar "visualizaciones.json", presente en el repositorio.

Dashboard:

Ir a "Dashboards" -> "Open" -> "Lugares"

Eliminar contenedores

Para eliminar los contenedores

$ docker-compose down

Demo

Levantar el stack

Dejar el stack en ejecución, no es necesario presionar Ctrl + C

Configurar índice y visualizaciones

Desarrollo

sql2elk

Ejemplo básico sobre importar datos de una BD a Elasticsearch, manipular los campos con Logstash y hacer visualizaciones en Kibana. Los datos incluidos pertenecen a lugares y establecimientos turísticos de Argentina verificados como accesibles por el Servicio Nacional de Rehabilitación y cubren los tipos de campo fecha, entero, caracteres y punto geográfico.

El orden de arranque de los contenedores es MariaDB - Logstash - Elasticsearch - Kibana

El archivo turismo.json es la plantilla que contiene las propiedades del índice, tales como el nombre y tipo de campos.

Logstash tiene 2 modos de ejecución:

bulk: Ejecuta la sentencia "SELECT * FROM lugares_resueltos", en otras palabras trae todas las filas.
tracker: Ejecuta la sentencia "SELECT * FROM lugares_resueltos WHERE modificado > :sql_last_run" siendo sql_last_run un archivo que contiene la fecha y hora de la última ejecución de logstash. Si alguna fila tiene el campo "modificado" superior a la última ejecución, logstash parseara solamente este registro.

El modo puede ser seteado mediante la variable MODE, si la misma está vacía o tiene algún valor distinto a los modos enunciados arriba se definirá el mismo en base a la existencia del índice y/o cantidad de documentos.

Los pasos hasta llegar a la visualización son los siguientes:

Se descargan las imágenes del repositorio de Docker (si es que no existen previamente).
Se construye la imagen de logstash con los archivos de configuración necesarios: logstash-bulk.conf, logstash-tracker.conf y la plantilla turismo.json.
Arranca el contenedor de MariaDB con el dump montado en /docker-entrypoint-initdb.d para que pueda ser inicializada.
Arranca Elasticsearch.
Arranca logstash e intenta conectarse a elasticsearch con el intervalo especificado en la variable DELAY hasta que se alcance el valor de MAX_TRIES.
Se chequea la existencia del índice especificado en INDEX y la cantidad de documentos para determinar que archivo de configuración debe ser utilizado.
En base a la cantidad de documentos se setea el modo de ejecución de logstash, si hay 0 documentos se ejecutara en modo bulk, de lo contrario en tracker a menos que la variable MODE tenga algún modo válido.
Logstash ejecuta la consulta, parsea los campos de las filas, en el caso de "ubicacion.coordeanas", se genera un array con los valores de "lat" y "lon".
Si es modo bulk, el contenedor se detiene, si es modo tracker sigue en ejecución.

Utilizar otros datos

Siguiendo el ejemplo, puede crearse un índice con datos propios, para ello se necesita el dump de una base de datos y una plantilla para que mapee los mismos, ademas de alterar la variable INDEX. Los nombres de los campos de la plantilla deben coincidir con los de las columnas de la tabla o vista.

Contacto

Te invitamos a contactarnos en caso de que encuentres algún defecto (bug) o tengas feedback respecto al proyecto. Para todo lo demás, podés enviarnos tu comentario o consulta a [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
logstash		logstash
mariadb		mariadb
.env		.env
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml
visualizaciones.json		visualizaciones.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Contenido

Introducción

¿Qué es ELK?

Requerimientos

Configuración

Instalación

Dashboard:

Eliminar contenedores

Demo

Levantar el stack

Configurar índice y visualizaciones

Desarrollo

sql2elk

Utilizar otros datos

Contacto

About

Releases

Packages

Languages

License

dev2dad/elk-bi

Folders and files

Latest commit

History

Repository files navigation

Contenido

Introducción

¿Qué es ELK?

Requerimientos

Configuración

Instalación

Dashboard:

Eliminar contenedores

Demo

Levantar el stack

Configurar índice y visualizaciones

Desarrollo

sql2elk

Utilizar otros datos

Contacto

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages