5 KNIME
- Vídeo: https://youtu.be/u85rydG2xYM
KNIME es una plataforma de software libre y de código abierto para el análisis de datos, minería de datos, aprendizaje automático e inteligencia artificial.
Da soporte al diseño de flujos de trabajo de forma visual, sin necesidad de programación. Permite conectar bases de datos y diferentes formatos de archivos, facilitando la integración de información desde múltiples fuentes.
5.1 Obtención de los datos
Los datos son los mismos que usamos para la actividad de Power Query. Si ya los tenemos en nuestro ordenador, no es necesario volverlos a descargar.
Los datos necesarios están disponibles en:
Descargaremos el archivo:
ventas_oltp_csv.zip
(base de datos OLTP en formato CSV).Descomprime el archivo en una carpeta de trabajo.
5.2 Datos disponibles
En la figura 5.1 se muestra el esquema de la base de datos OLTP.

Figura 5.1: Base de datos OLTP.
Los datos que hemos obtenido se corresponden con los de la base de datos OLTP pero están almacenados en formato CSV.
5.3 Objetivo
El objetivo de esta actividad es realizar una segmentación de los productos para poderla usar como un atributo adicional en nuestros informes.
5.4 Pasos
Segmentación inicial
- Definir al menos un campo numérico.
Enriquecimiento de la tabla
- Obtener campos numéricos basados en ventas.
- Agruparlos a nivel de producto.
Segmentación de la tabla enriquecida
- Segmentación de la tabla.
- Representación gráfica.
- Almacenar los resultados.
Ejercicios
Todos los apartados siguientes valen igual.
Define un flujo de trabajo para realizar la segmentación de los productos siguiendo los pasos del vídeo adjunto:
- Almacena el flujo de trabajo en un archivo que comience con tu nombre de usuario.
Define un flujo de trabajo para realizar una segmentación de las tiendas:
- Almacena el flujo de trabajo en un archivo que comience con tu nombre de usuario.
- Indica los campos numéricos utilizados y cómo se han obtenido.
Documentación a entregar:
Genera un documento en formato PDF con los apartados siguientes.
Segmentación de productos
Incluye un captura de pantalla completa del flujo de trabajo donde se muestre además el contenido de la tabla generada por el paso de segmentación.
Incluye una captura de pantalla completa donde se muestre la definición del paso de segmentación.
Segmentación de tiendas
Indica los campos numéricos utilizados y cómo se han obtenido1.
Incluye un captura de pantalla completa del flujo de trabajo donde se muestre además el contenido de la tabla generada por el paso de segmentación.
Incluye una captura de pantalla completa donde se muestre la definición del paso de segmentación.
Por ejemplo, en la segmentación de productos, se han obtenido a partir de línea de ticket y ticket, seleccionando las ventas de 2024, asociando a cada producto sus ventas detalladas a nivel de línea de ticket y agrupando las ventas por producto.↩︎