"Torturando a los datos hasta que estos confiesan"
La minería de datos (DM, Data Mining) consiste en la extracción relevante de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y puede resultar útil para algún proceso o informe nuevo.
En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar la información almacenada en las bases de datos.
Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:
- Comprensión del negocio y del problema que se quiere resolver.
- Determinación, obtención y limpieza de los datos necesarios.
- Creación de modelos matemáticos.
- Validación, comunicación, etc. de los resultados obtenidos.
- Integración, si procede, de los resultados en un sistema transaccional o similar.
Ejemplos de aplicación de la minería de datos en el ámbito empresarial:
- Relaciones con el cliente: En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas o enviando cartas, sólo se contactará con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una determinada oferta o promoción.
Así pues, no se trata de crear modelos para predecir qué clientes pueden cambiar, se trata de que la empresa pueda construir modelos separados para cada región y/o para cada tipo de cliente. También se puede determinar qué clientes van a ser rentables durante una ventana de tiempo (una quincena, un mes,...) y sólo enviar las ofertas a las personas con mayor probabilidad de ser rentables. Para mantener esta cantidad de modelos, es necesario gestionar las versiones de cada modelo y pasar a una minería de datos lo más automatizada posible.


