sábado, 27 de octubre de 2018

CONCEPTOS


Qué es el data mining o minería de datos?

La definición formal de data mining o minería de datos sería: la extracción no trivial de información implícita, previamente desconocida y potencialmente útil a partir de datos. Otra manera de definirlo podría ser: la exploración y el análisis -por medios automáticos o semiautomáticos- de grandes cantidades de datos con el fin de descubrir patrones con significado.

Proceso de la minería de datos
Resultado de imagen para proceso de la mineria de datos
Metodología CRISP
Imagen relacionada
El estándar incluye un modelo y una guía, estructurados en seis fases, algunas de estas fases son bidireccionales, lo que significa que algunas fases permitirán revisar parcial o totalmente las fases anteriores.
Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica)
  • Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito)
  • Evaluación de la situación (Inventario de recursos, requerimientos, supuestos, terminologías propias del negocio,…)
  • Establecimiento de los objetivos de la minería de datos (objetivos y criterios de éxito)
  • Generación del plan del proyecto (plan, herramientas, equipo y técnicas)
Comprensión de los datos (Familiarizarse con los datos teniendo presente los objetivos del negocio)
  • Recopilación inicial de datos
  • Descripción de los datos
  • Exploración de los datos
  • Verificación de calidad de datos
Preparación de los datos (Obtener la vista minable o dataset)
  • Selección de los datos
  • Limpieza de datos
  • Construcción de datos
  • Integración de datos
  • Formateo de datos
Modelado (Aplicar las técnicas de minería de datos a los dataset)
  • Selección de la técnica de modelado
  • Diseño de la evaluación
  • Construcción del modelo
  • Evaluación del modelo
Evaluación (De los modelos de la fase anteriores para determinar si son útiles a las necesidades del negocio)
  • Evaluación de resultados
  • Revisar el proceso
  • Establecimiento de los siguientes pasos o acciones
Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma de decisiones de la organización)
  • Planificación de despliegue
  • Planificación de la monitorización y del mantenimiento
  • Generación de informe final
  • Revisión del proyecto

No hay comentarios:

Publicar un comentario

CONCEPTOS