.



jueves, 25 de julio de 2013

Agrupamiento de datos clustering

Antes de hablar sobre métodos de minería de datos primero tenemos que saber que es minería de datos es por eso que les pro proporciono estas lineas para que se enteren mas .

En la sociedad actual se ha producido un gran crecimiento de las bases de datos y una necesidad de aumento de las capacidades de almacenamiento que no pueden resolverse por métodos manuales. Por este motivo se hacen necesarias técnicas y herramientas informáticas que ayuden, de forma automática, en el análisis de esas grandes cantidades de datos. La minería de datos (en inglés data mining) es una de las técnicas más utilizadas actualmente para analizar la información de las bases de datos. La finalidad que persigue la minería de datos es la de extraer patrones, describir tendencias, predecir comportamientos y, sobre todo, ser provechosa en la investigación computarizada que envuelve la sociedad actual con amplias bases de datos de escasa utilidad. La minería de datos no es más que una etapa, aunque la más importante, del descubrimiento de la información en bases de datos (KDD, sus respectivas siglas en inglés para Knowledge Discovery in Databases). En síntesis, se pueden establecer como objetivos prioritarios de la minería de datos los siguientes: 
  1. Identificación de patrones significativos o relevantes.
  2. Procesamiento automático de grandes cantidades de datos. 
  3. Presentación de los patrones como conocimiento adecuado para satisfacer los objetivos de los usuarios.
Una ves que ya sabemos que es minería de datos les paso a informar lo que es el famoso metodo clustering


El proceso de agrupar un conjunto de objetos abstractos o físicos en clases similares recibe el nombre de clustering. Un cluster es, una colección de datos que son parecidos entre ellos y diferentes a los datos pertenecientes a otros clusters. Un cluster de datos puede ser tratado colectivamente como un único grupo en numerosas aplicaciones. Las técnicas de clustering son técnicas de clasificación no supervisada de patrones en conjuntos denominados clusters.
El problema del clustering ha sido abordado por gran cantidad de disciplinas y es aplicable a una gran cantidad de contextos, lo cual refleja su utilidad como uno de los pasos en el análisis experimental de datos. Las técnicas de clustering han sido ampliamente utilizadas en múltiples aplicaciones tales como reconocimiento de patrones, análisis de datos, procesado de imágenes o estudios de mercado. Gracias al clustering se pueden identificar regiones tanto pobladas como dispersas y, por consiguiente, descubrir patrones de distribución general y correlaciones interesantes entre los atributos de los datos. En el área de los negocios, el clustering puede ayudar a descubrir distintos grupos en los hábitos de sus clientes y así, caracterizarlo en grupos basados en patrones de compra. El análisis de clusters se puede usar para hacerse una idea de la distribución de los datos, para observar las características de cada cluster y para centrarse en un conjunto particular de datos para futuros análisis.
A diferencia de la clasificación, el clustering no depende de clases previamente definidas ni en ejemplos de entrenamientos etiquetados a priori. Por esta razón, se trata de una forma de aprendizaje por observación en vez de aprendizaje por ejemplos. En el clustering conceptual un grupo de objetos forma una clase sólo si puede ser descrito mediante un concepto, lo que difiere del clustering convencional que mide similitudes basadas en distancias geométricas. El clustering conceptual consiste en dos componentes:
  1. Descubre las clases apropiadas.
  2. Forma descripciones para cada clase, tal y como sucede en la clasificación

si les interesa saber mas sobre el tema tienes 2 opciones .

Opción 1



Opción 2


0 comentarios: