Antes de hablar sobre métodos de minería de datos primero tenemos que saber que es minería de datos es por eso que les pro proporciono estas lineas para que se enteren mas .
En la sociedad actual se ha producido un gran crecimiento de las bases de datos y una necesidad de aumento de las capacidades de almacenamiento que no pueden resolverse por métodos manuales. Por este motivo se hacen necesarias técnicas y herramientas informáticas que ayuden, de forma automática, en el análisis de esas grandes cantidades de datos. La minería de datos (en inglés data mining) es una de las técnicas más utilizadas actualmente para analizar la información de las bases de datos. La finalidad que persigue la minería de datos es la de extraer patrones, describir tendencias, predecir comportamientos y, sobre todo, ser provechosa en la investigación computarizada que envuelve la sociedad actual con amplias bases de datos de escasa utilidad.
La minería de datos no es más que una etapa, aunque la más importante, del descubrimiento de la información en bases de datos (KDD, sus respectivas siglas en inglés para Knowledge Discovery in Databases). En síntesis, se pueden establecer como objetivos prioritarios de la minería de datos los siguientes:
- Identificación de patrones significativos o relevantes.
- Procesamiento automático de grandes cantidades de datos.
- Presentación de los patrones como conocimiento adecuado para satisfacer los objetivos de los usuarios.
Una ves que ya sabemos que es minería de datos les paso a informar lo que es el famoso metodo clustering
El
proceso de agrupar un conjunto de objetos abstractos o físicos en
clases similares recibe el nombre de clustering. Un cluster es, una
colección de datos que son parecidos entre ellos y diferentes a los
datos pertenecientes a otros clusters. Un cluster de datos puede ser
tratado colectivamente como un único grupo en numerosas
aplicaciones. Las técnicas de clustering son técnicas de
clasificación no supervisada de patrones en conjuntos denominados
clusters.
El
problema del clustering ha sido abordado por gran cantidad de
disciplinas y es aplicable a una gran cantidad de contextos, lo cual
refleja su utilidad como uno de los pasos en el análisis
experimental de datos. Las técnicas de clustering han sido
ampliamente utilizadas en múltiples aplicaciones tales como
reconocimiento de patrones, análisis de datos, procesado de imágenes
o estudios de mercado. Gracias al clustering se pueden identificar
regiones tanto pobladas como dispersas y, por consiguiente, descubrir
patrones de distribución general y correlaciones interesantes entre
los atributos de los datos. En el área de los negocios, el
clustering puede ayudar a descubrir distintos grupos en
los hábitos de sus clientes y así, caracterizarlo en grupos basados
en patrones de compra. El análisis de clusters se puede usar para
hacerse una idea de la distribución de los datos, para observar las
características de cada cluster y para centrarse en un conjunto
particular de datos para futuros análisis.
A
diferencia de la clasificación, el clustering no depende de clases
previamente definidas ni en ejemplos de entrenamientos etiquetados a
priori. Por esta razón, se trata de una forma de aprendizaje por
observación en vez de aprendizaje por ejemplos. En el clustering
conceptual un grupo de objetos forma una clase sólo si puede ser
descrito mediante un concepto, lo que difiere del clustering
convencional que mide similitudes basadas en distancias geométricas.
El clustering conceptual consiste en dos componentes:
- Descubre las clases apropiadas.
- Forma descripciones para cada clase, tal y como sucede en la clasificación
si les interesa saber mas sobre el tema tienes 2 opciones .
Opción 1
Opción 2
0 comentarios:
Los comentarios nuevos no están permitidos.