En los últimos años se han acumulado enormes
cantidades de datos en todas las organizaciones, y esta tendencia continúa a un
ritmo acelerado. Esto es posible por el amplio uso de los sistemas
computarizados, nuevas técnicas de captura de datos, el empleo de códigos de
barra, los lectores de caracteres ópticos, las tarjetas magnéticas, entre
otros, y por el avance en la tecnología de almacenamiento y su consiguiente
reducción de costos. La disponibilidad de esos datos es un importante
activo para cualquier organización, en la medida en que puedan ser
transformados en información de interés, utilizando técnicas y métodos de Data
Mining.
El crecimiento explosivo de las bases de datos, de
Internet y el empleo de técnicas y herramientas (que en forma automática y
eficiente, generan información a partir de los datos almacenados), permiten
descubrir patrones, relaciones y formular modelos. En particular, estas
técnicas han adquirido enorme importancia en áreas tales como estrategias de
marketing, soporte de decisiones, planeamiento financiero, análisis de datos
científicos, bioinformática, análisis de textos y de datos de la web.
Data Mining incluye áreas del conocimiento tales
como Estadística, Inteligencia Artificial y Bases de Datos. Se estima que
del análisis de esos datos pueden surgir ventajas competitivas o novedosas
soluciones a antiguos problemas. Data Mining y es un área de gran
actividad a nivel académico, como lo demuestran el gran número de eventos
científicos relacionados, como así también laborales.
Existen
al momento un sinnúmero de productos desarrollados por las grandes compañías
dedicadas al software y por nuevas compañías creadas al efecto. La causa
de esta actividad radica en la necesidad por parte de diversas organizaciones
de analizar sus datos por medios automáticos o semiautomáticos, para la
resolución de diversos problemas, tanto en el ámbito empresarial como
científico.
Dentro las ventajas y desventajas de este método podemos
mencionar las siguientes:
Ventajas
El
Data Mining descubre información que no se esperaba obtener.
Como muchos modelos diferentes son validados, algunos resultados inesperados tienden a aparecer. En muchos estudios, se ha descubierto que combinaciones particulares de factores entregan efectos inesperados que entregan valor a la compañía.(Pañales y cerveza)
Los Modelos Son Confiables
El modelo es probado y comprobado usando técnicas estadísticas antes de ser usado, luego las predicciones que se obtienen por el modelo son válidas y confiables.
Los modelos se construyen de manera rápida.
La minería de datos permite construir y generar modelos en sólo uno minutos u horas. El modelado se torna mucho más fácil puesto que muchos algoritmos son probados y sólo el mejor modelo es entregado al usuario.
Como muchos modelos diferentes son validados, algunos resultados inesperados tienden a aparecer. En muchos estudios, se ha descubierto que combinaciones particulares de factores entregan efectos inesperados que entregan valor a la compañía.(Pañales y cerveza)
Los Modelos Son Confiables
El modelo es probado y comprobado usando técnicas estadísticas antes de ser usado, luego las predicciones que se obtienen por el modelo son válidas y confiables.
Los modelos se construyen de manera rápida.
La minería de datos permite construir y generar modelos en sólo uno minutos u horas. El modelado se torna mucho más fácil puesto que muchos algoritmos son probados y sólo el mejor modelo es entregado al usuario.
Dificultad de recopilación de los datos
Dependiendo del tipo de datos que se quieran recopilar puede conllevar mucho trabajo o la necesidad de tecnología de elevado coste.
El pre procesamiento de datos puede llevar demasiado tiempo
No está asegurada la obtención de un modelo válido