jueves, 9 de octubre de 2008

Data Mining

Fundamentos del Data mining

Las técnicas de Data mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data mining está listo para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:
1)Recolección masiva de datos
2)Potentes computadoras con multiprocesadores
3)Algoritmos de Data mining

Data mining, la extracción de información oculta y predecible de grandes bases de datos, es una poderosa tecnología nueva con gran potencial que ayuda a las compañías a concentrarse en la información más importante de sus Bases de Información (Data Warehouse).
Un Sistema Data mining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresa.
¿Qué son capaces de hacer las herramientas del Data mining?

Las herramientas de Data mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y conducidas por un conocimiento acabado de la información (knowledge-driven).
Las herramientas de Data mining pueden responder a preguntas de negocios que tradicionalmente consumen demasiado tiempo para poder ser resueltas y a los cuales los usuarios de esta información casi no están dispuestos a aceptar. Estas herramientas exploran las bases de datos en busca de patrones ocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de sus expectativas.
Pueden analizar bases de datos masivas para brindar respuesta a preguntas tales como, "¿Cuáles clientes tienen más probabilidad de responder al próximo mailing promocional, y por qué? y presentar los resultados en formas de tablas, con gráficos, reportes, texto, hipertexto, etc.

Data mining sirve para:
· Comunicarnos con nuestra Base de Clientes y Prospectos de manera Directa y Masiva ( Cumpleaños, Lanzamientos, Cobros )
· Contribuir en la Conservación de Clientes existentes
· Vender otros Productos (Cross Selling) a nuestra Base de Clientes y elevar el P.P.C.
· Capturar nuevos Clientes con Tele o Web-Marketing
Data mining en el CRM

En el entorno “CRM” se puede evaluar y desarrollar un conjunto de reglas de negocio sobre todos los aspectos de las interacciones de los clientes. Un ejemplo sencillo sería modelar la probabilidad de respuesta ante una solicitud específica de un nuevo producto o servicio. Basándose en estas reglas las campañas de marketing de una empresa pueden tener como objetivo la máxima respuesta para generar un nivel deseado de respuesta, ingresos o beneficios. Otras aplicaciones incluirían:
Crear modelos de clientes potenciales (para objetivos de marketing y otras iniciáticas CRM).
Analizar la pérdida de clientes (para atención al cliente y reclamaciones).
Monitorizar los riesgos de pérdida (para scoring de clientes y aprobación de créditos).
Investigación del fraude (para reducir pérdidas a través de la investigación del fraude).

Implementación y Elementos de Business Intelligence

Elementos de Business Intelligence

Los sistemas actuales de Business Intelligence están construidos en una moderna infraestructura, que consisten de una arquitectura federada (también conocida como modular) que acomoda todos los componentes en un moderno sistema de inteligencia del negocio (Hackney, 2000). Estos sistemas incluyen:Data Warehousing y Data Marts, sistemas de almacén de datos. Aplicaciones analíticas. Data Mining, herramientas para minería de datos. OLAP, herramientas de procesamiento analítico de datos. Herramientas de consulta y reporte de datos. Herramientas de producción de reportes personalizados. ELT, herramientas de extracción, traducción y carga de datos. Herramientas de administración de sistemas. Portales de información empresarial. Sistemas de base de datos. Sistemas de administración del conocimiento.
Implementación Real de BI

Twentieth Century Fox usa Business Intelligence para filtrar millones de recipientes de zonas postales y predecir que actores, argumentos y filmes serán populares en cada vecindario. Evitando ciertos argumentos en cines específicos, la compañía tiene ahorros de aproximadamente $100 Millones de dólares alrededor del mundo cada año. La misma tecnología puede seleccionar "traliers" (cortos previos a la presentación de una película) alternativos por cada película en cada cine para ayudar así a maximizar las ventas. Una película puede tener diferentes "trailers", cada cual puede percibirse de diferente forma por diversos tipos de audiencias.

Manuela Báez Téllez

martes, 7 de octubre de 2008

business intelligence

Encontre este archivo donde nos define que es el business intelligence, ademas de como elegir un sistema de este tipo, y las problematicas que pueden tener estos programas.

1. ¿Qué es el Business Intelligence?
Para poder conseguir este objetivo, primero es preciso conocer que es el Business Intelligence o Inteligencia de Negocio:
Desafortunadamente, este término no tiene nada que ver con el índice de inteligencia medio de las personas que trabajan en un determinado negocio. De hecho, la inteligencia de negocio (BI) tiene que ver con los datos y aplicaciones de un negocio para entenderse mejor.
Semejante a la inteligencia militar, que procura entender al enemigo, la inteligencia de negocio versa sobre todo alrededor de si mismo.
Específicamente, los sistemas de la inteligencia de negocio se basan en crear modelos informáticos de negocio de modo que pueda funcionar más eficientemente.El almacenamiento de los datos está en la base de los procesos de la inteligencia de negocio. En el mundo de ETL, la inteligencia de negocio se refiere generalmente al espacio entero de los sistemas de la base de datos, del software, del análisis, y de la evaluación del usuario que pretende entender y evaluar un negocio.Hay generalmente unos o más usos analíticos del software (por ejemplo, Business Objects, Cognos, o Microstrategy ).Los sistemas del BI se diferencian de sistemas operacionales en que están optimizados para preguntar y divulgar sobre datos.
Esto significa típicamente que, en un Datawarehouse, los datos están desnormalizados para apoyar preguntas de alto rendimiento, mientras que los sistemas operacionales generalmente se normalizan completamente para apoyar integridad de referencia y para insertar datos continuamente.
Los procesos de ETL que cargan sistemas del BI tienen que traducir del sistema operacional normalizado a desnormalizado.
Y, típicamente, tienen fallos severos de funcionamiento debido a que no deben degradar el funcionamiento de los sistemas operacionales, y no deben prohibir el acceso al almacén.Por eso surge el Business Intelligence, basado en nuevas estructuras de análisis, básicamente multidimensional, en contraste con el relacional.

2. ¿Cómo elegir una aplicación Business Intelligence?
Lo primero que puedo decir es que tenemos que identificar cuales son las necesidades y el tipo de herramienta que se busca: análisis, reporting, base de datos, OLAP, etc...De momento, os voy a dejar con unas pinceladas, según mi criterio, de los principales factores (sin orden de importancia) a tener en cuenta cuando elegimos una herramienta Business Intelligence:
1) La Plataforma: No es lo mismo estar atados a Microsoft, o poder trabajar en Unix, o tener una estrategia Open Source Linux. Lo mismo aplica al hardware. Algunos fabricantes son restrictivos.
2) El Curriculum del vendedor: Es muy útil conocer el tipo de implementaciones que se han hecho, si se han realizado en tiempo, si se utilizan, la satisfacción de usuarios, etc...
3) El tamaño del cubo: Es imprescindible hacer un análisis previo de la amplitud de la información a almacenar. Algunas aplicaciones pueden 'explotar' llegado cierto nivel.
4) La velocidad de consulta: Los usuarios siempre quieren velocidad en sus consultas. Y si 20 segundos de espera es mucho, quizás haya que buscar otra herramienta.
5) Servicios de soporte y ayuda a nivel mundial: Tenemos que tener la seguridad de que si algo falla en la aplicación ( y fallará, esto es seguro) podamos resolverla en el menor tiempo posible.
6) Evaluaciones de analistas: Gartner, IDC saben de que hablan... y suelen ser objetivos. No está de más fijarse en sus 'cuadrantes'.
7) El ecosistema del vendedor (consultores, partners, acuerdos, comunidad de desarrolladores…).
8) Base instalada de usuarios. Si hay de mi sector mucho mejor. Si puedo hablar con ellos y ver la herramienta en vivo, todavía mejor.
9) Graphical User Interface (GUI). Hay que recordar que hablamos de una herramienta para usuarios finales y si a éstos no les gusta, no la utilizarán y será dinero tirado.
10) El precio: No tiene por qué ser lo más importante..... pero... es importante!!!
11) Integración con otras herramientas: Ninguna herramienta funciona como una isla aislada del resto. Lo mismo que una empresa, si creas islas, crearás incomunicación.

3. ¿Por qué fallan muchos proyectos Business Intelligence?

A veces nos sorprende que con el desarrollo al que han llegado muchas herramientas, el uso de metodologías contrastadas y el mayor nivel de conocimiento de técnicos y usuarios, se produzcan tantos desastres en la implementación de soluciones Business Intelligence, en términos de exceso de coste sobre el previsto, no utilización por parte de los usuarios, no cumplir con las expectativas, información errónea, etc...En base a mi experiencia os voy a comentar cuales son algunos de los principales fallos:
1) Muchos Data Warehouse crecen en tamaño de forma desproporcionada porque los técnicos no consiguen decir 'no' a las 'excesivas' demandas de los usuarios.
2) Se prefiere realizar el proyecto con gente de la propia empresa, cuando éstos no tienen ni tiempo, ni conocimientos para poder abarcarlo.
3) Se fijan unas fechas de entrada en producción del sistema poco realistas, que provoca nuevas fechas y más retrasos.
4) El presupuesto destinado para el proyecto es escaso en comparación con el grado de complejidad que se quiere desarrollar.
5) La selección del software y hardware a veces se realiza siguiendo criterios de acuerdos generales o compromisos, antes que puramente técnicos.
6) Antes del proyecto, no se realizan benchmarks o 'pruebas de concepto' para determinar la viabilidad.
7) Los datos de origen no están limpios. Duplicidades, errores, carácteres erróneos.. implican un proceso ETL más costoso, mayor tamáño de la Base de datos y peor rendimiento.
8) El sponsor del proyecto no ejerce como tal durante el mismo. No 'baja a la tierra'.
9) Mala elección de los consultores y excesiva rotación entre ellos.
10) Escasa involucración de los usuarios finales que les lleva a sentir cierta frustracción con los resultados obtenidos.
11) Caer en el error de 'en informática todo se puede hacer' y empezar con customizaciones, escribir código fuera de las funcionalidades standard.
12) No alinear el proyecto dentro de una estrategia de negocio.
Existen muchos más factores que pueden hacer fallar un proyecto Business Intelligence, pero éstos pueden hacer literalmente 'tumbarlo', no conseguir más proyectos para los consultores, mala imagen del producto y riesgos internos para el director de informática y otros sponsors.