Aplicaciones de minería de datos en la industria financiera

Transcripción

Aplicaciones de minería de datos en la industria financiera
Aplicaciones de minería de datos en
Modelos de Minería de Datos para la la industria financiera
Industria Financiera
Ing. María del Rosario Bruera
Noviembre 20, 2008
1
Agenda
Ideas centrales
•
•
•
•
•
•
•
Minería de Datos HOY
Data Governance
Predictive Analytics Modelos de scoring
Soluciones de información
Integración de plataformas analíticas
Espacio para preguntas 2
Equifax en el Mundo
Equifax, Inc.
United Kingdom
Spain
Portugual
– 12 Empresas de Información
• En la Argentina administra la
base de datos VERAZ
–
–
–
–
108 años de experiencia
Mas de 300 productos
Mas de 300.000 clientes
Enfoque en la satisfacción del
cliente y la privacidad de los
datos del consumidor
Canad
a
USA
Headquarters:
Atlanta,
Georgia
Central
America
Brazil
Peru
Argentina
Uruguay
Chile
Ecuador
Líder Mundial en Información, Modelos Estadísticos
y Tecnología de Automatización de Decisiones
3
Tendencias actuales
• El objetivo de la minería de datos (predictive analytics) ha cambiado – De: Reemplazar al estadístico – A: Mejores modelos, más ordenados, reutilizables y fáciles de utilizar
• Incorporación de stándares
– XML , PMML, etc
– Web services • Integración
– Entre aplicaciones – Entre bases de datos y aplicaciones
El foco está ahora en el VALOR AGREGADO DEL MODELO más que en la TASA DE ERROR DE PREDICCIÓN
4
Data Mining en el mundo real
More than Algorithms, Data Mining in the Real World, Kurt Threaling Por qué ???
5
La crisis de los datos
• La palabra CRISIS proviene del verbo griego krino que significa separar o decidir. Crisis es algo que se rompe y porque se rompe hay que analizarlo. De allí el término crítica que es el análisis de algo para emitir un juicio y criterio que se utiliza para indicar un razonamiento adecuado.
•Porqué estamos en crisis con los datos:
Preguntas de negocio tales como : ¿cuál es el valor de mis clientes? son respondidas a partir de los datos de la propia compañía (antes que con investigaciones de mercado)
Grandes volúmenes de datos están fácilmente accesibles
Poderosas herramientas de acceso a los datos y de modelización los disponibilizan a usuarios no técnicos y generan predicciones y pronósticos a partir de ellos
•Pero:
Los incidentes referidos a calidad de datos aumentan cada día
La organizaciones no son totalmente “information­literate”
6
Una definición de Calidad de Datos
• Los datos tienen CALIDAD cuando satisfacen los REQUERIMIENTOS de los •
•
CONSUMIDORES DE DATOS (DATA CONSUMERS)
Existe un problema de calidad de datos cuando se identifica cualquier dificultad que invalida el uso del dato por parte del consumidor
Un programa de aseguramiento de la calidad es una combinación EXPLICITA de procesos, metodologías y actividades que existen con el propósito de sostener altos niveles de calidad en los datos
7
El “Ecosistema” de los datos
KNOWLEDGE
KNOWLEDGE
WHAT
HOW
WHY
DATA COLLECTOR
DATA CUSTODIAN
DATA CONSUMER
ROLE 1
ROLE 2
ROLE 3
Lo que interesa es que el dato cumpla con los requerimientos (necesidades) de quien lo utiliza
Diferentes “consumidores” exigen diferentes niveles de calidad en los datos
DATA COLLECTION
DATA STORAGE AND MAINTENANCE
DATA UTILIZATION
PROCESS 1
PROCESS 2
PROCESS 3
COMPLETENESS
ACCESIBILITY
TEMPORALITY
RELEVANCE
FIDELITY
COMPLETENESS
No se espera contar con datos CERO DEFECTO
Beauty (Data Quality) is in the eye of the beholder
DATA QUALITY DIMENSIONS
8
From “computer-literate” to
“information-literate”
“Executives have become computer­literate. The younger ones, especially, know more about the way the computer works than they know about the mechanics of the automobile or the telephone. But not many executives are information­literate. They know how to get data. But most still have to learn how to use data.
– PETER F. DRUCKER: "Be Data Literate­Know What to Know" The Wall Street Journal 1 Dec 1992
La “crisis” nos obliga a analizar el comportamiento del “ecosistema” de los datos y a desarrollar nuevas competencias de análisis para la toma de decisiones certeras
9
Un antecedente : la crisis del
software
The major cause of the software crisis is] that the machines have become several orders of magnitude more powerful! To put it quite bluntly: as long as there were no machines, programming was no problem at all; when we had a few weak computers, programming became a mild problem, and now we have gigantic computers, programming has become an equally gigantic problem. Edsger Dijkstra, The Humble Programmer, 1972
Soluciones
10
Data Governance
• DATA GOVERNANCE: es el desarrollo e implementación de un •
conjunto de reglas, políticas y stándares para manejar los datos corporativos
Se implanta a partir de un equipo de management (formado por personas de Tecnología y de las áreas de negocio) unificados en una única misión que es asegurar que los datos corporativos:
–
–
–
–
Sean lo que deben ser (DATA QUALITY)
Estén en el contexto adecuado (DATA INTEGRITY)
Tengan su metadata correcta y accesible (DATA USABILITY)
Estén en un “ecosistema” gerenciado por una arquitectura sustentable (MDM)
11
Las 4 “Ps” de DATA GOVERNANCE
Data Governances Strategies. Helping your Organization to Comply, Transform & Integrate
By Phillip Russon, TWI Reports
12
Pilares de Data Governance
Data Governances Strategies. Helping your Organization to Comply, Transform & Integrate
By Phillip Russon, TWI Reports
13
La base Veraz: Información Publica y
Privada
• Fuente :
• Pública
•
- Boletines Oficiales de todo el país.
- Juzgados Civ. y Com. de las principales plazas del país.
- Administración Federal de Ingresos Públicos.
- Banco Central de la República Argentina.
Privada
- Nuestros Clientes aportando:
Clearing de deudores. (Abierta –Cerrada)
Credit Bureau.
Telco Exchange. (Cerrada)
-Titular del dato
Call Center
14
Información de Fuente Pública
VOLUMEN DE INFORMACION
• 5K Registros Mensuales
- Boletines oficiales.
• 13K Registros Mensuales
- Juzg. Civ. y Com. principales plazas de todo el país.
• 750K Registros Mensuales
-Administración Federal de Ingresos Públicos.
• 3MM Registros Mensuales (Altas y Actualizaciones)
- Banco Central de la República Argentina
15
Información de Fuente Privada
• 60 K Registros mensuales
- Clearing de Deudores (Base Abierta)
Mora Financiera
Mora No Financiera
Mora No comercial
• 2.0 MM Registros mensuales
- Clearing de Deudores (Base Cerrada)
• 1MM Nuevos registros mensuales
– Veraz Credit Bureau
• 3.6MM Registros semanales
– Telco Exchange
La base Veraz (producción) tiene un tamaño de 4.2 terabytes 16
Predictive Analytics
Predictive Analytics. Extending the value of your Data Warehousing Investment, Wayne Eckerson, TWDI Reports
17
Un buen modelo analítico es …
Escalable
Combinable con otro
Flexible Durable
Fácil de interpretar y utilizar
Standard (reproducible)
Evolutivo
18
Los modelos de Scoring
19
Modelos de Scoring
Son el “caballito de batalla” de las plataformas analíticas de la industria financiera
El Score es un número que permite ordenar las cuentas de acuerdo al nivel de riesgo de las mismas
999
Score
800
Buenas
600
400
200
Muy Malas
Muy Buenas !
Malas
1
20
Credit Scoring – Fuentes de Datos
El modelo evalúa todas las variables que permiten inferir el comportamiento futuro de una persona en forma combinada
Bureau:
Observaciones: Cantidad, tipo, y Cantidad, tipo, y antigüedad de los antigüedad
productos
Bureau:
Historia de pagos
SCORE
Consultas:
Bcra:
Cantidad, tipo, y Historia de antigüedad
Datos pagos
Demográficos
21
Credit Scoring – Características
• Ecuación derivada estadísticamente mediante un modelo •
•
•
•
•
•
de regresión logística binaria
Hipótesis: se puede predecir el comportamiento futuro a partir del perfil crediticio histórico
No existe garantía de cuál será el comportamiento de un consumidor individual
Los métodos analíticos permiten predecir el comportamiento futuro de un segmento de consumidores
Los modelos son eficaces cuando hay volumen significativo de clientes
La escala de calificación va de 1 a 999
Mientras más alta la calificación, mayor la probabilidad de un buen prospecto 22
Segmentación
• Score Equifax consta de múltiples Tarjetas de Calificación (Scorecards) que han sido alineadas para obtener el modelo final • El esquema de segmentación utilizado para crear las Tarjetas de Calificación se basó en el estado de mora y fuentes de datos; y asimismo, fue derivado analíticamente de la base de datos Veraz
23
Definición de GOOD / BAD
Las cuentas de pago dudoso (cuentas malas) están definidas como cuentas que han estado sobrevencidas:
• Más de 90 días en el BCRA (clasificación de 3 o mayor)
• Sobrevencidas más de 90 días en el Veraz Credit Bureau (clasificación de 4 o mayor)
• Tienen un ítem negativo informado en la base de Observaciones de Veraz, durante el período de comportamiento de 12 meses
24
Ciclo de desarrollo
Período de Observación 01/06/01 01/01/02 •
observación 01/06/06 01/01/07 5 años •
Punto de Período de comportamiento 01/06/06 01/01/07 01/06/07 01/01/08 12 meses Analizar a los consumidores durante los períodos
De observación, para ordenarlos en base a su comportamiento respecto de las características claves
De comportamiento, para identificar “buenos” y “malos”
25
Capacidad de discriminación
El test “KS” permite medir cuan “bueno” es un
modelo. Calcula la diferencia entre las distribuciones
acumuladas
100%
80%
40%
20%
Buenas
93.4%­47.2%
ó
n acumulada
Poblaci
60%
KS= 47.2
Grafico KS
Malas
0%
0%
20%
0 = NO HAY SEPARACION
100 = SEPARACION PERFECTA
40%
60%
80%
100%
% Score
•
Para modelos de calificación crediticia genéricos
 entre 15 y 25 bueno
 entre 25 y 35 muy bueno
 mayor de 35 excelente
26
Definiciones Tabla de Performance
• La Tabla de Performance del Mercado se envía a los clientes con una periodicidad semestral.
• El objetivo de la Tabla de Performance es analizar la bondad de ajuste del modelo para separar entre cuentas buenas y malas.
• Para la validación, se obtiene el Score de las personas físicas al momento de la consulta por parte de la entidad y se evalúa a un año posterior si este cliente fue bueno o malo.
• La definición de malo es:
• Calificación 3 o más en BCRA (90 días de atraso).
• Calificación 4 o más en Veraz Bureau (90 días de atraso)
• Item Negativo en la Base de Observaciones de Veraz Bureau
• La división entre tablas HIT y THIN depende a la Población a la que pertenecía al momento del cálculo del Score.
27
Definiciones : Poblacion
• Población HIT:
Población con algún producto de crédito, sea este un préstamo, una tarjeta de crédito y/o una cuenta corriente en la Base de Veraz Bureau; algún producto informado en BCRA y/o alguna Observación en la Base de Veraz Bureau; en el lapso de los últimos 5 años.
• Población THIN:
Población que no cuenta con productos crediticios ni en la Base de Veraz Bureau ni en BCRA y no cuenta con Observaciones en la Base de Veraz Bureau; en el lapso de los últimos 5 años. Esta población solo cuenta con datos demográficos y/o consultas.
• Población ALL:
Población que contempla a los HIT y a los THIN.
28
Tabla de performance (Enero 2007) ALL
Segmento: ALL
Período: entre 01/01/2007 y 31/01/2007
Totales
Intervalo
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Score
Mínimo
951
901
851
801
751
701
651
601
551
501
451
401
351
301
251
201
151
101
51
1
Score
Máximo
999
950
900
850
800
750
700
650
600
550
500
450
400
350
300
250
200
150
100
50
% ˉ de
Total
2,4
13,9
23,8
33,0
40,8
51,1
59,8
69,6
76,9
80,1
86,7
90,0
91,4
92,6
93,3
94,1
95,2
96,1
97,9
100,0
% ­ de
Total
100,0
97,6
86,1
76,2
67,0
59,2
48,9
40,2
30,4
23,1
19,9
13,3
10,0
8,6
7,4
6,7
5,9
4,8
3,9
2,1
% ˉ de % ­ de % ˉ de % ­ de / de / ˉ de
Buenos Buenos Malos Malos Malos Malos
2,8
15,8
27,1
37,2
45,7
56,6
65,6
75,9
83,5
86,7
93,4
96,4
97,5
98,5
98,9
99,2
99,6
99,8
99,9
100,0
100,0
97,2
84,2
72,9
62,8
54,3
43,4
34,4
24,1
16,5
13,3
6,6
3,6
2,5
1,5
1,1
0,8
0,4
0,2
0,1
0,3
2,2
4,6
8,0
12,3
18,7
25,1
31,9
37,4
41,4
47,2
51,9
55,0
58,0
60,3
63,7
68,8
74,0
85,9
100,0
100,0
99,7
97,8
95,4
92,0
87,7
81,3
74,9
68,1
62,6
58,6
52,8
48,1
45,0
42,0
39,7
36,3
31,2
26,0
14,1
1,6
2,5
3,4
5,4
7,9
9,0
10,6
10,0
11,0
17,4
12,7
21,1
31,7
33,8
50,6
63,0
69,7
83,1
91,7
97,8
1,6
2,3
2,8
3,5
4,3
5,3
6,1
6,6
7,0
7,5
7,9
8,3
8,7
9,0
9,3
9,8
10,4
11,1
12,7
14,4
46,2
KS
2,5
13,6
22,5
29,2
33,4
37,9
40,5
44,1
46,1
45,3
46,2
44,5
42,5
40,5
38,5
35,5
30,8
25,7
14,1
0,0
29
Tabla de performance (Enero 2007) ALL
% de Malos en el Peor
10%
20%
30%
36.3
42.0
26.0
% de Morosidad (14.4% Total)
1 Bucket 2 Bucket 3 Bucket
91.7
83.1
97.8
30
Curva ROC (Enero 2007) ALL
Area Under the Curve
Asymptotic 95% Confidence Interval
Asymptotic Lower Upper Sig.
Bound
Bound
Area Std. Error 0,809
0,002
0,000
0,805
0,812
• AUC: probabilidad de que el score rankee un caso bueno aleatoriamente elegido más arriba que a un caso malo aleatoriamente elegido.
• Sensibilidad: Es la probabilidad de que a un individuo bueno la prueba le dé resultado positivo.
• Especificidad: Es la probabilidad de que a un individuo malo la prueba le dé resultado negativo.
31
Curva ROC (Enero 2007) ALL
ALL ­ Enero 2007
Coordinates of the Curve
Positive if Greater Than or Equal To (a)
0,0
1,5
2,5
3,5
4,5
5,5
6,5
461,5
462,5
463,5
464,5
465,5
466,5
467,5
468,5
469,5
470,5
976,0
978,0
980,5
983,0
985,5
988,0
990,5
993,0
Sensitivity
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9260
0,9240
0,9240
0,9230
0,9220
0,9220
0,9210
0,9200
0,9180
0,9140
0,0030
0,0010
0,0010
0,0010
0,0000
0,0000
0,0000
0,0000
Specificity Suma
0,0000
1,0000
0,0150
1,0150
0,0190
1,0190
0,0240
1,0240
0,0310
1,0310
0,0340
1,0340
0,0380
1,0380
0,5390
1,4650
0,5410
1,4650
0,5420
1,4660
0,5420
1,4650
0,5440
1,4660
0,5440
1,4660
0,5450
1,4660
0,5460
1,4660
0,5470
1,4650
0,5490
1,4630
1,0000
1,0030
1,0000
1,0010
1,0000
1,0010
1,0000
1,0010
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
32
ROC curves, "All", "Hits" and "Thins", Jan
2007
1.0
0.9
0.8
Sensitivity
0.7
0.6
ALL
HITS
THINS
0.5
0.4
0.3
0.2
0.1
0.0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
Specificity
Source: Equifax-Veraz
33
Punto de Corte
Cada entidad debe decidir el punto de corte deseado:
34
Calibración del Punto de Corte
•
•
•
•
Para obtener un nivel de aceptación dado
Para obtener una morosidad dada
Para alguna combinación intermedia
En función de la relación buenos a malos
• Punto de Corte Óptimo: Criterio según Curvas ROC: Max (Especificidad + Sensibilidad)
Criterio según KS: Max (KS)
• Población ALL: Según Curvas ROC: 465 (Sensitividad: 0,922; Especificidad: 0,5440)
Según KS: 451­500
35
Soluciones de Información
36
Ejemplos y casos
• Los “bloques” (productos):
–
–
–
–
–
–
Geomarketing
Environment Index
Consumer Index
Risc Score
RFM Telcos
Experto
• Las soluciones:
–
–
–
–
Estrategia de penetración de una compañía de Crédito al Consumo
Modelo de respuesta de una campaña de retail
Lifestyles
Automatización de la decisión de crédito
37
Geomarketing : El producto
 Objetivo
 Incorporar la dimensión geográfica a los modelos analíticos
 Información Utilizada
 Crediticia positiva y negativa
 Sociodemográfica  Provista por el cliente  Relevamientos públicos y privados  Resultados / Entregables
Indicadores, capas GIS, reglas de negocio
38
Geomarketing : La Solución  EL Cliente  Se trata de una compañía de crédito al consumo
 El problema  Definir en términos geográficos la estrategia de crecimiento 2009
 Información Utilizada
 Demográfico
 De comportamiento  Transaccionales in company
 Transaccionales en el mercado
 Análisis de la competencia 39
Geomarketing : La Solución Descriptores demográficos
Total Hogares
Tamaño Medio del Hogar
Cantidad de Hogares Target
Hogares Target: C3, D1, D2
1
40
Geomarketing : La Solución Comportamiento del riesgo
Media Score Cliente Media Score Competencia 41
Modelos de respuesta : el producto  Objetivo
 Definir las reglas de soporte para campañas de marketing  Información Utilizada
 Crediticia positiva y negativa
 Sociodemográfica  Relevamientos públicos y privados  Datos propios del cliente  Resultados Esperados  Modelo de respuesta (reglas de negocio para la extracción de prospectos)
42
Modelos de respuesta : La Solución El Cliente  Retailer (venta de electrodomésticos)
Objetivo del Estudio  Optimizar el diseño de las campañas de databasemarketing para promover el uso de préstamos personales de consumo
 Información Utilizada
 Provista por el cliente
 Información crediticia positiva y negativa 43
Modelos de respuesta : La Solución 28,4
58,1
En la campaña anterior el 9% de las ventas se hicieron con créditos personales
9,7
3,8
44
Modelos de respuesta : La Solución Arbol de respuesta
X Limite TC
Máx Limite TC
Score
45
Modelos de respuesta : La Solución REGLAS DE MAXIMIZACION DE RESPUESTA
 Límite máximo en TC hasta $1974
 Promedio de límites en TC inferior a $ 715
 Riesgo Score inferior a 600 puntos (pero superior al punto de corte del modelo de riesgo de 450 puntos)
46
Lifestyles : el Producto
 Descripción
 Estilo de vida es la síntesis del comportamiento de un consumidor que nace a partir de necesidades, percepciones, actitudes, intereses y opiniones individuales
Equifax Lifestyles es un conjunto de indicadores que caracterizan a un individuo de acuerdo a su contexto socio­demográfico , su consumo y su capacidad de pago
 Información Utilizada
 Crediticia positiva y negativa  Información social, económica y demográfica de fuente pública  Información geográfica de las áreas urbanas
47
Lifestyles : Componentes
EXPERIENCIA LIFESTYLES  Contexto: Caracteriza el perfil sociodemográfico del área geográfica en la cual habita el individuo. La importancia de esta dimensión reside en la influencia que tiene el contexto en la manera en que se construyen las diferentes percepciones y patrones de comportamiento  Consumo: Sintetiza la relación entre el mundo del crédito y los ingresos (supuestos) del individuo
 Riesgo: Describe al individuo de acuerdo al nivel de riesgo esperado en el pago de sus compromisos 48
Lifestyles : Componentes
EXPERIENCIA LIFESTYLES Environment index
Risk Score 90 segmentos Consumer index
49
Lifestyles : Componentes
EXPERIENCIA LIFESTYLES Environment index
Características de los hogares Características de la vivienda Comunicación Educación Salud
Trabajo Satisfacción de necesidades básicas Risk Score Rangos de score 50
Lifestyles : Componentes
Consumer index ­ Población HIT­
Predicción de ingresos
Indicadores de uso del crédito
Consumer index ­ Población THIN ­
Predicción de ingresos
Consultas realizadas en los últimos 24 meses
51
Lifestyles : Componentes
EXPERIENCIA LIFESTYLES El ‘mejor’ caso
ALTO
T
1
El ‘peor’ caso
BAJO
M
5
52
Lifestyles : Un ejemplo
Juan tiene 37 años, NSE Alto, 2 tarjetas de crédito, con un saldo total de $4.147 y un límite de $22.100. Su compromiso mensual es de $1.191. Usa el 20% de su límite de crédito. No tiene préstamos personales. Tiene un score de 921puntos. Vive en Palermo. Juan es TA1 (hit)
53
Lifestyles : Otro ejemplo
EXPERIENCIA LIFESTYLES Eduardo tiene 28 años, es de Parque Patricios. En los últimos dos años sólo ha buscado crédito en una Telco. Su NSE es D1 y su score asciende a 711puntos. Eduardo es LMB2 (thin)
54
Automatización de decisiones: Veraz
Experto
• Herramienta automática para la evaluación de informes •
•
crediticios.
Los métodos tradicionales de evaluación de solicitudes de crédito tienen alto costo operativo y baja eficiencia. Son muy inflexibles ante la necesidad de introducir cambios. Generan decisiones inconsistentes (una sucursal rechaza la que otra aprueba). Aumentan la morosidad al aceptarse solicitudes que deberían ser rechazadas. Y muchas veces generan pérdidas de negocios al rechazarse solicitudes que deberían ser aceptadas.
Veraz Experto automatiza y objetiva el proceso de evaluación de solicitudes de crédito mediante una herramienta que utiliza tecnología de última generación y combina las ventajas de los métodos de reglas y scoring.
55
SOLUCIÓN EXPERTO
Variables de Entradas
Motor de Inferencia
Resultado
Reglas
56
SOLUCIÓN EXPERTO
VARIABLES DE ENTRADA
Variables Internas: Base Veraz
Variables Externas informadas por el cliente
VARIABLES INTERNAS BASE VERAZ
Cheques Rechazados • Juicios
• Concursos y Quiebras
• Morosidad
• Status Financiero Bureau
• Status Financiero BCRA
• Consultas
57
SOLUCIÓN EXPERTO
VARIABLES INTERNAS BASE VERAZ
Cheques Rechazados • Juicios
• Concursos y Quiebras
• Morosidad
• Status Financiero Bureau
• Status Financiero BCRA
• Consultas
58
SOLUCIÓN EXPERTO
FORMULAS, INDICADORES
Definidas por el Cliente
Propias con datos de Base Veraz
REGLAS
REGLAS = Variables + Fórmulas
59
SOLUCIÓN EXPERTO
SALIDA
Categoría de la Inferencia
Explicación de la categoría
• Variables definidas
60
SOLUCIÓN EXPERTO
EJEMPLO INTERFAZ WEB: ENTRADA
61
SOLUCIÓN EXPERTO
EJEMPLO INTERFAZ WEB: SALIDA
García, Juan
Martinez, Pedro
62
SOLUCIÓN EXPERTO
VENTAJAS CLAVES:
• Uniformidad de criterios
• Flexibilidad para la implementación de nuevas políticas de crédito o productos
• Reducción de los plazos de evaluación • Disminución de costos de análisis
63
SOLUCIÓN EXPERTO
INCONVENIENTES DEL METODO MANUAL:
• Criterios subjetivos
• Mas tiempo consumido
• Mayor morosidad
• Mas solicitudes rechazadas, oportunidades de
negocios que se pierden
• Mayores costos
• Baja eficiencia
64
Integración de Predictive Analytics
Los modelos analíticos se deben integrar ARMONICAMENTE con las políticas de gobernabilidad de los datos, el riesgo y las normativas legales (Governance Risk & Compliance) y con los requerimientos y restricciones de las áreas de producto, comerciales y tecnología.
Integrated Data Analytics: A Financial Business Case
Suvendu Samantaray
DM Direct, May 2, 2008 65
Integración de Predictive Analytics :
Desafíos
• Data integration: Amalgamation of quality data across the organization •
•
•
•
to produce excellent analytics for the mentioned processes. Standardization of data: Different business lines could have varied expectations on same process attributes. Bringing them all to a consensus would be important. Analytics model: In order to bring predictive analytics to certain processes, a robust and industry­accepted model should be in place, and the organization needs to invest resources to bring those to the fore­
front. Program management: For disciplined implementation of this program, it is expected that a global program management system be in place, and that it should be active from initiation of engagement until the infrastructure is in a steady state. This is extremely challenging, and equal representation from business and technology in the program management office is required to make this a success. Executive sponsorship: For the overall success of this program, executive and board­level sponsorship will boost the importance and priority of execution. Integrated Data Analytics: A Financial Business Case
Suvendu Samantaray
DM Direct, May 2, 2008 66
ESPACIO PARA PREGUNTAS
67

Documentos relacionados