Advanced Data Analytics

Transcripción

Advanced Data Analytics
Advanced Data
Analytics
Rod Fontecilla, Ph.D.
Vice President App Services | Global Lead Advanced Analytics
Unisys Corporation
August 2016
¿De dónde viene la data?
y, ¿cuáles son los retos?
Mucha data para
procesar
Falta de herramientas de
analytics
El staff entrenado para
analizar y correlacionar
la data no es suficiente
Infraestructura
insuficiente para integrar
data estructurada y no
estructurada
Panorama del Big Data…
¡nuestros clientes están desbordados!
Backward-looking
(Forensic)
Modeling and
Forecasting Scale-out
Regression
Pattern
Recognition
Classification
Neural Networks
Simulation
Machine Learning
Business
Intelligence & Data
Warehousing
SQL
ETL
STAR
Schema
RDBMS
OLAP
Advanced
Data
Analytics
Extend
Complexity
Forward-looking
(Predictive)
La Data ha cambiado el
antiguo paradigma de BI
Big Data & NoSQL
Hadoop Google BigTable
SAS & R
Map/Reduce
Dynamo
Hive
Splunk
MongoDB
Cassandra
EMC
HBase
Greenplum
Leverage for
large-scale
analytics and data
mining
Leverage for largescale application
development &
information
management
Multi-TB Turning Point
Low
Volume, Variety, Velocity
Data Volume
High
Volume, Variety, Velocity
Metodología para obtener valor
de toda esta data
El valor de Advanced Analytics
• Nuevos canales de revenue
• Mejor Servicio con Ahorro en Costos
• Mayor eficiencia
Productos Data Analytic
• Detección de Fraude
• Volume Forecasting
• Sentiment Analysis
• Ticket Optimization
• Customer 360º
Data Sets Internas /
Externas
• Recommender Engine
• Predictive Maintenance
Ejemplos de Insights de negocio
obtenidos por Advanced Analytics
• Identificación de Fraude
• Mejor entendimiento del cliente
/ ciudadano
Detectar transacciones fraudulentas, avisar
comportamientos sospechosos…
Recomendar contenido, predecir la carga de
contenido, mejorar la experiencia de usuario…
• Marketing dirigido
Relacionar clientes a ofertas, escoger
campañas de mercadeo, cross-selling y upselling…
• Clasificación de contenido
Categorizar documentos, relacionar gerentes
de reclutamiento con currículos…
• Churn prediction
Encontrar clientes que estén próximos a dejar
de usar sus servicios, mejorar el targeting,…
El Machine Learning utiliza la Data para
llevar su negocio al siguiente nivel
• El Machine learning es un tipo de Inteligencia Artificial (AI) que provee
computadores con la habilidad de aprender sin estar explícitamente
programados
Data
Machine Learning
Modelo predictivo
Ejemplo:
Característica de
un individuo
Modelo predictivo
Puntaje predictivo
Competencias de los Data Scientists
y su trabajo
•
•
•
•
•
•
•
Definir la pregunta de negocio
Definir el data set ideal
Determinar a qué data se puede acceder
Obtener y limpiar la data
Data analysis exploratorio
Modelo/Predicción estadístico
Interpretar resultados, retar a los
resultados
• Redactar / sintetizar los resultados
• Crear un código reproducible
• Distribuir resultados a otros
AI – ¿Debemos preocuparnos?
Estén atentos a la inteligencia
artificial en las próximas
décadas, antes de que sea
demasiado tarde - Bill Gates
Me inclino por pensar
que debería existir una
vigilancia regulatoria… a
nivel nacional e
internacional… solo para
estar seguro de que no
hagamos algo estúpido
- Elon Musk
El desarrollo de la inteligencia artificial
total podría significar el fin de la raza
humana - Stephen Hawking
Identificar ciberamenazas antes de
que ocurran
Predecir individuos y familias que
actualmente reciben servicios y que
están en alto riesgo de perder su hogar
Report Year
2013 to 2014
Distinct count of ..
2014 to 2015
25
2
8
1
El heat map muestra alta concentración de
personas sin hogar en ciertos códigos postales.
107
1
39,413
1
123
2
104
4
1
32
117
4
2
37
1
9
2
447
1
1
56
1
Códigos postales con altas concentraciones
pueden variar año a año.
1
3
2
503
9
12 3
18
6 3 23
7 4
1
1,554
9
12 3
582
7 7
6 8
34
2
1
3
9
3
5
2
11
6 21
4
10 7
3
1 5 1 1
14 1,235
1
2
4
2 1
1
1
2
1 1 3
3
2
6
1
3
3
1
782
5
1
5 10 8
6
5
3
2
1
1
8
6
10 7
4
2
17
16 5,062
7,124
1
2
5
1 1 4 4 9 2,195 8
1,396 1
4
3
6 34
94 15,288
3
1
6
3,035
9,403 10
15 5
1,265
1
2 10
10
61
10
1,657
10 14
4
5
5
10 129
1
2
1
1
18 10
876 27 536
7
9
19,777 123
3 19
2 1
53
48
7
16
3,665 90
28
7 203
1,086
11
2
85
31,570 116
25
28
19
5
32 17
13 124 64
16
4
41
24
17
62 114
17
17 18
38
3
118 417 108
132
3
18
5 101
1
3
23
14
1
1,808
12
660
1 1
5
4 62 23
6
3
9
6 9
1
2
2 9
16 1,385
2
1
2
1
1
1 1 2
2
2 2 3
874
1
1 8
1
3 9 18 1
1
9
2
1
2
1
10
3 2
15 12
4
4
18
17 306 25
7,479
2 4 7
7
11
4
1,607
2,579
5
4
9 38
61 20 17 1
6
2
16
3 7 3,489 63 10,283 12
18 8
1,247
3
3
17
11
2,082
8
8
18 11 19 8 177
6
2
11
1
25 17
1,084
706
9
11
24,822 107
8 21
29
8 2
69
52
9
4,055 103 34
9 247
1,300
13
77
3
70
39,413 122
16
124
8
42 19
25 116 80
15
3
53
27 28
99 140
20
20 23
39
3
152 438 156
203
9
27
148
12
Map based on Longitude (generated) and Latitude (generated) broken down by Report Year. Color shows distinct count of Cs Hh Indv Cin. The
marks are labeled by distinct count of Cs Hh Indv Cin. Details are shown for District, Cs Adr Zip5 and LA County City. The data is filtered on LA
County Zip, Cs Sts Cd and Homeless. The LA County Zip filter keeps LA County. The Cs Sts Cd filter keeps AC. The Homeless filter keeps Y.
Red de Twitter de la American Epilepsy
Society (AES)
Industries Data Products
Esta es su principal red de Twitter. La combinación de colores muestra diferentes clusters.
ITSM Analytics Library
Industries Data Products
Volume Forecast
Sentiment Analysis
Resolver Optimization
ITSM Data Product
Library
Sentiment Analysis
Legacy Data
Exploration
Ticket Reduction &
Correlation
Text Mining
Equipment/Parts
Failure
Ticket Correlation
Volume Forecasting
¡Gracias!

Documentos relacionados