Advanced Data Analytics
Transcripción
Advanced Data Analytics
Advanced Data Analytics Rod Fontecilla, Ph.D. Vice President App Services | Global Lead Advanced Analytics Unisys Corporation August 2016 ¿De dónde viene la data? y, ¿cuáles son los retos? Mucha data para procesar Falta de herramientas de analytics El staff entrenado para analizar y correlacionar la data no es suficiente Infraestructura insuficiente para integrar data estructurada y no estructurada Panorama del Big Data… ¡nuestros clientes están desbordados! Backward-looking (Forensic) Modeling and Forecasting Scale-out Regression Pattern Recognition Classification Neural Networks Simulation Machine Learning Business Intelligence & Data Warehousing SQL ETL STAR Schema RDBMS OLAP Advanced Data Analytics Extend Complexity Forward-looking (Predictive) La Data ha cambiado el antiguo paradigma de BI Big Data & NoSQL Hadoop Google BigTable SAS & R Map/Reduce Dynamo Hive Splunk MongoDB Cassandra EMC HBase Greenplum Leverage for large-scale analytics and data mining Leverage for largescale application development & information management Multi-TB Turning Point Low Volume, Variety, Velocity Data Volume High Volume, Variety, Velocity Metodología para obtener valor de toda esta data El valor de Advanced Analytics • Nuevos canales de revenue • Mejor Servicio con Ahorro en Costos • Mayor eficiencia Productos Data Analytic • Detección de Fraude • Volume Forecasting • Sentiment Analysis • Ticket Optimization • Customer 360º Data Sets Internas / Externas • Recommender Engine • Predictive Maintenance Ejemplos de Insights de negocio obtenidos por Advanced Analytics • Identificación de Fraude • Mejor entendimiento del cliente / ciudadano Detectar transacciones fraudulentas, avisar comportamientos sospechosos… Recomendar contenido, predecir la carga de contenido, mejorar la experiencia de usuario… • Marketing dirigido Relacionar clientes a ofertas, escoger campañas de mercadeo, cross-selling y upselling… • Clasificación de contenido Categorizar documentos, relacionar gerentes de reclutamiento con currículos… • Churn prediction Encontrar clientes que estén próximos a dejar de usar sus servicios, mejorar el targeting,… El Machine Learning utiliza la Data para llevar su negocio al siguiente nivel • El Machine learning es un tipo de Inteligencia Artificial (AI) que provee computadores con la habilidad de aprender sin estar explícitamente programados Data Machine Learning Modelo predictivo Ejemplo: Característica de un individuo Modelo predictivo Puntaje predictivo Competencias de los Data Scientists y su trabajo • • • • • • • Definir la pregunta de negocio Definir el data set ideal Determinar a qué data se puede acceder Obtener y limpiar la data Data analysis exploratorio Modelo/Predicción estadístico Interpretar resultados, retar a los resultados • Redactar / sintetizar los resultados • Crear un código reproducible • Distribuir resultados a otros AI – ¿Debemos preocuparnos? Estén atentos a la inteligencia artificial en las próximas décadas, antes de que sea demasiado tarde - Bill Gates Me inclino por pensar que debería existir una vigilancia regulatoria… a nivel nacional e internacional… solo para estar seguro de que no hagamos algo estúpido - Elon Musk El desarrollo de la inteligencia artificial total podría significar el fin de la raza humana - Stephen Hawking Identificar ciberamenazas antes de que ocurran Predecir individuos y familias que actualmente reciben servicios y que están en alto riesgo de perder su hogar Report Year 2013 to 2014 Distinct count of .. 2014 to 2015 25 2 8 1 El heat map muestra alta concentración de personas sin hogar en ciertos códigos postales. 107 1 39,413 1 123 2 104 4 1 32 117 4 2 37 1 9 2 447 1 1 56 1 Códigos postales con altas concentraciones pueden variar año a año. 1 3 2 503 9 12 3 18 6 3 23 7 4 1 1,554 9 12 3 582 7 7 6 8 34 2 1 3 9 3 5 2 11 6 21 4 10 7 3 1 5 1 1 14 1,235 1 2 4 2 1 1 1 2 1 1 3 3 2 6 1 3 3 1 782 5 1 5 10 8 6 5 3 2 1 1 8 6 10 7 4 2 17 16 5,062 7,124 1 2 5 1 1 4 4 9 2,195 8 1,396 1 4 3 6 34 94 15,288 3 1 6 3,035 9,403 10 15 5 1,265 1 2 10 10 61 10 1,657 10 14 4 5 5 10 129 1 2 1 1 18 10 876 27 536 7 9 19,777 123 3 19 2 1 53 48 7 16 3,665 90 28 7 203 1,086 11 2 85 31,570 116 25 28 19 5 32 17 13 124 64 16 4 41 24 17 62 114 17 17 18 38 3 118 417 108 132 3 18 5 101 1 3 23 14 1 1,808 12 660 1 1 5 4 62 23 6 3 9 6 9 1 2 2 9 16 1,385 2 1 2 1 1 1 1 2 2 2 2 3 874 1 1 8 1 3 9 18 1 1 9 2 1 2 1 10 3 2 15 12 4 4 18 17 306 25 7,479 2 4 7 7 11 4 1,607 2,579 5 4 9 38 61 20 17 1 6 2 16 3 7 3,489 63 10,283 12 18 8 1,247 3 3 17 11 2,082 8 8 18 11 19 8 177 6 2 11 1 25 17 1,084 706 9 11 24,822 107 8 21 29 8 2 69 52 9 4,055 103 34 9 247 1,300 13 77 3 70 39,413 122 16 124 8 42 19 25 116 80 15 3 53 27 28 99 140 20 20 23 39 3 152 438 156 203 9 27 148 12 Map based on Longitude (generated) and Latitude (generated) broken down by Report Year. Color shows distinct count of Cs Hh Indv Cin. The marks are labeled by distinct count of Cs Hh Indv Cin. Details are shown for District, Cs Adr Zip5 and LA County City. The data is filtered on LA County Zip, Cs Sts Cd and Homeless. The LA County Zip filter keeps LA County. The Cs Sts Cd filter keeps AC. The Homeless filter keeps Y. Red de Twitter de la American Epilepsy Society (AES) Industries Data Products Esta es su principal red de Twitter. La combinación de colores muestra diferentes clusters. ITSM Analytics Library Industries Data Products Volume Forecast Sentiment Analysis Resolver Optimization ITSM Data Product Library Sentiment Analysis Legacy Data Exploration Ticket Reduction & Correlation Text Mining Equipment/Parts Failure Ticket Correlation Volume Forecasting ¡Gracias!