Descargar presentacion

Transcripción

Descargar presentacion
Modelo de Integración
g
de
Conocimiento descubierto
mediante Técnicas de
Minería de Datos
Ingrid Wilford Rivera
[email protected]
© 2010,
VII Jornadas para el Desarrollo
De Grandes Aplicaciones de Red
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
i t d
introducción
ió
Técnicas
de MD
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de
MD
(Patrones)
Patrones)
La mayoría de las investigaciones en MD se centran
en el análisis de una única bases de datos
Técnicas de MD Tradicionales
Pueden ser insuficientes para grandes
organizaciones con múltiples fuentes de datos
?
Modelo de
MD
(Patrones)
Patrones)
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
i t d
introducción
ió
Técnicas de MDD
Postmining
Técnicas de MD
T di i
Tradicionales
l o Paralelas
P
l l
LIMITACIONES
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
i t d
introducción
ió
MD
MD
MD
Modeloi
Modeloi
Modeloi
Postmining
Modelo
Proceso de recopilación, análisis y síntesis de
modelos de MD o patrones descubiertos a
partir de múltiples fuentes de datos
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
i t d
introducción
ió
Model1
File1
Modeli
Filei
Modeln
Filen
Μ = {µ1 , µ2 , … µn }
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
µi = {ρ1 , ρ2 , … ρm }
ρj = ‹idj, mej›
Φ = {φ1 , φ2 , … φn}
Integrated DM
Model (MI)
(MI))
n
MI = ∏ ( μ , ϕ ) μ ∈ Μ ∧ ϕ ∈ Φ
i
i =1 i i i
Obtener un modelo de MD global, a partir de n
modelos descubiertos en n fuentes de datos a las
que no se tiene acceso
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
estado
t d d
dell arte
t
Mannila, G., Zhang, Y. Paul S., Saravanan V.,
(2008)
et al (2005)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Integrar
Modelos de
de Reglas
Clusters,
,
Integrar
gg Modelos
g
de
mediante
representación
Asociación
obenidos dede
datos como
vectores
conjuntos
de datos
XML,
etiquetados
basándose
en las
Mformulaciones
Muy
sensibles
ibl a matemáticas
la
l cantidad
tid d de
d
definidas
en
[Zhang
et.
al,
datos analizados, no son
2004]
escalables
en este sentido
Estas formulaciones son
apropiadas para descubrir
patrones excepcionales, pero
no para identificar patrones
globales frecuentes en todos
los data sets
Hall, Hore et al Zhang, S., Zhang, C., Wu, X. (2009)
(2004, 2003)
Síntesis Modelos
de modelos
reglas
Integrar
de de
Clusters,
de obtenidos
asociación con
obtenidos
de
técnicas
múltiples bases
de datos locales
particionales
Insensibles
a la cantidad
Bases de datos
locales dede
datos
analizados
analizados,
tamaño
similaren este
sentido son escalables
Mínimo
soporte datos
igual para
Solodeanalizan
todosnuméricos
los modelos
Mínimo de confianza igual para
todos los modelos
Carecen de generalidad: son soluciones
específicas para un tipo de modelo de MD
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
propuesta:
t MIC
Modelo de Integración de Conocimiento
MIC
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
M d l Conceptual
Modelo
C
l
MC MIC
MC_MIC
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
MC MIC
MC_MIC
• Considerando las necesidades de
expresividad del modelo que se
propone, resulta adecuado tomar como
base la metodología y herramientas
formales utilizadas en el modelado de
procesos.
• Vista
de
los
procesos
(P)
f d
fundamentales
t l
que conforman
f
ell
modelo general propuesto (MIC).
• Cada
proceso
se
formaliza
gráficamente, mediante la notación de
[E ik
[Eriksson
and
d Penker,
P k 2000].
2000]
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
MC MIC
MC_MIC
• El MC_MIC está constituido p
por
tres procesos: Codificación (PC ),
Síntesis ((PS ), Representación
p
(P
( R)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
codificación
difi
ió
Codificación
Fichas
¨Completas¨
de Modelos como conjuntos de Patrones:
Cada patrón
formaliza
mediante
• Tamaño
de lasevista
de datos
o data la
settupla:
origen (cantidad de
instancias).
ρi j =atributo
idi j , me
• Descripción de cada
deli j data set origen (etiqueta y
d
i i )
• dominio).
Identificador
y medidas de calidad:
• Umbral de precisión y de cobertura mínima utilizado para la
aceptación
id = de
V los patrones
me =en el
prmodelo.
, co
ij
ij
ij
ij
ij
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
síntesis
í t i
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
síntesis
í t i
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
m
f ( Sl ) = ∑ wμ *d M ( MI l , μi )
i=1 i
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
síntesis
í t i
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
O mut (VSl , n mut ) y O agr (VSl , n agr )
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
síntesis
í t i
Asignar Medidas:
• Asociar a cada patrón global un patrón de cada modelo local.
•
A partir de las medidas de estos patrones locales, mediante
la aplicación de un operador (suma, media, máximo, mínimo)
estimar las medidas (soporte y precisión) del patrón global
correspondiente.
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
representación
t ió
Representación:
• Selección de los patrones que serán incluidos finalmente en
el modelo global integrado, considerando los valores de los
Parámetros especificados por el usuario.
• Representar
R
t ell conjunto
j t d
de patrones
t
globales
l b l seleccionados
l
i
d
en un formato estándar de intercambio de modelos de
minería de datos.
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
conclusiones
l i
• Se formaliza una p
propuesta
p
p
para la
integración de modelos locales o
conjuntos
j
de p
patrones de minería de
datos descubiertos en fuentes de
datos distribuidas ((Modelo de
Integración de Conocimiento - MIC).
• Especialmente útil cuando las
fuentes de datos distribuidas han
sido minadas localmente y no es
posible el acceso a los datos
originales.
originales
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
conclusiones
l i
• A diferencia de otros trabajos
j
publicados, es aplicable no sólo para
la integración
g
de modelos de
agrupamiento o de modelos de
reglas
g
de asociación,, sino que
q
admite la integración de modelos de
MD en g
general q
que se p
puedan
formalizar como conjuntos de
p
patrones.
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
conclusiones
l i
• Con la descripción
p
del Modelo
Conceptual se tiene una primera
vista del modelo p
propuesto,
p
, en la
que se detallan tres procesos
fundamentales: Codificación,,
Síntesis y Representación.
VII Jornadas para el
desarrollo de grandes
aplicaciones
p
de red
(JDARE’10)
Modelo de Integración de Conocimiento descubierto
mediante Técnicas de Minería de Datos
conclusiones
l i
• Aplicación
p
y trabajo
j actual
– Proyecto de Minería de Datos y
Metaheurística (GRIAL)
Introducción
Estado del Arte
Propuesta: MIC
Modelo Conceptual
Codificación
Síntesis
Representación
Conclusiones
• Biblioteca que implementa diferentes
algoritmos metaheurísticos, permitiendo
combinar características de varios
varios.
• Prototipo Funcional
– Integración de Reglas de Asociación.
– Integración de Clusters.
• Descubrimiento de predicados difusos en
bases de datos
datos.
• Método de Integración de Árboles de
Decisión, mediante generación de datos
fi ti i
ficticios
Modelo de Integración
g
de
Conocimiento descubierto
mediante Técnicas de
Minería de Datos
Ingrid Wilford Rivera
[email protected]
© 2010,
VII Jornadas para el Desarrollo
De Grandes Aplicaciones de Red

Documentos relacionados