Sistemas de recomendación basados en modelo y en grafos

Transcripción

Sistemas de recomendación basados en modelo y en grafos
Sistemas de recomendación basados en modelo y en grafos
Sistemas de recomendación basados en modelo y
en grafos
Estudio Independiente Tutelado I
Saúl Vargas Sandoval
3 de febrero de 2011
Sistemas de recomendación basados en modelo y en grafos
Introducción
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Introducción
Los sistemas de recomendación se pueden clasificar según dos
propiedades básicas:
I Qué tipo de información se usa:
I
I
I
I
el contenido del ı́tem (recomendación basada en contenido),
las preferencias de una comunidad de usuarios (filtrado colaborativo)
o una combinación de ambas (recomendación hı́brida).
Cómo se usa la información:
I
I
si esta se usa directamente (basada en memoria o heurı́stica)
o se genera un modelo (estadı́stico, jerárquico, sobre red neuronal)
sobre el que se crean las recomendaciones.
Sistemas de recomendación basados en modelo y en grafos
Introducción
Definición (Métodos heurı́sticos o basados en memoria)
Son sistemas de recomendación que hacen predicción de puntuaciones a
partir de la colección entera de los ı́tems puntuados por los usuarios.
r (u, i) = aggru0 ∈U r (u 0 , i)
0
r (u, i) = aggri 0 ∈I r (u, i )
(basado en usuario)
(basado en ı́tem)
Sistemas de recomendación basados en modelo y en grafos
Introducción
Definición (Métodos basados en modelo)
Son sistemas de recomendación que generan, a partir de las puntuaciones
conocidas, un modelo (probabilı́stico, vectorial, etc.) que es el que se
usará para hacer predicciones.
r (u, i) = E [r (u, i)] =
n
X
i=0
v · P(r (u, i) = v |r (u, i 0 ), i 0 ∈ Iu )
Sistemas de recomendación basados en modelo y en grafos
Introducción
Definición (Métodos basados en grafos)
Son sistemas que extraen estructuras de grafos a partir de los datos
conocidos y que aplicarán diversos algoritmos de grafos para generar
predicciones. Veremos tres tipos de grafos:
I
Grafo bipartito de ı́tems y usuarios.
I
Grafo de ı́tems.
I
Grafo con información social y de etiquetado.
Sistemas de recomendación basados en modelo y en grafos
Introducción
Problemas tı́picos de los métodos heurı́sticos o basados en memoria:
I
tener un acierto sub-óptimo,
I
no “aprender” de los datos de los usuarios,
I
no escalar bien, en general, en cuanto a uso de memoria y tiempo de
proceso,
I
y no tener capacidad de moldearse o adaptarse a problemas
especı́ficos.
La familia de algoritmos basados en modelo intentará, por tanto, afrontar
los problemas anteriores al comprimir los datos en un modelo compacto
que permita calcular predicciones.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Hofmann [5] introduce el probabilistic Latent Semantic Analysis (pLSA).
I
En el caso más sencillo se busca calcular las probabilidades P(y |u).
I
Se define una función de pérdida para cuantificar el acierto de una
predicción:
L((u, y ), θ) = − log P(y |u; θ)
I
La función de riesgo empı́rica medirá el error global:
R emp (θ) =
1 X
L((u, y ), θ)
N
hu,y i
I
El objetivo del modelo θ será por tanto minimizar el riesgo R. Esto
se hará con Expectation Maximization.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de semántica latente: pLSA
I
Se introduce un conjunto Z de estados que intentarán modelizar un
“causas ocultas”.
θ = ({P(z|u)} , {P(y |z)})
X
P(y |u; θ) =
P(y |z)P(z|u)
z
1 X
log P(y |z) + log P(z|u)
R c (θ) = −
N
hu,y ,zi
I
La distribución de probabilidad variacional Q(z; u, y ) modelará el
conocimiento sobre las variables latentes dados los parámetros
actuales. Define una nueva función de riesgo que es una cota
superior de la anterior:
R̃(θ, Q) = −
1 XX
Q(z; u, y ) [log P(y |z) + log P(z|u)]
N
z
hu,y i
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de semántica latente: pLSA
I
Expectation: a partir de un modelo inicial θ̂, encontrar una
distribución Q ∗ óptima en cuanto que minimice la cota superior de
R(θ̂):
P̂(y |z)P̂(z|u)
Q ∗ (z; u, y ; θ̂) = P
0
0
z 0 P̂(y |z )P̂(z |u)
donde la notación P̂ indica probabilidades según el modelo θ̂.
I
Maximization: encontrar un nuevo modelo θ que minimice R̃(θ, Q ∗ ).
La solución será la siguiente:
P
∗
hu,y 0 iy 0 =y Q (z; u, y ; θ̂)
P(y |z) = P
∗
hu,y i Q (z; u, y ; θ̂)
P
hu 0 ,y iu 0 =u
P(z|u) = P P
z0
Q ∗ (z; u, y ; θ̂)
hu 0 ,y iu 0 =u
Q ∗ (z; u, y ; θ̂)
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Con uso de ratings se tienen cuatro posibilidades:
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de factorización de matrices
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de factorización de matrices
Koren et al. [8] utiliza un método de factorización matricial.
I
Se caracteriza al conjunto de usuarios e ı́tems a partir de un
conjunto de factores inferidos a partir de los patrones de preferencia.
I
El objetivo del modelo será encontrar para cada usuario un vector
pu ∈ Rk y qi ∈ Rk para cada ı́tem tales que expresen cuánto de cada
factor tienen cada uno.
I
La interacción entre usuario e ı́tem vendrá dada por el producto
escalar de sus vectores:
r̂ (u, i) = qit · pu
I
Lo que se busca es minimizar el error cuadrático medio sin
sobreajuste:
X
mı́n
(r (u, i) − qit · pu )2 + λ(kqi k2 + kpu k2 )
q,p
r (u,i)6=∅
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de factorización de matrices
Descenso por gradiente estocástico
Básicamente consiste de un bucle que itera sobre los datos de
entrenamiento proporcionados, sobre los que se calcula el error de
predicción asociado en un paso:
eui = r (u, i) − qit · pu
En base a este error se modificarán los parámetros en la dirección
opuesta al gradiente, resultando:
qi ← qi + γ(eui pu − λqi )
pu ← pu + γ(eui qi − λpu )
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Modelo de factorización de matrices
Mejoras:
I
Añadir sesgos por usuario, por ı́tem y global:
r̂ (u, i) = µ + bu + bi + qit · pu
mı́n
q,p,b
I
I
I
X
(r (u, i)−µ−bu −bi −qit ·pu )2 +λ(kqi k2 +kpu k2 +bu2 +bi2 )
r (u,i)6=∅
Fuentes de información adicionales.
Dinámicas temporales.
Niveles de confianza:
X
mı́n
cui (r (u, i)−µ−bu −bi −qit ·pu )2 +λ(kqi k2 +kpu k2 +bu2 +bi2 )
q,p,b
r (u,i)6=∅
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Procesos de decisión de Markov
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Procesos de decisión de Markov
Shani et al. [12] proponen un modelo de recomendación basado en
Procesos de Decisión de Markov (MDP).
I Predicción o decisión.
I
Beneficio para el usuario y para el sistema.
I
Beneficio a corto y largo plazo.
I
Naturaleza secuencial de la recomendación: importa el orden.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Procesos de decisión de Markov
Procesos de decisión de Markov (MDP)
I
S de estados posibles, acciones A disponibles para todos los estados.
I
Recompensa Rwd : S × A −→ R
I
Transición tr (s, a, s 0 )
I
Objetivo: obtener una polı́tica µ : S −→ A que maximice la
recompensa.
I
Algoritmo: iteración de polı́tica mediante la función de valor:
X
V µ (s) = Rwd(s, µ(s)) +
tr (s, µ(s), sj )V µ (sj )
sj ∈S
Observación: un MDP sin acciones es una cadena de Markov.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Procesos de decisión de Markov
Modelo predictivo
I
A partir de los datos de entrenamiento se construye un modelo de
cadenas de Markov sobre el que se aplicará el MDP.
I
Cada estado s ∈ S será una secuencia ordenada de valoraciones de
un usuario a los ı́tems.
I
La función de transición de un estado a otro se aproximará por
verosimilitud:
count(s)
trMC (s, s 0 ) =
count(s 0 )
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Procesos de decisión de Markov
Configuración del MDP
I
I
I
Acciones: se considerará una acción como la recomendación de uno
o más elementos.
Recompensa: expresará la utilidad de vender un ı́tem (o cualquier
otro fin esperado del sistema de recomendación). Por ejemplo, se
puede usar el beneficio neto de la transacción.
Transición: se definirá la transición como la probabilidad de que el
usuario haga una de las siguientes acciones:
I
El usuario acepta la recomendación.
trMDP (s, r , s · r ) = αs,r trMC (s, s · r )
I
El usuario selecciona otro elemento.
trMDP (s, r 0 , s · r ) = βs,r trMC (s, s · r )
I
αs,r > 1
r 6= r 0
βs,r < 1
El usuario no selecciona ningún elemento, es decir, no hace una
transición.
X
trMDP (s, r , s) = 1 −
trMDP (s, r , s · r )
r
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Otras propuestas
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Otras propuestas
Método de clustering
Ungar et al. [13] sugieren un método de recomendación basada en
clustering sobre valoración binaria (el ı́tem es útil o no).
Pk = probabilidad de que un usuario al azar esté en la clase k
Pl = probabilidad de que un ı́tem al azar esté en la clase l
Pkl = probabilidad de que un usuario en la clase k
haya valorado un ı́tem en la clase l.
La estimación de grupos se hará mediante K-means o Gibbs sampling.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en modelo
Otras propuestas
Método bayesiano
Chen et al. [3] asumen que los usuarios pueden ser divididos en grupos en
los cuales sus miembros comparten la distribución de probabilidad de
ratings.
Z
f (ykl |x) =
f (ykl |p, q)f (x|p, q)π(p)π(q)dpdq
p,q
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Tipos de grafos
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Tipos de grafos
I
Grafo de ı́tems:
I
I
Enlaces ponderados cuando tienen usuarios en común.
Mayor peso a mayor número de usuarios en común.
I
Red de blogs: enlaces correspondientes a hiperenlaces no ponderados
con información de preferencias de usuarios.
I
Grafo bipartito usuarios-ı́tems: Enlaces ponderados respecto a la
valoración de un usuario para un ı́tem, número de reproducciones
I
Grafo con información social y de etiquetado:


UU
UTr
UTg
0
TrTg 
S =  UTr t
t
t
UTg TrTg
0
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Probabilidad estacionaria en caminos aleatorios
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Probabilidad estacionaria en caminos aleatorios
Abbassi et al. [1] aplican a la red de blogs PageRank personalizado con
un componente de “vagancia”, cuya matriz de transición es:

1−α−l

 deg (i) + α r (j) (i, j) ∈ E
Aij = l + α r (j)
i =j


α r (j)
(i, j) ∈
/E
La personalización se basará en los blogs favoritos del usuario. Para evitar
sumideros, se adapta la probabilidad de teleportación y el peso de os
arcos.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Probabilidad estacionaria en caminos aleatorios
Otras propuestas que usan PageRank u otro camino aleatorio
personalizado son:
I Konstas et al. [7] con la información de red social y etiquetado,
personalizando en los ı́tems reproducidos por el usuario.
I Onuma et al. [10] calculan probabilidades estacionarias usando la
normalización laplaciana de la matriz del grafo à = D−1/2 AD−1/2 y
personalización respecto al nodo del usuario.
I Y. Zhang [15] usan caminos aleatorios absorbentes.
I L. Zhang et al. [16] proponen usar una variante de Topical
PageRank sobre el grafo de ı́tems:
R u = dαMR u + d(1 − α)MF u + (1 − d)I u

1
u


||G |
Ri,g (0) = |IP
|G |
u
u
Fi,g
(t) =
Ri,g
(t − 1) Pi,g
g
=1


R u (t) = dαMR u (t − 1) + d(1 − α)MF u (t) + (1 − d)I u
Iu =
Ĩ u
|Ĩ u |
TR
u
Ĩi,g
= r (u, i)Pi,g
=
|G |
X
Ru P
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Probabilidad estacionaria en caminos aleatorios
Mei et al. [9] presentan DivRank, un algoritmo que pretende captar
diversidad. Para ello hace un camino aleatorio con refuerzo de
transiciones.
(
(u,v )
si u 6= v
β wdeg
(u)
p0 (u, v ) =
1−β
si u = v ,
pT (u, v ) = αp ∗ (v ) + (1 − α)
DT (u) =
X
p0 (u, v )NT (v )
DT (v )
p0 (u, v )NT (v )
v ∈V
El efecto de NT (v ) es que los nodos adyacentes competirán entre sı́ por
una mayor puntuación, donde los nodos mayores tenderán a absorber la
puntuación de sus vecinos menores, y a su vez de los vecinos de éstos.
Finalmente, los nodos con mayor puntuación estarán, en general,
débilmente conectados y, con ello, se mejora la diversidad de los
resultados.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Similitudes sobre caminos aleatorios
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Similitudes sobre caminos aleatorios
Fouss et al. [4] no usan las probabilidades estacionarias de caminos
aleatorios, sino los tiempos de tránsito entre nodos de la red bipartita
para calcular similitudes entre usuario e ı́tem, entre usuarios y entre ı́tems.
Definición (Matriz laplaciana de un grafo)
La matriz laplaciana se un grafo se define como L = D − A donde D es
una matriz diagonal con los grados de los nodos del grafo y A es la
matriz de adyacencia del mismo. Es fácil ver que, si el grafo es conexo, L
tiene rango n − 1. Además es doblemente centrada, simétrica y
semidefinida positiva.
Definición (Pseudoinversa de Moore-Penrose)
La pseudoinversa de Moore-Penrose de L es una matriz L+ que cumple:
1. LL+ L = L
2. L+ LL+ = L+
3. (LL+ )t = LL+
4. (L+ L)t = L+ L
También es doblemente centrada, simétrica y semidefinida positiva.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Similitudes sobre caminos aleatorios
Definición (Tiempo medio de primer paso)
(
m(k|k) = 0
PN
m(k|i) = 1 + j=1 pij m(k|j) si i 6= k
Definición (Coste medio de primer paso)
(
o(k|k) = 0
PN
PN
o(k|i) = j=1 pij c(j|i) + j=1 pij o(k|j) si i 6= k
Definición (Tiempo medio de transición)
n(i, j) = m(j|i) + m(i|j)
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Similitudes sobre caminos aleatorios
m(k|i) =
n
X
+
(lij+ − lik+ − lkj+ + lkk
)deg (j)
j=1
o(k|i) =
n
X
+
(lij+ − lik+ − lkj+ + lkk
)bj
bi =
j=1
n(i, j) =VG (lii+ + ljj+ − 2lij+ ) VG =
n
X
aij c(j|i)
j=1
n
X
k=1
deg (k)
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Proyección espacial del grafo
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Proyección espacial del grafo
Distancia de tiempo de conmutación euclı́dea (ECTD).
n(i, j) = VG (lii+ + ljj+ − 2lij+ ) VG =
n
X
deg (k)
k=1
Se define ei = (0 . . . 0 1 0 . . . 0)t como el vector asociado al nodo i,
1
i−1 i i+1
n
por tanto:
n(i, j) = VG (ei − ej )t L+ (ei − ej )
p
n(i, j) define una distancia euclı́dea.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Proyección espacial del grafo
I
Mediante la descomposición de Jordan
matriz L+ = UΛUt se
√ de la
t
pueden hacer la transformación xi = ΛU ei de modo que:
n(i, j) = VG kxi − xj k2
I
Además, estos vectores están centrados y la matriz de sus productos
escalares es precisamente L+ , esto es, lij+ = xti xj , con lo que L+ se
puede considerar como una matriz de similitud.
I
Por otro lado, se puede aproximar L+ tomando los m < (n − 1)
primeros autovectores de su descomposición espectral:
L̃+ = ŨΛ̃Ũt
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Puenteamiento
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Puenteamiento
Onuma et al. [10] combinan puntuaciones de caminos aleatorios con
coeficientes de puenteamiento sobre la red bipartita usuarios-ı́tems para
encontrar sorpresa.
I Puntuación de “puenteamiento” (bridging score BRS), basada en
detectar elementos que unen grupos por otra parte disjuntos.
I Para cada nodo n, la subred de elementos adyacentes a este. Toma
entonces la media de puntuaciones de relevancia ~ri,j entre nodos i y
j de la subred, cuya inversa bn será la BRS.
bn =
I
1
avgi,j∈adj(n)~ri,j
Idea: un nodo que una grupos disjuntos producirá una subred con
menos enlaces entre elementos.
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Métodos espectrales
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Métodos espectrales
Abbassi et al. [1] emplean técnicas de clustering espectral junto con
caminos aleatorios sobre la red de blogs:
1. Sean 1 = λ1 ≥ λ2 ≥ . . . ≥ λn los autovalores de P, se computan los
autovectores v2 , v3 , . . . , vt correspondientes a λ2 , λ3 , . . . , λt .
2. Se determinan un conjunto de pesos c2 , . . . , ct para cada autovector.
3. Para cada blog u y autovector vi se define la diferencia
di (u) = |vi (w ) − vi (u)|.
4. Se ordenan
los nodos en un orden creciente según el valor
P
qu = 2≤i≤t ci di (u).
El vector q es el conjunto de distancias al nodo w .
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Técnicas de recuperación asociativa
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Sistemas basados en grafos
Técnicas de recuperación asociativa
Z. Huang et al. [6] se centran en el uso de técnicas de recuperación
asociativa para afrontar el problema de la dispersión de datos.
I
Uso de la red bipartita usuarios-ı́tems para explorar relaciones de
transitividad.
I
Longitud máxima de camino usuario-ı́tem M.
I
Penalización por longitud de camino α < 1.
(
αA
si M = 1
AM
α =
2
t
M−2
α (AA )Aα
si M = 3, 5, 7, . . .
I
Esta aproximación matricial es costosa, existen alternativas más
eficientes:
I
Constrained Spread Activation: Leaky Capacitor Model,
Branch-and-Bound y Hopfield Networks.
Sistemas de recomendación basados en modelo y en grafos
Conclusiones
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Conclusiones
I
De las cinco propuestas basadas en modelo, tres de ellas ([3],[5] y
[13]) tienen el concepto de crear grupos.
I
La mayorı́a de los modelos propuestos sobre grafos se basa en
caminos aleatorios en sus múltiples variantes, ya sea con
teleportación (personalizada o no), nodos absorbentes, refuerzo de
arcos o uso de tópicos.
I
La mayorı́a de ellos usa las probabilidades estacionarias de los
caminos aleatorios como estimadores de utilidad de los ı́tems para
los usuarios, Fouss et al. [4] usa tiempos de tránsito entre nodos del
grafo para estimar similitudes entre usuarios e ı́tems.
I
Otras técnicas sobre grafos son activación y búsqueda de
puenteamiento.
Sistemas de recomendación basados en modelo y en grafos
Referencias
Introducción
Sistemas basados en modelo
Modelo de semántica latente: pLSA
Modelo de factorización de matrices
Procesos de decisión de Markov
Otras propuestas
Sistemas basados en grafos
Tipos de grafos
Probabilidad estacionaria en caminos aleatorios
Similitudes sobre caminos aleatorios
Proyección espacial del grafo
Puenteamiento
Métodos espectrales
Técnicas de recuperación asociativa
Conclusiones
Referencias
Sistemas de recomendación basados en modelo y en grafos
Referencias
Z. Abbassi and V. S. Mirrokni, “A recommender system based on local
random walks and spectral methods,” in Proceedings of the 9th WebKDD
and 1st SNA-KDD 2007 workshop on Web mining and social network
analysis (WebKDD/SNA-KDD ’07). ACM, New York, NY, USA, 102-108.
(2007)
G. Adomavicius, A. Tuzhilin, “Toward the Next Generation of
Recommender Systems: A Survey of the State-of-the-Art and Possible
Extensions” on IEEE Trans. Knowl. Data Eng. 17(6): 734-749 (2005)
Y.-H. Chen and E. I. George, “A Bayesian Model for Collaborative
Filtering,” in Proceedings of the 7th International Workshop on Artificial
Intelligence and Statistics, 1999.
F. Fouss, A. Pirotte, J.-m. Renders, and M. Saerens, “Random-Walk
Computation of Similarities between Nodes of a Graph with Application to
Collaborative Recommendation,” IEEE Transactions on Knowledge and
Data Engineering, vol. 19, no. 3, pp. 355-369, March 2007.
T. Hofmann, “Latent Semantic Models for Collaborative Filtering” on
ACM Transactions on Information Systems, Vol. 22, No. 1. (January
2004), pp. 89-115.
Sistemas de recomendación basados en modelo y en grafos
Referencias
Z. Huang, H. Chen, and D. Zeng, “Applying associative retrieval
techniques to alleviate the sparsity problem in collaborative filtering,”
ACM Transactions on Information Systems (TOIS), vol. 22, no. 1, pp.
116-142, January 2004.
I. Konstas, V. Stathopoulos, and J. M. Jose, “On social networks and
collaborative recommendation,” in SIGIR ’09: Proceedings of the 32nd
international ACM SIGIR conference on Research and development in
information retrieval. New York, NY, USA: ACM, 2009, pp. 195-202.
Y. Koren, R. Bell, and C. Volinsky. 2009. Matrix Factorization Techniques
for Recommender Systems. Computer 42, 8 (August 2009), 30-37.
Q. Mei, J. Guo, and D. Radev, “DivRank: the interplay of prestige and
diversity in information networks,” in Proceedings of the 16th ACM
SIGKDD international conference on Knowledge discovery and data
mining, ser. KDD ’10. New York, NY, USA: ACM, 2010, pp. 1009-1018.
K. Onuma, H. Tong, and C. Faloutsos, “TANGENT: a novel, ‘Surprise
me’, recommendation algorithm,” in KDD ’09: Proceedings of the 15th
ACM SIGKDD international conference on Knowledge discovery and data
mining. New York, NY, USA: ACM, 2009, pp. 657-666.
Sistemas de recomendación basados en modelo y en grafos
Referencias
A. Pucci, M. Gori, and M. Maggini, “A random-walk based scoring
algorithm applied to recommender engines,” in WebKDD’06: Proceedings
of the 8th Knowledge discovery on the web international conference on
Advances in web mining and web usage analysis. Berlin, Heidelberg:
Springer-Verlag, 2007, pp. 127-146.
G. Shani, D. Heckerman, and R. I. Brafman, “An MDP-Based
Recommender System,” Journal of Machine Learning Research, vol. 6, pp.
1265-1295, 2005.
L. Ungar and D. Foster, “Clustering Methods For Collaborative Filtering,”
in Proceedings of the Workshop on Recommendation Systems. AAAI
Press, Menlo Park California, 1998.
H. Yildirim and M. S. Krishnamoorthy, “A random walk method for
alleviating the sparsity problem in collaborative filtering,” in RecSys ’08:
Proceedings of the 2008 ACM conference on Recommender systems. New
York, NY, USA: ACM, 2008, pp. 131-138.
Y. Zhang, J.-Q. Wu, and Y.-T. Zhuang, “Random walk models for top-N
recommendation task,” Journal of Zhejiang University - Science A, vol.
10, no. 7, pp. 927-936, July 2009.
Sistemas de recomendación basados en modelo y en grafos
Referencias
L. Zhang, K. Zhang, and C. Li, “A topical PageRank based algorithm for
recommender systems,” in SIGIR ’08: Proceedings of the 31st annual
international ACM SIGIR conference on Research and development in
information retrieval. New York, NY, USA: ACM, 2008, pp. 713-714.
X. Zhu, A. B. Goldberg, J. Van, and G. D. Andrzejewski, “Improving
diversity in ranking using absorbing random walks,” in Physics Laboratory
– University of Washington, 2007, pp. 97-104.

Documentos relacionados