gramática categorial combinatoria

Transcripción

gramática categorial combinatoria
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
HACIA UNA GRAMÁTICA CATEGORIAL COMBINATORIA
DE LOS CLÍTICOS DEL ESPAÑOL RIOPLATENSE*
Víctor M. Castel
InCiHuSA (CONICET) y FFyL (UNCuyo)
[email protected]
1 Introducción
En Castel (1994),1 basados en Zeevat et at. (1987),2 formulamos una gramática categorial de
unificación del español que da cuenta de (relaciones entre) propiedades morfológicas, sintácticas y
semánticas de los clíticos del español rioplatense. Por un lado, describimos formalmente la
generalización de Perlmutter (1971)3 sobre el orden de los clíticos entre sí y en relación con la
forma verbal que los rige; en particular, postulamos que la restricción de superficie Se II I III se
sigue de concebir los clíticos como functores con capacidad para consumir valencias verbales de
acuerdo con determinadas condiciones de concatenación. Por otro lado, mostramos cómo esta
conceptualización permite formalizar también las generalizaciones nucleares de García (1975)4
sobre correlaciones entre roles semánticos y propiedades morfológicas de los clíticos. Sin embargo,
al no estar implementada computacionalmente, la gramática categorial de Castel (1994) es de difícil
evaluación por su elevada complejidad. En este trabajo, proponemos remediar esta limitación en el
marco de la Gramática Categorial Combinatoria (GCC) de Steedman (2000),5 más específicamente
La sección §3.1 de este trabajo se basa en Víctor M. Castel, “An OpenCCG Implementation of Perlmutter’s
Generalization on Spanish Clitics Word Order”. Por aparecer en Revista INFOSUR.
1
Víctor M. Castel, Paquets de clitiques de l’espagnol. Calcul de la corrélation entre rôle sémantiques et proprietés
morphologiques, et spécification dans une grammaire catégorielle d’unification. Tesis doctoral inédita, Université
Blaise Pascal, Clermont-Ferrand II, Francia, 1994. Disponible en formato electrónico en la siguiente página web:
http://www.cricyt.edu.ar/institutos/incihusa/ul/webhelp/Victor_M._Castel.htm.
2
Henk Zeevat, E. Klein y J. Calder, “Unification Categorial Grammar”. En Haddock et al. (eds.), Categorial Grammar,
Unification Grammar, and Parsing. Working Papers in Cognitive Science, Vol. 1. University of Edinburgh, Centre for
Cognitive Science, 1987.
3
David Perlmutter, Deep and Surface Structure Constraints in Syntax. New York, Holt, Rinehart and Winston, 1971.
4
Erica García, The Role of Theory in Linguistic Analysis: The Spanish Pronoun System. Amsterdam, North-Holland
Publishing Company, 1975.
5
Mark Steedman, The Syntactic Process. Cambridge, Mass., The MIT Press, 2000.
*
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
en la versión implementada de código abierto, a saber: OpenCCG (Bozºahin et al. 2007).6 Las
generalizaciones de Perlmutter (1971) y García (1975) pueden expresarse también en OpenCCG.
Puesto que OpenCCG es una versión de GCC implementada computacionalmente, la evaluación de
Castel (1994) es perfectamente viable. El trabajo entonces muestra cómo reformalizar Castel (1994)
en términos de OpenCCG para captar cuenta de los fenómenos captados por las generalizaciones
mencionadas.
2 Los datos
2.1 La generalización de Perlmutter (1971) sobre el orden de palabras
Los datos fundamentales sobre el orden de palabras relativo de los clíticos entre sí y en relación con
el verbo que los rige pueden resumirse de la siguiente manera.
A. Las secuencias de clíticos (1a-d) están bien formadas:
(1a) {se, te, os, me, nos, le(s), lo/a(s)}, donde le(s) y lo/a(s) abrevian le, les, lo, la, los y las.
(1b) {se te, se me, se le(s), se lo/a(s), te me, te le(s), te lo/a(s), me le(s), me lo/a(s), …}7
(1c) {se te me, se te le(s), se te lo/(s), se me le(s), se me lo/(s), te me le(s), te me lo/a(s), …}
(1d) {se te me le(s), se te me lo/a(s), …}
B. Cualquier otro ordenamiento de los clíticos entre sí que no sea el especificado en (1a-d)
constituye una secuencia mal formada. Así, por ejemplo, las secuencias de (2), entre muchas otras,
están mal formadas:
(2a) *{se se, te te, me me, lo/a(s) lo/a(s)}
(2b) *{se te, le(s) me, lo/a(s) te, le(s) lo/a(s)}
(2c) *{se me te, lo/a(s) me te, le(s) se te}
(2d) *{le(s) se te me, te se me lo/a(s)}
C. Las secuencias de clíticos (1a-d) aparecen adyacentes al verbo que las rige de acuerdo con la
Cem Bozºahin, G-J. Kruijff y M. White, Specifying Grammars for OpenCCG: A Rough Guide, 2007. Disponible en
http://groups.inf.ed.ac.uk/ccg/index.html.
7
Los puntos suspensivos en (1a-d) abrevian secuencias de clíticos que contienen os y nos. Observemos que te y me, por
un lado, y os y nos, por el otro, se excluyen mutuamente.
6
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
siguiente restricción: a la derecha de infinitivos, gerundios e imperativos, y a la izquierda de todas
las demás formas verbales:
(3) regalar + (1a-d). Cf. *(1a-d) + regalar
(4) regalando + (1a-d). Cf. *(1a-d) + regalando
(5) regalá + (1a-d). Cf. *(1a-d) + regalá
(6a) (1a-d) + regalo/regalás/regala/regalamos/regalan.
(6b) *regalo/regalás/regala/regalamos/regalan + (1a-d).
Perlmutter (1971) da cuenta de (1-6) mediante la restricción de estructura superficial (7):
(7) Se II I III,
donde los números romanos refieren a valores de persona especificados por los clíticos, esto es,
primera (I), segunda (II) y tercera persona (III). El clítico se aparece de manera explícita como tal
en (7). La secuencia monotónica creciente (7) capta exactamente la distribución observada en (1-6)
debido a que se aplica a las secuencias de clíticos independientemente de la ubicación de éstas en
relación con el verbo que las rige.
2.2 Generalizaciones sobre la asignación de roles semánticos
Asumimos aquí la formalización de Castel (1994) de las generalizaciones descriptivas de García
(1975) sobre la proyección de los roles semánticos Most, Less y Least en propiedades morfosintácticas de los clíticos del español rioplatense. Ahora formalizamos en términos de GCC la
asignación de los roles Less y Least en oraciones con uno y dos clíticos. Este trabajo no se ocupa de
la interpretación ética ni reflexiva de los clíticos. Tampoco del se impersonal. Para un abordaje
categorial de unificación de estos fenómenos, véase Castel (1994), y para uno categorial
combinatorio, Castel (En preparación).8
2.2.1 Secuencias de un solo clítico
{Lo[Least], Le[Less]} regalo/regalás/regala/regalamos/regalan.
Víctor M. Castel, “Spanish Clitics Revisited: An OpenCCG Account of Word Order and Semantic Role Assignments”.
Trabajo en preparación para el IV Encuentro de Gramática Generativa, Mendoza, Argentina, julio de 2007.
8
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
{Me[Least], Me[Less]}regalás/regala/?regalamos/regalan.
{Te[Least], Te[Less]}regalo/regala/regalamos/regalan.
*Se regalo/regalás/regalamos. Cf. Sei regalai/regalani.
2.2.2 Secuencias de dos clíticos
{Me[Less] lo[Least], Me[Least] le[Less]} regala/regalás/?regalamos/regalan.
{Te[Less] lo[Least], Te[Least] le[Less]} regalo/regala/regalamos/regalan.
{Te[Less] me[Least], Te[Least] me[Less]} regala/regalan.
Sei[Less] lo/(s)[Least] regalo/regalás/regalaj/regalamos/regalank. (Este es el se espúreo (= le(s).)
*{Se le(s), Se te, Se me} regalo/regalás/regalamos.9 Cf. {Sei le(s), Sei te, Sei me} regalai/regalani.
2.2.3 Secuencias de tres clíticos
Oraciones con secuencias de tres clíticos son interpretables si al menos uno de los clíticos tiene una
interpretación ética: (Véase Castel (En preparación) para una especificación categorial combinatoria
de este fenómeno.)
{Te me le(s), Te me lo/a(s)} regalo/regalás/regala/regalamos/regalan.
?{Se te me, Se te le(s), Se me le(s)} regalo/regalás/regalamos.
Cf. {Sei te me, Sei te le(s), Sei me le(s)} regalai/regalani. (Ejemplos de se impersonal y reflexivo.)
2.2.4 Secuencias de cuatro clíticos
Las oraciones siguientes, con secuencias de cuatro clíticos, son polisémicas, según se trate de la
interpretación reflexiva, ética o impersonal de algunos de los clíticos que las integran:
{Se te me le(s), Se te me lo/a(s)} regalo/regalás/regala/regalamos/regalan.
Véase Castel (1994, En preparación) para un tratamiento de estas interpretaciones.
3 Especificación de una gramática categorial combinatoria de los clíticos
Los datos presentados en §2 pueden ser descriptos formalmente mediante la GCC de Steedman
(2000), en particular, en el contexto de OpenCCG. OpenCCG es un conjunto de componentes y
9
Si bien estas secuencias de clíticos están de acuerdo con (7), en estas oraciones, hay que excluirlas. Véase Castel
(1994, En preparación) para un tratamiento de este problema.
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
herramientas de código abierto (open source) que posibilitan la especificación de gramáticas en
términos de XML, tanto para el análisis (parsing) como la generación de lenguas naturales
(Bozºahin et al. 2007).
Este trabajo concibe los clíticos del español rioplatense como signos functores de tipo (8) que
buscan hacia adelante signos argumentos de tipo (9) para devolver como resultado signos de tipo
(10a) o (10b):
(8)
sfs1$1/(sfs2$1|npfs3) : lf
(9)
sfs4|npfs5|npfs6 : lf
(10a) sfs1|npfs5 : lf
(10b) sfs1|npfs6 : lf
donde $1 es una variable que, en la parte activa de (8), (sfs2$1|npfs3), abarca uno o más np’s, aparte
del mencionado explícitamente (o ninguno), y, en la categoría resultante, sfs1$1, mantiene el valor
que dicha variable asuma en una combinación específica. La variable fsn abarca estructuras de
rasgos morfo-sintácticos y semánticos.
El signo functor (8), en su parte activa (sfs2$1|npfs3), requiere que a su derecha aparezca un signo
argumento que tenga una valencia np capaz de unificar con la estructura de rasgos fs3. Observemos
que los signos (10a-b), resultantes de la combinación de (8) con (9), tienen un np menos que el
signo argumento (9). Este consumo de valencia puede ocurrir como consecuencia de Aplicación
Funcional, en cuyo caso se obtiene (10a), o Composición Funcional, en cuyo caso se obtiene (10b),
según que el npfs3 exigido en (8) unifique, respectivamente, con npfs6 o npfs5 de (9).
La variable lf, por su parte, abarca la forma lógica asociada con la categoría que aparece a la
izquierda del operador :. La estructura de lf es @Xö, donde X es un referente del discurso y ö es
una proposición (véase Bozºahin et al. 2007). La relación entre la estructura de significado lf y la
categoría asociada se establece mediante una variable compartida al interior de lf y al interior de
una estructura de rasgos fs de dicha categoría. A continuación, ilustramos la mecánica combinatoria
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
de GCC con la cual dar cuenta de los datos de §2.
3.1 Restricciones de orden
Para analizar y generar oraciones con secuencias de clíticos bien formadas como las de (1), y, al
mismo tiempo, excluir oraciones con secuencias de clíticos mal formadas como las de (2), aquí se
propone descomponer la generalización de Perlmutter (7) en configuraciones de rasgos.
Los términos I, II, III y Se de (7) serán, respectivamente, los atributos 1stC, 2ndC, 3rdC y 4thC,
para los cuales será posible asignar los valores + o -. Así, por ejemplo, <1stC = +> y <4thC = ->
son rasgos posibles. Rasgos como estos pueden utilizarse para definir el conjunto de restricciones
previsto por (7) en la categoría asignada a los clíticos. Ahora, el signo activo de (8), (sfs2$1|npfs3),
especificará qué clíticos puede contener o no el signo argumento con el que busca concatenarse. Por
otro lado, el signo resultante, sfs1$1, incorporará la información de que tal o cual clítico ya fue
combinado con el verbo. Habrá así, en el léxico de GCC, categorías como las de (11-14):
(11)
lo :- s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, msc, sg, 3rd)
(12)
les :- s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npdat, pl, 3rd)
(13)
te :- s2ndC+$1/(s2ndC-, 4thC-$1|npnnm, sg, 2nd), donde nnm abrevia no-nominativo.
(14)
regala :- s|npdat|npacc
Con esta asignación categorial es posible obtener derivaciones como (15) y (16), pero no como
(17), lo cual constituye un resultado adecuado de acuerdo con los datos de §2.1. El símbolo > indica
que los signos que aparecen arriba de la línea horizontal se combinan mediante la regla de
Aplicación Funcional Hacia Delante para devolver como resultado el signo que aparece debajo de la
línea. El triple asterisco *** en la última línea de (17) indica la imposibilidad de aplicar la regla de
Aplicación Funcional.
(15)
lo
___________________________________
s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, msc, sg, 3rd)
regala
__________________
s|npdat|npacc
________________________________________________________________________________________>
s3rdC+|npdat
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
(16)
te
___________________________
s2ndC+$1/(s2ndC-, 4thC-$1|npnnm, sg, 2nd)
lo
_______________________________
s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, …)
regala
______________
s|npdat|npacc
___________________________________________________________________________>
s3rdC+|npdat
_______________________________________________________________________________________________________________________>
s2ndC+
(17)
les
____________________________
s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npdat, …)
lo
____________________________
s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, …)
regala
_____________
s|npdat|npacc
_________________________________________________________________________>
s3rdC+|npdat
_________________________________________________________***___________________________________________________________>
De manera general, especificaciones categoriales como las de (11-14) permiten, mutatis mutandis,
dar cuenta de las restricciones de orden explicitadas en (1) y (2) de §2.1, y captar en términos de
GCC la generalización de Perlmutter (7) sobre el orden de clíticos entre sí. Para la ocurrencia de
clíticos a la derecha de infinitivos, gerundios e imperativos, cf. (3-5), véase Castel (En preparación).
3.2 Asignación de roles semánticos
La GCC aquí propuesta asigna a una oración como Te me regala (cf. §2.2.2 arriba) los análisis (18)
y (19). Observemos que el carácter no marcado de los clíticos te y me,10 con respecto a la distinción
acusativo/dativo, los hace compatibles con las valencias npacc y npdat. Así, desde una misma
posición relativa al verbo finito que lo rige, un único signo me puede consumir una valencia npdat
(18) o una valencia npacc (19), según se aplique, respectivamente, la regla de Composición (>B) o
Aplicación (>) Funcional. La valencia restante, npacc en (18) y npdat en (19), es luego consumida en
la combinación con el clítico te mediante Aplicación Funcional. La mecánica de unificación de
variables compartidas asegura la saturación apropiada de argumentos para obtener las formas
lógicas lf5 y lf5’.
(18)
te
me
regala
________________________ _______________________ _____________________________
s$1/(s$1|npnnm,X_0:person,sg,2nd) : lf1 s$1/($1|npnnm,X_1:person,sg,1st) : lf2 sE_2:action|npdat,Y_2:person|npacc,Z_2:sem-obj : lf3
_______________________________________________________________________________>B
s|npacc,Z_2:sem-obj : lf4
_______________________________________________________________________________________________________________________>
s : lf5
Con restricciones de orden, la categoría de me luce de la siguiente manera: s1stC+$1/(s1stC-, 2ndC-, 4thC-$1|npnnm, sg, 1st).
10
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD.
(19)
te
me
regala
________________________ _______________________ _____________________________
s$1/(s$1|npnnm,X_0:person,sg,2nd) : lf1 s$1/($1|npnnm,X_1:person,sg,1st) : lf2 sE_2:action|npdat,Y_2:person|npacc,Z_2:sem-obj : lf3
__________________________________________________________________________________>
s|npdat,Y_2:person : lf4’
_______________________________________________________________________________________________________________________>
s : lf5’
lf1 = @X_0:person(te ^ <NUM>sg ^ <PER>2nd)
lf2 = @X_1:person(me ^ <NUM>sg ^ <PER>1st)
lf3 = (@E_2:action(regalar) ^ … ^ <Least>(Z_2:sem-obj) ^ <Less>(Y_2:person) ^ …)
lf4 = (@E_2:action(regalar) ^ … ^ <Least>(Z_2:sem-obj) ^ <Less>(X_1:person ^ me ^
<NUM>sg ^ <PER>1st) ^ …)
lf5 = (@E_2:action(regalar) ^ … ^ <Least>(X_0:person ^ te ^ <PER>2nd) ^ <NUM>sg) ^
<Less>(X_1:person ^ me ^ <NUM>sg ^ <PER>1st) ^ …)
lf4’ = (@E_2:action(regalar) ^ … <Least>(X_1:person ^ me ^ <NUM>sg ^
<PER>1st) ^ <Less>(Y_2:person) ^ …)
lf5’ = (@E_2:action(regalar) ^ … <Least>(X_1:person ^ me ^ <NUM>sg ^
<PER>1st) ^ <Less>(X_0:person ^ te ^ <NUM>sg ^ <PER>2nd) ^ …)
4 Conclusión
El trabajo ha mostrado cómo dar cuenta de (i) las restricciones de orden que rigen la combinatoria
de clíticos entre sí (§2.1), y (ii) la distribución de roles semánticos a la García (1975) en términos de
una GCC especificada en el entorno de OpenCCG (§2.2). Ambos fenómenos, independientes entre
sí, son captados al definir los clíticos en el léxico como functores que buscan verbos para saturarles
valencias determinadas, ya sea mediante Composición o Aplicación Funcional. Las restricciones de
orden se siguen al descomponer la generalización de Perlmutter (1971) en configuraciones de
rasgos exigibles por el clítico functor al signo argumento (§3.1). La asignación de roles semánticos
resulta del aporte de la semántica del clítico a la semántica del verbo vía la coindexación de la
variable de la valencia saturada por el clítico con la variable de la forma lógica del verbo asociada a
un rol semántico (§3.2). El carácter polisémico de clíticos como te y me se sigue de su estatuto no
marcado con respecto a la distinción acusativo/dativo, lo cual los hace potencialmente aptos para
desempeñar los roles Least o Less de acuerdo con la disponibilidad contextual de roles semánticos.

Documentos relacionados