gramática categorial combinatoria
Transcripción
gramática categorial combinatoria
En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. HACIA UNA GRAMÁTICA CATEGORIAL COMBINATORIA DE LOS CLÍTICOS DEL ESPAÑOL RIOPLATENSE* Víctor M. Castel InCiHuSA (CONICET) y FFyL (UNCuyo) [email protected] 1 Introducción En Castel (1994),1 basados en Zeevat et at. (1987),2 formulamos una gramática categorial de unificación del español que da cuenta de (relaciones entre) propiedades morfológicas, sintácticas y semánticas de los clíticos del español rioplatense. Por un lado, describimos formalmente la generalización de Perlmutter (1971)3 sobre el orden de los clíticos entre sí y en relación con la forma verbal que los rige; en particular, postulamos que la restricción de superficie Se II I III se sigue de concebir los clíticos como functores con capacidad para consumir valencias verbales de acuerdo con determinadas condiciones de concatenación. Por otro lado, mostramos cómo esta conceptualización permite formalizar también las generalizaciones nucleares de García (1975)4 sobre correlaciones entre roles semánticos y propiedades morfológicas de los clíticos. Sin embargo, al no estar implementada computacionalmente, la gramática categorial de Castel (1994) es de difícil evaluación por su elevada complejidad. En este trabajo, proponemos remediar esta limitación en el marco de la Gramática Categorial Combinatoria (GCC) de Steedman (2000),5 más específicamente La sección §3.1 de este trabajo se basa en Víctor M. Castel, “An OpenCCG Implementation of Perlmutter’s Generalization on Spanish Clitics Word Order”. Por aparecer en Revista INFOSUR. 1 Víctor M. Castel, Paquets de clitiques de l’espagnol. Calcul de la corrélation entre rôle sémantiques et proprietés morphologiques, et spécification dans une grammaire catégorielle d’unification. Tesis doctoral inédita, Université Blaise Pascal, Clermont-Ferrand II, Francia, 1994. Disponible en formato electrónico en la siguiente página web: http://www.cricyt.edu.ar/institutos/incihusa/ul/webhelp/Victor_M._Castel.htm. 2 Henk Zeevat, E. Klein y J. Calder, “Unification Categorial Grammar”. En Haddock et al. (eds.), Categorial Grammar, Unification Grammar, and Parsing. Working Papers in Cognitive Science, Vol. 1. University of Edinburgh, Centre for Cognitive Science, 1987. 3 David Perlmutter, Deep and Surface Structure Constraints in Syntax. New York, Holt, Rinehart and Winston, 1971. 4 Erica García, The Role of Theory in Linguistic Analysis: The Spanish Pronoun System. Amsterdam, North-Holland Publishing Company, 1975. 5 Mark Steedman, The Syntactic Process. Cambridge, Mass., The MIT Press, 2000. * En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. en la versión implementada de código abierto, a saber: OpenCCG (Bozºahin et al. 2007).6 Las generalizaciones de Perlmutter (1971) y García (1975) pueden expresarse también en OpenCCG. Puesto que OpenCCG es una versión de GCC implementada computacionalmente, la evaluación de Castel (1994) es perfectamente viable. El trabajo entonces muestra cómo reformalizar Castel (1994) en términos de OpenCCG para captar cuenta de los fenómenos captados por las generalizaciones mencionadas. 2 Los datos 2.1 La generalización de Perlmutter (1971) sobre el orden de palabras Los datos fundamentales sobre el orden de palabras relativo de los clíticos entre sí y en relación con el verbo que los rige pueden resumirse de la siguiente manera. A. Las secuencias de clíticos (1a-d) están bien formadas: (1a) {se, te, os, me, nos, le(s), lo/a(s)}, donde le(s) y lo/a(s) abrevian le, les, lo, la, los y las. (1b) {se te, se me, se le(s), se lo/a(s), te me, te le(s), te lo/a(s), me le(s), me lo/a(s), …}7 (1c) {se te me, se te le(s), se te lo/(s), se me le(s), se me lo/(s), te me le(s), te me lo/a(s), …} (1d) {se te me le(s), se te me lo/a(s), …} B. Cualquier otro ordenamiento de los clíticos entre sí que no sea el especificado en (1a-d) constituye una secuencia mal formada. Así, por ejemplo, las secuencias de (2), entre muchas otras, están mal formadas: (2a) *{se se, te te, me me, lo/a(s) lo/a(s)} (2b) *{se te, le(s) me, lo/a(s) te, le(s) lo/a(s)} (2c) *{se me te, lo/a(s) me te, le(s) se te} (2d) *{le(s) se te me, te se me lo/a(s)} C. Las secuencias de clíticos (1a-d) aparecen adyacentes al verbo que las rige de acuerdo con la Cem Bozºahin, G-J. Kruijff y M. White, Specifying Grammars for OpenCCG: A Rough Guide, 2007. Disponible en http://groups.inf.ed.ac.uk/ccg/index.html. 7 Los puntos suspensivos en (1a-d) abrevian secuencias de clíticos que contienen os y nos. Observemos que te y me, por un lado, y os y nos, por el otro, se excluyen mutuamente. 6 En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. siguiente restricción: a la derecha de infinitivos, gerundios e imperativos, y a la izquierda de todas las demás formas verbales: (3) regalar + (1a-d). Cf. *(1a-d) + regalar (4) regalando + (1a-d). Cf. *(1a-d) + regalando (5) regalá + (1a-d). Cf. *(1a-d) + regalá (6a) (1a-d) + regalo/regalás/regala/regalamos/regalan. (6b) *regalo/regalás/regala/regalamos/regalan + (1a-d). Perlmutter (1971) da cuenta de (1-6) mediante la restricción de estructura superficial (7): (7) Se II I III, donde los números romanos refieren a valores de persona especificados por los clíticos, esto es, primera (I), segunda (II) y tercera persona (III). El clítico se aparece de manera explícita como tal en (7). La secuencia monotónica creciente (7) capta exactamente la distribución observada en (1-6) debido a que se aplica a las secuencias de clíticos independientemente de la ubicación de éstas en relación con el verbo que las rige. 2.2 Generalizaciones sobre la asignación de roles semánticos Asumimos aquí la formalización de Castel (1994) de las generalizaciones descriptivas de García (1975) sobre la proyección de los roles semánticos Most, Less y Least en propiedades morfosintácticas de los clíticos del español rioplatense. Ahora formalizamos en términos de GCC la asignación de los roles Less y Least en oraciones con uno y dos clíticos. Este trabajo no se ocupa de la interpretación ética ni reflexiva de los clíticos. Tampoco del se impersonal. Para un abordaje categorial de unificación de estos fenómenos, véase Castel (1994), y para uno categorial combinatorio, Castel (En preparación).8 2.2.1 Secuencias de un solo clítico {Lo[Least], Le[Less]} regalo/regalás/regala/regalamos/regalan. Víctor M. Castel, “Spanish Clitics Revisited: An OpenCCG Account of Word Order and Semantic Role Assignments”. Trabajo en preparación para el IV Encuentro de Gramática Generativa, Mendoza, Argentina, julio de 2007. 8 En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. {Me[Least], Me[Less]}regalás/regala/?regalamos/regalan. {Te[Least], Te[Less]}regalo/regala/regalamos/regalan. *Se regalo/regalás/regalamos. Cf. Sei regalai/regalani. 2.2.2 Secuencias de dos clíticos {Me[Less] lo[Least], Me[Least] le[Less]} regala/regalás/?regalamos/regalan. {Te[Less] lo[Least], Te[Least] le[Less]} regalo/regala/regalamos/regalan. {Te[Less] me[Least], Te[Least] me[Less]} regala/regalan. Sei[Less] lo/(s)[Least] regalo/regalás/regalaj/regalamos/regalank. (Este es el se espúreo (= le(s).) *{Se le(s), Se te, Se me} regalo/regalás/regalamos.9 Cf. {Sei le(s), Sei te, Sei me} regalai/regalani. 2.2.3 Secuencias de tres clíticos Oraciones con secuencias de tres clíticos son interpretables si al menos uno de los clíticos tiene una interpretación ética: (Véase Castel (En preparación) para una especificación categorial combinatoria de este fenómeno.) {Te me le(s), Te me lo/a(s)} regalo/regalás/regala/regalamos/regalan. ?{Se te me, Se te le(s), Se me le(s)} regalo/regalás/regalamos. Cf. {Sei te me, Sei te le(s), Sei me le(s)} regalai/regalani. (Ejemplos de se impersonal y reflexivo.) 2.2.4 Secuencias de cuatro clíticos Las oraciones siguientes, con secuencias de cuatro clíticos, son polisémicas, según se trate de la interpretación reflexiva, ética o impersonal de algunos de los clíticos que las integran: {Se te me le(s), Se te me lo/a(s)} regalo/regalás/regala/regalamos/regalan. Véase Castel (1994, En preparación) para un tratamiento de estas interpretaciones. 3 Especificación de una gramática categorial combinatoria de los clíticos Los datos presentados en §2 pueden ser descriptos formalmente mediante la GCC de Steedman (2000), en particular, en el contexto de OpenCCG. OpenCCG es un conjunto de componentes y 9 Si bien estas secuencias de clíticos están de acuerdo con (7), en estas oraciones, hay que excluirlas. Véase Castel (1994, En preparación) para un tratamiento de este problema. En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. herramientas de código abierto (open source) que posibilitan la especificación de gramáticas en términos de XML, tanto para el análisis (parsing) como la generación de lenguas naturales (Bozºahin et al. 2007). Este trabajo concibe los clíticos del español rioplatense como signos functores de tipo (8) que buscan hacia adelante signos argumentos de tipo (9) para devolver como resultado signos de tipo (10a) o (10b): (8) sfs1$1/(sfs2$1|npfs3) : lf (9) sfs4|npfs5|npfs6 : lf (10a) sfs1|npfs5 : lf (10b) sfs1|npfs6 : lf donde $1 es una variable que, en la parte activa de (8), (sfs2$1|npfs3), abarca uno o más np’s, aparte del mencionado explícitamente (o ninguno), y, en la categoría resultante, sfs1$1, mantiene el valor que dicha variable asuma en una combinación específica. La variable fsn abarca estructuras de rasgos morfo-sintácticos y semánticos. El signo functor (8), en su parte activa (sfs2$1|npfs3), requiere que a su derecha aparezca un signo argumento que tenga una valencia np capaz de unificar con la estructura de rasgos fs3. Observemos que los signos (10a-b), resultantes de la combinación de (8) con (9), tienen un np menos que el signo argumento (9). Este consumo de valencia puede ocurrir como consecuencia de Aplicación Funcional, en cuyo caso se obtiene (10a), o Composición Funcional, en cuyo caso se obtiene (10b), según que el npfs3 exigido en (8) unifique, respectivamente, con npfs6 o npfs5 de (9). La variable lf, por su parte, abarca la forma lógica asociada con la categoría que aparece a la izquierda del operador :. La estructura de lf es @Xö, donde X es un referente del discurso y ö es una proposición (véase Bozºahin et al. 2007). La relación entre la estructura de significado lf y la categoría asociada se establece mediante una variable compartida al interior de lf y al interior de una estructura de rasgos fs de dicha categoría. A continuación, ilustramos la mecánica combinatoria En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. de GCC con la cual dar cuenta de los datos de §2. 3.1 Restricciones de orden Para analizar y generar oraciones con secuencias de clíticos bien formadas como las de (1), y, al mismo tiempo, excluir oraciones con secuencias de clíticos mal formadas como las de (2), aquí se propone descomponer la generalización de Perlmutter (7) en configuraciones de rasgos. Los términos I, II, III y Se de (7) serán, respectivamente, los atributos 1stC, 2ndC, 3rdC y 4thC, para los cuales será posible asignar los valores + o -. Así, por ejemplo, <1stC = +> y <4thC = -> son rasgos posibles. Rasgos como estos pueden utilizarse para definir el conjunto de restricciones previsto por (7) en la categoría asignada a los clíticos. Ahora, el signo activo de (8), (sfs2$1|npfs3), especificará qué clíticos puede contener o no el signo argumento con el que busca concatenarse. Por otro lado, el signo resultante, sfs1$1, incorporará la información de que tal o cual clítico ya fue combinado con el verbo. Habrá así, en el léxico de GCC, categorías como las de (11-14): (11) lo :- s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, msc, sg, 3rd) (12) les :- s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npdat, pl, 3rd) (13) te :- s2ndC+$1/(s2ndC-, 4thC-$1|npnnm, sg, 2nd), donde nnm abrevia no-nominativo. (14) regala :- s|npdat|npacc Con esta asignación categorial es posible obtener derivaciones como (15) y (16), pero no como (17), lo cual constituye un resultado adecuado de acuerdo con los datos de §2.1. El símbolo > indica que los signos que aparecen arriba de la línea horizontal se combinan mediante la regla de Aplicación Funcional Hacia Delante para devolver como resultado el signo que aparece debajo de la línea. El triple asterisco *** en la última línea de (17) indica la imposibilidad de aplicar la regla de Aplicación Funcional. (15) lo ___________________________________ s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, msc, sg, 3rd) regala __________________ s|npdat|npacc ________________________________________________________________________________________> s3rdC+|npdat En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. (16) te ___________________________ s2ndC+$1/(s2ndC-, 4thC-$1|npnnm, sg, 2nd) lo _______________________________ s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, …) regala ______________ s|npdat|npacc ___________________________________________________________________________> s3rdC+|npdat _______________________________________________________________________________________________________________________> s2ndC+ (17) les ____________________________ s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npdat, …) lo ____________________________ s3rdC+$1/(s1stC-, 2ndC-, 3rd-, 4thC-$1|npacc, …) regala _____________ s|npdat|npacc _________________________________________________________________________> s3rdC+|npdat _________________________________________________________***___________________________________________________________> De manera general, especificaciones categoriales como las de (11-14) permiten, mutatis mutandis, dar cuenta de las restricciones de orden explicitadas en (1) y (2) de §2.1, y captar en términos de GCC la generalización de Perlmutter (7) sobre el orden de clíticos entre sí. Para la ocurrencia de clíticos a la derecha de infinitivos, gerundios e imperativos, cf. (3-5), véase Castel (En preparación). 3.2 Asignación de roles semánticos La GCC aquí propuesta asigna a una oración como Te me regala (cf. §2.2.2 arriba) los análisis (18) y (19). Observemos que el carácter no marcado de los clíticos te y me,10 con respecto a la distinción acusativo/dativo, los hace compatibles con las valencias npacc y npdat. Así, desde una misma posición relativa al verbo finito que lo rige, un único signo me puede consumir una valencia npdat (18) o una valencia npacc (19), según se aplique, respectivamente, la regla de Composición (>B) o Aplicación (>) Funcional. La valencia restante, npacc en (18) y npdat en (19), es luego consumida en la combinación con el clítico te mediante Aplicación Funcional. La mecánica de unificación de variables compartidas asegura la saturación apropiada de argumentos para obtener las formas lógicas lf5 y lf5’. (18) te me regala ________________________ _______________________ _____________________________ s$1/(s$1|npnnm,X_0:person,sg,2nd) : lf1 s$1/($1|npnnm,X_1:person,sg,1st) : lf2 sE_2:action|npdat,Y_2:person|npacc,Z_2:sem-obj : lf3 _______________________________________________________________________________>B s|npacc,Z_2:sem-obj : lf4 _______________________________________________________________________________________________________________________> s : lf5 Con restricciones de orden, la categoría de me luce de la siguiente manera: s1stC+$1/(s1stC-, 2ndC-, 4thC-$1|npnnm, sg, 1st). 10 En Actas del VIII Congreso Argentino de Hispanistas, Mendoza, 2007. Soporte CD. (19) te me regala ________________________ _______________________ _____________________________ s$1/(s$1|npnnm,X_0:person,sg,2nd) : lf1 s$1/($1|npnnm,X_1:person,sg,1st) : lf2 sE_2:action|npdat,Y_2:person|npacc,Z_2:sem-obj : lf3 __________________________________________________________________________________> s|npdat,Y_2:person : lf4’ _______________________________________________________________________________________________________________________> s : lf5’ lf1 = @X_0:person(te ^ <NUM>sg ^ <PER>2nd) lf2 = @X_1:person(me ^ <NUM>sg ^ <PER>1st) lf3 = (@E_2:action(regalar) ^ … ^ <Least>(Z_2:sem-obj) ^ <Less>(Y_2:person) ^ …) lf4 = (@E_2:action(regalar) ^ … ^ <Least>(Z_2:sem-obj) ^ <Less>(X_1:person ^ me ^ <NUM>sg ^ <PER>1st) ^ …) lf5 = (@E_2:action(regalar) ^ … ^ <Least>(X_0:person ^ te ^ <PER>2nd) ^ <NUM>sg) ^ <Less>(X_1:person ^ me ^ <NUM>sg ^ <PER>1st) ^ …) lf4’ = (@E_2:action(regalar) ^ … <Least>(X_1:person ^ me ^ <NUM>sg ^ <PER>1st) ^ <Less>(Y_2:person) ^ …) lf5’ = (@E_2:action(regalar) ^ … <Least>(X_1:person ^ me ^ <NUM>sg ^ <PER>1st) ^ <Less>(X_0:person ^ te ^ <NUM>sg ^ <PER>2nd) ^ …) 4 Conclusión El trabajo ha mostrado cómo dar cuenta de (i) las restricciones de orden que rigen la combinatoria de clíticos entre sí (§2.1), y (ii) la distribución de roles semánticos a la García (1975) en términos de una GCC especificada en el entorno de OpenCCG (§2.2). Ambos fenómenos, independientes entre sí, son captados al definir los clíticos en el léxico como functores que buscan verbos para saturarles valencias determinadas, ya sea mediante Composición o Aplicación Funcional. Las restricciones de orden se siguen al descomponer la generalización de Perlmutter (1971) en configuraciones de rasgos exigibles por el clítico functor al signo argumento (§3.1). La asignación de roles semánticos resulta del aporte de la semántica del clítico a la semántica del verbo vía la coindexación de la variable de la valencia saturada por el clítico con la variable de la forma lógica del verbo asociada a un rol semántico (§3.2). El carácter polisémico de clíticos como te y me se sigue de su estatuto no marcado con respecto a la distinción acusativo/dativo, lo cual los hace potencialmente aptos para desempeñar los roles Least o Less de acuerdo con la disponibilidad contextual de roles semánticos.