Diccionario
Transcripción
Diccionario
Taller Latinoamericano de Tratamiento de Lenguaje Humano 3, 4 y 5 de julio en Puebla, México Laboratorio Lexiques, Dictionnaires, Informatique UMR 7187 Universidad París 13, Sorbonne Paris Cité Luis Meneses Lerín Université Paris13, LDI [email protected], [email protected] Plan I. Présentation LDI 1. Áreas y temáticas 2. Actividades de investigación para impulsar la cooperación a nivel hispanoamericano 3. Mecanismos de cooperación México-Francia II. El tratamiento del sentido de las palabras 1. Modelo lingüístico 2. Ejemplos polisemia, fijación e inferencia 3. Corpus de referencia del español (España y México) I. Presentación LDI Unidad Mixta de Investigación (CNRS) Universidad Paris 13 • Escuela de doctorado ERASME • Master SLATEL (Sciences du langage, des textes et de littérature) • Master Pro TILDE (Traitement Informatique et Linguistique des Documents Écrits) Universidad Cergy-Pontoise • Escuela de doctorado DERECHOS y CIENCIAS HUMANAS • Master Ciencias del lenguaje LDI Equipo • 30 profesores-investigadores y asociados Revistas • Les Cahiers de lexicologie (Editions Classiques Garnier) • 6 ingenieros CNRS • Neologica (Editions Classiques Garnier) • 80 doctorantes • Synergies-Tunisie (Gerflint) • Idées de Langue (Revue électronique jeunes chercheurs) et Dico-revue. Mots-clés Actualisation, Argument, Contrastif, Détermination, Dictionnaire, Dictionnairique, Figement, Informatique, Langue spécialisée, Lexicographie, Lexique, Métalangue, Métalexicographie, Néologie, Prédicat, Ressources linguistiques, Sémantique, Syntaxe, Traduction, Traitement Automatique. El laboratorio LDI es un laboratorio que utiliza el léxico para elaborar o analizar diccionarios utilizando la computación. • El Léxico representa la materia prima de base que sirve como entrada en la descripción de las diferentes lenguas tratadas. • El Diccionario es a su vez una fuente de datos y un objeto construido. • La Informática es una herramienta puesta a la disposición de los lingüistas para analizar o elaborar diccionarios y para concebir metodologías apropiadas al procesamiento automático del lenguaje. Los trabajos de investigación : • La investigación fundamental (teoría) - describir las realizaciones lingüísticas de estos tres fenómenos • La investigación aplicada (herramientas) - validar las descripciones lingüísticas de estos tres fenómenos 1. Áreas y temáticas : I. LEXICOS : 1. La tres funciones primaria 2. La neología 3. La fijación 4. La polisemia nominal Áreas y temáticas : II. DICCIONARIOS 1. Metalexicografía 2. Investigación de diccionarios Áreas transversal y temáticas : III. COMPUTACIÓN 1. Recursos : creación y gestión de recursos lingüísticos considerados como un resultado final (diccionarios), como un objeto de estudio (corpus) o como una fuente de atestaciones ; 2. Herramientas / manipulaciones : creación de herramientas que ayuden al lingüista a identificar, a describir las unidades lingüísticas y validarlas; 3. Aplicaciones : explotación computacional de recursos lingüísticos. Áreas de oportunidad relacionadas con las investigaciones del LDI 1. el Procesamiento automático del lenguaje y 2. la Ingeniería lingüística. Las dos áreas pueden ser enriquecidas y/o afinadas Lenguaje general • las “palabras con un elevado espectro lexical”; • la “atracción lexical”; • el “peso” de las palabras • la fraseología en los textos • la detección automática de “secuencias multipalabras”; • la detección de inferencias lingüísticas marcadas • la concepción de nuevos diccionarios contextuales • la construcción de diccionarios electrónicos • etc. Lenguaje de especialidad • las opiniones, las reclamaciones, las solicitudes, etc. • las adicciones en las redes sociales • las traducciones técnicas • el lenguaje comercial • el lenguaje militar • el lenguaje medico • el lenguaje jurídico • etc. El gobierno francés y mexicano incitan a los diferentes laboratorios a proponer proyectos de investigación con : 1. carácter innovador 2. carácter pluridisciplinario 3. carácter internacional Está claro que el trabajar con laboratorios mexicanos no solamente resulta ser muy atractivo para el LDI, sino también para el gobierno francés. • A nivel institucional en el ámbito local, regional y nacional : PRES, ILF, GDR, Proyectos ANR, UMR, EA, etc. • Red de empresas Master Pro TILDE : consejo de perfeccionamiento y tesis CIFRE. • Miembros en asociaciones lingüísticas (ASL,CONSCILA, ALES, SLP) sociedades “savantes” y redes internacionales (Europhras, Réseau LTT, IR Corpus de l’ILF, Réseau GERFLINT, Néorom, etc.) • Un gran numero de socios internacionales y el reconocimiento de los trabajos del LDI, proyectos con : • • • • • África : Túnez (LIA), Marruecos (Los tecnolectos) América Latina : Brasil (COFECUB), México (ECOS Nord) Asia : Corea del sur (STAR), Japón (ISF) Europa : España (PICS), Polonia (Polonium) Proyectos tripartitas : España, Túnez, Francia ; Alemania, Túnez, Francia; México, España, Francia, etc.) 2. Actividades de investigación para impulsar la cooperación a nivel hispanoamericano • • • • • • extracción y generación traducción automática análisis textual análisis de opiniones fenómenos del lenguaje natural etc. La red de países hispanohablantes en el Procesamiento Automático del Lenguaje : Métodos híbridos (computación/lingüística) otorgarían un sello distintivo a la red… le 3. Mecanismos de cooperación México-Francia • Programas de becas mixtas con el CONACyT: ayuda a la movilidad de los estudiantes de doctorado ; • Programa ECOS-Nord (la ANUIES, el CONACyT y la SEP), apoyo a proyectos conjuntos de investigación • Programa PCP/RU21(con el CONACyT): apoyo a proyectos de investigación con fines industriales y de carácter innovador ; • Programa de apoyo al Colegio Franco-mexicano de Ciencias Humanas (con el CEMCA), ayuda a la movilidad de los investigadores en ciencias humanas ; Otros mecanismos de cooperación México-Francia : • El CNRS financia conjuntamente dos estructuras de investigación, un LIA (Matemáticas) en colaboración con la UNAM y una UMI (Automática e Informática) en conjunto con el CINVESTAV, la Universidad Tecnológica de Compiègne y el CONACyT, y también organiza y financia una licitación conjunta con el CONACyT. • Por último, se suman a este panorama dos actores fundamentales (agencias de financiamiento) que acaban de surgir en el paisaje franco-mexicano, respectivamente en 2009 y en 2010, el ANR y OSEO que financian conjuntamente cada año, con el CONACyT y con base en licitaciones, diversos proyectos de investigación o de investigación y desarrollo. 5. Proyectos entre el LDI y equipos mexicanos • Proyecto ECOS-Nord (Francia-México) “Diccionarios electrónicos monolingües coordinados de secuencias fijas francés-español (España)-español (México) ”, código M11-H04, 2011-2015. • Co-diplomado en conjunto con el laboratorio de Ingeniería del Lenguaje y del Conocimiento Nivel Maestría y Doctorado, Facultad de Ciencias de la Computacion, BUAP. II. El tratamiento del sentido de las palabras (semántica) Detrás del sentido de las palabras : la polisemia la fijación la inferencia Un nuevo enfoque : Teoría (lingüística) Aplicación (computación) Lingüística computacional • Proyecto de tesis - “Diccionario electrónico monolingüe coordinado del verbo dar FR-ES-MEX : análisis sintáctico-semántico”,12 de diciembre de 2012. • Proyecto ECOS-Nord (Francia-México) - “Diccionarios electrónicos monolingües coordinados de secuencias fijas francés-español (España)-español (México) ”, código M11-H04, 2011-2015. • Proyecto Investigación Fundamental no orientada I+D+i -“Estudio lingüístico, diatópico y traductológico de las secuencias verbales fijas las mas utilizadas en español (ES-MEX-ARG). • Proyecto CIFRA (Alemania) - Proyecto Varitext, “ Corpus Variacional del francés y del español”. Modelo lingüístico : 1. Un análisis integrado : léxico, morfología, sintaxis, semántica y pragmática 1. Unidad mínima de análisis : la frase 2. Exhaustividad y sistematicidad 3. Las descripciones son definidas a partir de propiedades lingüísticas (no extralingüísticas) Las tres funciones primarias Función predicativa Il y a eu beaucoup de pluie Llovió mucho Función argumental Les paysans attendent la pluie Los campesinos esperan la lluvia Función actualizadora Il a reçu une pluie d’applaudissements Recibió una lluvia de aplausos Las funciones primarias y las clases de objetos (1) donner : N0<hum>/N1 <concret> Jean donne des fleurs à Léa Juan le da flores a Léa (2) réponse : N0<hum>/N1 <hum> /W: donner Jean donne une réponse à Léa Juan da una respuesta a Léa (3) donner carte blanche: N0<hum>/N1 <hum> Jean donne carte blanche à Léa Juan da carta blanca a Léa La problemática de la palabra : El caso de dar : (4) Pablo le da un libro a Claudia (5) Pablo da un paseo con Claudia (6) Pablo le dio luz verde a Claudia para comprar el auto (7) Pablo le dio el divorcio a su mujer La notion de « palabra » Fijación dimensión morfológica Polisemia dimensión semántica Inferencia dimensión semántica Algunos resultados : Combinatoria libre Combinatoria restringida Combinatoria fija Corpus de referencia del español (España y México) Varitex : Las variantes diatopicas mexicanas (8) dar de alta : N0<hum: médico>/N1 <hum> El médico dio de alta a Juan un día después de la operación Le médecin a signé l’autorisation de sortie de Jean… (9) dar el avión : N0<hum>/N1 <hum> Nunca la escucha, Juan siempre le da el avión a Léa Il ne l’écoute jamais, Jean fait semblant d’écouter Léa (10) dar aire: N0<hum: funcionario >/N1 <hum:asalariado> El jefe le dio aire a Léa por no atender al público Le chef a mis Léa à la porte … La polisemia de los mexicanismos (11) dar aire: N0<hum:funcionario >/N1 <hum:asalariado>/D: laboral/R: coloq. El jefe le dio aire a Léa por no atender al público Le chef a mis Léa à la porte … (12) dar aire: N0<hum>/N1 <novio>/D: relaciones amorosas/R: coloq. María le dio aire al novio porque decidió no casarse Marie a laissé tomber Paul car il n’a pas voulu se marier Los diccionarios monolingües coordinados Predicados monolexicales en francés Emploi1<hum>donner <objet> à <hum>/syn: offrir Emploi2<hum>donner <hum> à <hum>/syn: dénoncer Emploi3<hum>donner <argent> à <salarié>/syn: payer Emploi4<hum>donner <médicament> à <hum>/syn: administrer Emploi5<hum>donner <clé> à <gardien>/syn: confier Emploi6<hum>donner <cartes> à <joueur>/syn: distribuer Emploi7<école>donner <peintres> célèbres /syn: former Emploi N…. Predicados monolexicales en español Emploi1<hum> dar <objeto> a <hum>/syn: regalar Emploi3<hum> dar <dinero> a <empleado>/syn: pagar Emploi4<hum> dar <medicamento> a <hum>/syn: administrar Emploi5<hum> dar <llave> a <portero>/syn: encomendar Emploi6<hum> dar <cartas> a <jugador>/syn: distribuir Emploi N…. Gracias Merci