Diccionario

Transcripción

Diccionario
Taller Latinoamericano de Tratamiento
de Lenguaje Humano
3, 4 y 5 de julio en Puebla, México
Laboratorio Lexiques, Dictionnaires, Informatique
UMR 7187
Universidad París 13, Sorbonne Paris Cité
Luis Meneses Lerín
Université Paris13, LDI
[email protected],
[email protected]
Plan
I. Présentation LDI
1. Áreas y temáticas
2. Actividades de investigación para impulsar la cooperación a nivel
hispanoamericano
3. Mecanismos de cooperación México-Francia
II. El tratamiento del sentido de las palabras
1. Modelo lingüístico
2. Ejemplos polisemia, fijación e inferencia
3. Corpus de referencia del español (España y México)
I. Presentación LDI
Unidad Mixta de Investigación (CNRS)
Universidad Paris 13
• Escuela de doctorado
ERASME
• Master SLATEL (Sciences du
langage, des textes et de
littérature)
• Master Pro TILDE (Traitement
Informatique et Linguistique
des Documents Écrits)
Universidad Cergy-Pontoise
• Escuela de doctorado
DERECHOS y CIENCIAS
HUMANAS
• Master Ciencias del lenguaje
LDI
Equipo
• 30 profesores-investigadores
y asociados
Revistas
• Les Cahiers de lexicologie
(Editions Classiques Garnier)
• 6 ingenieros CNRS
• Neologica (Editions
Classiques Garnier)
• 80 doctorantes
• Synergies-Tunisie (Gerflint)
• Idées de Langue (Revue
électronique jeunes
chercheurs) et Dico-revue.
Mots-clés
Actualisation,
Argument,
Contrastif,
Détermination, Dictionnaire, Dictionnairique,
Figement, Informatique, Langue spécialisée,
Lexicographie,
Lexique,
Métalangue,
Métalexicographie,
Néologie,
Prédicat,
Ressources
linguistiques,
Sémantique,
Syntaxe, Traduction, Traitement Automatique.
El laboratorio LDI es un laboratorio que utiliza el léxico para
elaborar o analizar diccionarios utilizando la computación.
• El Léxico representa la materia prima de base que sirve como
entrada en la descripción de las diferentes lenguas tratadas.
• El Diccionario es a su vez una fuente de datos y un objeto
construido.
• La Informática es una herramienta puesta a la disposición de
los lingüistas para analizar o elaborar diccionarios y para
concebir metodologías apropiadas al procesamiento
automático del lenguaje.
Los trabajos de investigación :
• La investigación fundamental (teoría)
- describir las realizaciones lingüísticas de estos
tres fenómenos
• La investigación aplicada (herramientas)
- validar las descripciones lingüísticas de estos
tres fenómenos
1. Áreas y temáticas :
I. LEXICOS :
1. La tres funciones primaria
2. La neología
3. La fijación
4. La polisemia nominal
Áreas y temáticas :
II. DICCIONARIOS
1. Metalexicografía
2. Investigación de diccionarios
Áreas transversal y temáticas :
III. COMPUTACIÓN
1. Recursos : creación y gestión de recursos lingüísticos
considerados como un resultado final (diccionarios), como
un
objeto de estudio (corpus) o como una fuente de
atestaciones ;
2. Herramientas / manipulaciones : creación de
herramientas que ayuden al lingüista a identificar, a describir las
unidades
lingüísticas y validarlas;
3. Aplicaciones : explotación computacional de recursos
lingüísticos.
Áreas de oportunidad relacionadas con las
investigaciones del LDI
1. el Procesamiento automático del lenguaje y
2. la Ingeniería lingüística.
Las dos áreas pueden ser enriquecidas y/o afinadas
Lenguaje general
• las “palabras con un elevado
espectro lexical”;
• la “atracción lexical”;
• el “peso” de las palabras
• la fraseología en los textos
• la detección automática de
“secuencias multipalabras”;
• la detección de inferencias
lingüísticas marcadas
• la concepción de nuevos
diccionarios contextuales
• la construcción de diccionarios
electrónicos
• etc.
Lenguaje de especialidad
• las opiniones, las
reclamaciones, las solicitudes,
etc.
• las adicciones en las redes
sociales
• las traducciones técnicas
• el lenguaje comercial
• el lenguaje militar
• el lenguaje medico
• el lenguaje jurídico
• etc.
El gobierno francés y mexicano incitan a los diferentes
laboratorios a proponer proyectos de investigación con :
1. carácter innovador
2. carácter pluridisciplinario
3. carácter internacional
Está claro que el trabajar con laboratorios mexicanos no
solamente resulta ser muy atractivo para el LDI, sino
también para el gobierno francés.
• A nivel institucional en el ámbito local, regional y nacional :
PRES, ILF, GDR, Proyectos ANR, UMR, EA, etc.
• Red de empresas Master Pro TILDE : consejo de
perfeccionamiento y tesis CIFRE.
• Miembros en asociaciones lingüísticas (ASL,CONSCILA,
ALES, SLP) sociedades “savantes” y redes internacionales
(Europhras, Réseau LTT, IR Corpus de l’ILF, Réseau
GERFLINT, Néorom, etc.)
• Un gran numero de socios internacionales y el reconocimiento
de los trabajos del LDI, proyectos con :
•
•
•
•
•
África : Túnez (LIA), Marruecos (Los tecnolectos)
América Latina : Brasil (COFECUB), México (ECOS Nord)
Asia : Corea del sur (STAR), Japón (ISF)
Europa : España (PICS), Polonia (Polonium)
Proyectos tripartitas : España, Túnez, Francia ; Alemania, Túnez,
Francia; México, España, Francia, etc.)
2. Actividades de investigación para impulsar
la cooperación a nivel hispanoamericano
•
•
•
•
•
•
extracción y generación
traducción automática
análisis textual
análisis de opiniones
fenómenos del lenguaje natural
etc.
La red de países hispanohablantes en el
Procesamiento Automático del Lenguaje :
Métodos
híbridos
(computación/lingüística)
otorgarían un sello distintivo a la red…
le
3. Mecanismos de cooperación México-Francia
• Programas de becas mixtas con el CONACyT: ayuda a la movilidad
de los estudiantes de doctorado ;
• Programa ECOS-Nord (la ANUIES, el CONACyT y la SEP), apoyo a
proyectos conjuntos de investigación
• Programa PCP/RU21(con el CONACyT): apoyo a proyectos de
investigación con fines industriales y de carácter innovador ;
• Programa de apoyo al Colegio Franco-mexicano de Ciencias
Humanas (con el CEMCA), ayuda a la movilidad de los
investigadores en ciencias humanas ;
Otros mecanismos de cooperación México-Francia :
• El CNRS financia conjuntamente dos estructuras de investigación,
un LIA (Matemáticas) en colaboración con la UNAM y una UMI
(Automática e Informática) en conjunto con el CINVESTAV, la
Universidad Tecnológica de Compiègne y el CONACyT, y también
organiza y financia una licitación conjunta con el CONACyT.
• Por último, se suman a este panorama dos actores fundamentales
(agencias de financiamiento) que acaban de surgir en el paisaje
franco-mexicano, respectivamente en 2009 y en 2010, el ANR y
OSEO que financian conjuntamente cada año, con el CONACyT y
con base en licitaciones, diversos proyectos de investigación o de
investigación y desarrollo.
5. Proyectos entre el LDI y equipos mexicanos
• Proyecto ECOS-Nord (Francia-México)
“Diccionarios electrónicos monolingües coordinados de
secuencias fijas francés-español (España)-español (México) ”,
código M11-H04, 2011-2015.
• Co-diplomado en conjunto con el laboratorio de
Ingeniería del Lenguaje y del Conocimiento
Nivel Maestría y Doctorado, Facultad de Ciencias de la
Computacion, BUAP.
II. El tratamiento del sentido de las palabras
(semántica)
Detrás del sentido de las palabras :
la polisemia
la fijación
la inferencia
Un nuevo enfoque :
Teoría (lingüística)
Aplicación (computación)
Lingüística
computacional
• Proyecto de tesis
- “Diccionario electrónico monolingüe coordinado del verbo dar FR-ES-MEX :
análisis sintáctico-semántico”,12 de diciembre de 2012.
• Proyecto ECOS-Nord (Francia-México)
- “Diccionarios electrónicos monolingües coordinados de secuencias fijas
francés-español (España)-español (México) ”, código M11-H04, 2011-2015.
• Proyecto Investigación Fundamental no orientada I+D+i
-“Estudio lingüístico, diatópico y traductológico de las secuencias verbales fijas
las mas utilizadas en español (ES-MEX-ARG).
• Proyecto CIFRA (Alemania)
- Proyecto Varitext, “ Corpus Variacional del francés y del español”.
Modelo lingüístico :
1. Un análisis integrado : léxico, morfología, sintaxis,
semántica y pragmática
1. Unidad mínima de análisis : la frase
2. Exhaustividad y sistematicidad
3. Las descripciones son definidas a partir de
propiedades lingüísticas (no extralingüísticas)
Las tres funciones primarias
Función predicativa
 Il y a eu beaucoup de pluie
 Llovió mucho
Función argumental
 Les paysans attendent la pluie
 Los campesinos esperan la lluvia
Función actualizadora
 Il a reçu une pluie d’applaudissements
 Recibió una lluvia de aplausos
Las funciones primarias y las clases de objetos
(1) donner : N0<hum>/N1 <concret>
Jean donne des fleurs à Léa
Juan le da flores a Léa
(2) réponse : N0<hum>/N1 <hum> /W: donner
Jean donne une réponse à Léa
Juan da una respuesta a Léa
(3) donner carte blanche: N0<hum>/N1 <hum>
Jean donne carte blanche à Léa
Juan da carta blanca a Léa
La problemática de la palabra :
El caso de dar :
(4) Pablo le da un libro a Claudia
(5) Pablo da un paseo con Claudia
(6) Pablo le dio luz verde a Claudia para comprar el
auto
(7) Pablo le dio el divorcio a su mujer
La notion de « palabra »
Fijación
dimensión morfológica
Polisemia
dimensión semántica
Inferencia
dimensión semántica
Algunos resultados :
Combinatoria
libre
Combinatoria
restringida
Combinatoria
fija
Corpus de referencia del español
(España y México)
Varitex :
Las variantes diatopicas mexicanas
(8) dar de alta : N0<hum: médico>/N1 <hum>
El médico dio de alta a Juan un día después de la operación
Le médecin a signé l’autorisation de sortie de Jean…
(9) dar el avión : N0<hum>/N1 <hum>
Nunca la escucha, Juan siempre le da el avión a Léa
Il ne l’écoute jamais, Jean fait semblant d’écouter Léa
(10) dar aire: N0<hum: funcionario >/N1 <hum:asalariado>
El jefe le dio aire a Léa por no atender al público
Le chef a mis Léa à la porte …
La polisemia de los mexicanismos
(11) dar aire: N0<hum:funcionario >/N1 <hum:asalariado>/D: laboral/R:
coloq.
El jefe le dio aire a Léa por no atender al público
Le chef a mis Léa à la porte …
(12) dar aire: N0<hum>/N1 <novio>/D: relaciones amorosas/R: coloq.
María le dio aire al novio porque decidió no casarse
Marie a laissé tomber Paul car il n’a pas voulu se marier
Los diccionarios monolingües coordinados
Predicados monolexicales en francés
Emploi1<hum>donner <objet> à <hum>/syn: offrir
Emploi2<hum>donner <hum> à <hum>/syn: dénoncer
Emploi3<hum>donner <argent> à <salarié>/syn: payer
Emploi4<hum>donner <médicament> à <hum>/syn: administrer
Emploi5<hum>donner <clé> à <gardien>/syn: confier
Emploi6<hum>donner <cartes> à <joueur>/syn: distribuer
Emploi7<école>donner <peintres> célèbres /syn: former
Emploi N….
Predicados monolexicales en español
Emploi1<hum> dar <objeto> a <hum>/syn: regalar
Emploi3<hum> dar <dinero> a <empleado>/syn: pagar
Emploi4<hum> dar <medicamento> a <hum>/syn: administrar
Emploi5<hum> dar <llave> a <portero>/syn: encomendar
Emploi6<hum> dar <cartas> a <jugador>/syn: distribuir
Emploi N….
Gracias
Merci

Documentos relacionados