2. Ventajas e inconvenientes del trabajo con corpus

Transcripción

2. Ventajas e inconvenientes del trabajo con corpus
Lingüística Computacional II. Curso monográfico sobre Lingüística de corpus
© Milka Villlayandre Llamazares – Universidad de León ([email protected])
2. VENTAJAS E INCONVENIENTES DEL TRABAJO CON CORPUS
Algunas ventajas que justifican el interés actual por los corpus electrónicos tienen que ver con que:
a) Proporcionan objetividad y ofrecen la posibilidad de verificar las teorías construidas a partir de ellos.
b) Aportan rapidez, precisión y consistencia en el procesamiento de los datos a un bajo coste.
c) Facilitan el acceso y manipulación de los materiales.
d) Permiten el procesamiento automático de textos así como la explicitación de diferentes tipos de
información (p. ej. la categoría gramatical de las palabras) que multiplican sus posibilidades de
explotación ulterior.
e) El mismo recurso puede tener variados usos y aplicaciones.
f)
Responden a la necesidad de contar con grandes cantidades de datos reales fácilmente accesibles
como una base más realista para el estudio del lenguaje y también para el desarrollo de sistemas
prácticos de procesamiento del lenguaje natural.
g) Han permitido automatizar total o parcialmente muchas tareas –que antes debían efectuarse de
forma manual– mediante programas diseñados para extraer información de los corpus. Destacan
especialmente los relacionados con el análisis gramatical y sintáctico que son, a su vez, el punto de
partida para el desarrollo de modelos probabilísticos sobre el funcionamiento del lenguaje o para
probar modelos propuestos por la Lingüística Teórica.
h) Son un recurso muy fructífero para estudios contrastivos y para explorar los aspectos cuantitativos y
probabilísticos del lenguaje, de especial utilidad en el ámbito de la lexicografía y de la elaboración de
materiales para la enseñanza de la lengua.
i)
Son la única vía posible para los estudios diacrónicos, en los que no existe la posibilidad de recurrir a
hablantes vivos.
j)
Constituyen muestras importantes de uso para los estudios de variación.
18
Lingüística Computacional II. Curso monográfico sobre Lingüística de corpus
© Milka Villlayandre Llamazares – Universidad de León ([email protected])
En cuanto a las desventajas, se han señalado las siguientes39:
1)
En determinadas áreas los corpus no son suficientes y es necesario acudir a los análisis manuales,
como en el caso de la pragmática.
2) En los corpus de lengua oral, si se trabaja con transcripciones, existe el peligro de alejarse demasiado
del texto original.
3) El tamaño no es tan decisivo como la adecuación del corpus a la finalidad para la que ha sido
planeado.
No obstante, hoy en día no se puede negar la repercusión que los corpus están teniendo en diferentes
áreas relacionadas con el estudio de la lengua y la literatura, en las que cada vez es más frecuente
incorporar este tipo de recursos: así ocurre en el área de la enseñanza de lenguas, donde aportan muestras
de uso de la lengua para la elaboración de materiales didácticos; en el ámbito de la lexicografía, donde su
impacto ha sido decisivo y es inconcebible un diccionario que no se sustente sobre los datos que
suministran los corpus (listas de frecuencias, concordancias, colocaciones, ejemplos, información
gramatical, semántica o sobre el ámbito temático, el lugar o el registro); en el análisis del discurso y
análisis crítico del discurso, campos en los que el empleo de corpus permite extraer patrones o
tendencias, así como el estudio de la ideología presente en los textos; en la lingüística forense, para
determinar casos de plagio o de autoría en contextos legales; en los estudios sobre la variación lingüística
o sobre la estilística, etc. (cf. Adolphs 2006).
39
Vid. MCE NERY, XIAO y TONO (2006:131 y ss.) para las controversias que el uso de corpus ha suscitado entre diversos
investigadores.
19

Documentos relacionados