Seminario Universitario de Estudios del Discurso Forense Instituto

Transcripción

Seminario Universitario de Estudios del Discurso Forense Instituto
Seminario Universitario de Estudios del
Discurso Forense
Instituto de Investigaciones Sociales
Facultad de Contaduría y Administración
UNIVERSIDAD NACIONAL AUTÓNOMA DE
MÉXICO
MANUAL DE PROCEDIMIENTOS PARA LA
EJECUCIÓN DEL PROGRAMA Algoritmos generadores de redes
de archivos para analizar discursos (AgraAD)
Fernando Francisco Castaños Zuno
Carlos Francisco Méndez Cruz
Margarita Palacios Sierra
(Coordinadores)
Agosto, 2015
ÍNDICE
I.
II.
III.
Introducción
Objetivo del manual
Procedimiento
1. Propósito del procedimiento
2. Alcance
3. Responsabilidades
4. Definiciones
5. Ejecución del programa
5.1 Requerimientos del sistema
5.2 Consideraciones previas
5.3 Ejecución por primera vez
5.4 Ejecuciones posteriores
5.5 Eliminación del programa en Word
2 I. Introducción
El Seminario Universitario de Estudios del Discurso Forense (SUEDIF) está conformado por
catorce instituciones universitarias que trabajan multidisciplinaria y colegiadamente en
proyectos de docencia, investigación y difusión sobre las disputas y los conflictos nacionales
para profundizar en su conocimiento y su estudio.
Debido al carácter interdisciplinario, tanto el Seminario como el Instituto de Investigaciones
Sociales (IIS) y el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la
UNAM se encargaron de desarrollar un programa que permita el etiquetado y la
sistematización de diferentes corpus para facilitar y agilizar las investigaciones sobre análisis del
discurso en cualquier área con el propósito de presentar posibles rutas de análisis a problemas
jurídicos.
El programa genera diez archivos denominados de la siguiente manera: fuente, remarcado, para
numerar, que numera, numerado, para limpiar, que limpia, para contar, que cuenta, y contadas.
La definición de cada uno se encuentra en el apartado 3, punto 4.
Para la implementación del procedimiento, se analizaron las ventajas y desventajas de una
macro en MS Office, un programa C#, Java POI/JExcel o el diseño de un sitio web. Se eligió
la primera opción por los siguientes motivos: la ejecución es más sencilla porque no necesita
conocimiento informático especializado, la rapidez para la automatización del procedimiento
es mayor que las anteriores, los riesgos de contagio de virus son mínimos, y finalmente el
modo de ejecución es mediante un botón de herramientas de MS Office, es decir, la macro no
requiere una interfaz de usuario.
El proyecto empleó para prueba una prueba el corpus de los discursos presidenciales de Juan
Silva Meza (2011-2014), expresidente de la Suprema Corte de Justicia de la Nación. La prueba
contó con tres fases: recuperación del corpus, diseño y evaluación del programa.
El presente manual contiene la descripción del procedimiento para ejecutarlo fácilmente desde
cualquier computadora. Pretende ser la guía que refleje y concentre las acciones y los procesos
del programa.
3 II. Objetivo del manual
Generar un documento de seguimiento y de apoyo que describa los procedimientos necesarios
para la ejecución del programa Algoritmos generadores de redes de archivos para analizar discursos
(AgraAD) orientado a cualquier usuario dedicado a la investigación que busque obtener datos
estadísticos acerca de las unidades de algún corpus.
III. Procedimiento
Desarrollo de una herramienta para generar archivos con información relevante para el análisis
de discursos en corpus.
1. Propósito del procedimiento
Identificar las actividades, los responsables, la duración, los espacios de trabajo, las fuentes de
información e interacciones necesarias para la ejecución del programa AgraAD.
2. Alcance
El procedimiento corresponde a la Universidad Nacional Autónoma de México,
específicamente al Seminario Universitario de Estudios del Discurso Forense (SUEDIF), el
Instituto de Investigaciones Sociales (IIS) y el Grupo de Ingeniería Lingüística (GIL).
3. Responsabilidades
• Responsable de la propiedad de la idea:
o Doctor Fernando Francisco Castaños Zuno
• Responsables de la programación:
o Doctor Carlos Francisco Méndez Cruz
• Colaboradores:
o Pedro Eduardo Hernández Fuentes
o Marcio Francisco Martínez Valenzuela
o Doctora Margarita Palacios Sierra
• Adaptación y revisión:
o Pedro Eduardo Hernández Fuentes
o Led Eduardo Ruvalcaba Tamés
4 4. Definiciones
En este apartado se describe de forma general cada una de las transformaciones que realiza el
procedimiento1, la cual estará indicada por una T seguida de un número (Tn). Una
transformación toma como entrada un archivo para generar otro archivo de salida que puede
ser de Word o de Excel. El signo “>” señala el proceso de transformación que crea cada
documento.
La primera transformación, T1, consiste en copiar una información originada en cualquier
formato a un documento de Word (archivo fuente), y es conducida necesariamente por una
persona. Nombramos a la primera información archivo original.
T1. Original (cualquier formato) > Fuente (Word)
Archivo original: discurso, fragmento de discurso o conjunto de discursos a los que
se puede acceder como aparecieron inicialmente, porque se conserva en algún lugar
(real o virtual) o porque se ha copiado, en la medida de lo posible, con sus
propiedades, entre ellas: tamaño, diseño de página y tipografía, conjuntamente con
los cuadros y las ilustraciones que lo acompañaban.
Archivo fuente: documento digital que registra las cadenas lingüísticas y los elementos
paralingüísticos que conforman el texto del discurso, propiamente, así como las
descripciones pertinentes (para los fines de la investigación) de los componentes no
textuales acompañantes. En su caso, se ha sustituido el tipo, el tamaño y el color de
letra básicos por unos estandarizados (de acuerdo con convenciones generales del
corpus o del proyecto en que se inscriba el análisis).
T2. Fuente (Word) > Remarcado (Word)
Archivo remarcado: documento en el que se ha introducido una marca de párrafo y
una de enunciado antes de la primera palabra de la oración inicial, se ha
reemplazado cada punto y seguido por un símbolo propio de enunciado (#E) y
cada marca de párrafo original, así como las que se hubieran generado
automáticamente en los pasos anteriores, por una marca propia (#P).
1 Para ver el detalle de las transformaciones, consulte el documento: Léxico Procedimientos básicos
20140310. 5 T3. Remarcado (Word) > Para numerar (Word)
Archivo para numerar: documento en el cual los elementos de los enunciados han
sido dispuestos verticalmente, es decir, cada uno de ellos ocupa un renglón distinto.
T4. Para numerar (Word) > Que numera (Excel)
Archivo que numera: base de datos a cuya primera columna se ha trasladado (copiado)
el contenido del archivo para numerar. En cada celda hay una palabra (que puede
estar acompañada de uno o más signos de puntuación) o una marca propia, de
enunciado o de párrafo y no hay (en la columna) celdas vacías. Esa columna está
acompañada de otras, que numeran los párrafos, los enunciados y las palabras de
cada oración.
T5. Que numera (Excel) > Numerado (Word)
Archivo numerado: documento en el que se retoma la última columna del archivo que
numera para colocarlo en un documento en Word con formato unificado.
T6. Que numera (Excel) > Para limpiar (Excel)
Archivo para limpiar: base de datos con los elementos y los identificadores de
posición de estos que han sido generados para cada uno hasta ahora, es decir, el
orden secuencial simple y el vector de posición, sin las funciones generadoras.
T7. Para limpiar (Excel) > Que limpia (Excel)
Archivo que limpia: base de datos con las columnas de la anterior y otras en las que
aparecen, sucesivamente, las marcas de párrafo sustituidas por registros en blanco y
las palabras sin signos de puntuación.
T8. Que limpia (Excel) > Para contar (Excel)
Archivo para contar: base de datos en la que se han eliminado los registros en blanco,
se ha generado un orden secuencial para la lista de palabras, sin los demás
6 elementos de los archivos previos y se han hecho las correcciones manuales, en
caso de que fueran pertinentes.
T9. Para contar (Excel) > Que cuenta (Excel)
Archivo que cuenta: base de datos en la que se han eliminado las columnas vectores
de posición, orden secuencial simple y orden secuencial de palabras para crear la
columna de palabras muestra, en la que se presentará la información
alfabéticamente; además de la columna sumas por palabras tipo, que muestra los
resultados de los datos anteriores.
T10. Que cuenta (Excel) > Contadas (Excel)
Archivo contadas: base de datos en la que se presentan los resultados totales de
palabras tipo y total de muestras por tipo. Así como el cociente entre las anteriores,
es decir, la tasa de repetición de cada palabra tipo.
5. Ejecución del programa
5.1 Requerimientos del sistema
a. Equipo con sistema operativo Windows.
b. Equipo con espacio mínimo del disco duro de 3000 MB.
c. Equipo con memoria RAM mínima de 1024 MB.
d. Paquetería de Microsoft Office, preferentemente en su última versión.2
5.2 Consideraciones previas
a. La recuperación del corpus se realiza manualmente. El proceso del programa
comienza
a
partir
de
un
documento
en
Word
(Archivo
fuente),
recomendablemente este debe tener el mismo formato del Archivo original y no
debe contener imágenes.
b. Se debe contar con el archivo AgraAD_02.bas, ubicado en su disco local, éste
sólo se requiere importar una vez.
c. Durante la ejecución del programa se recomienda:
2 El programa se ha probado y ha funcionado correctamente en las versiones de MS Office 2007, 2010
y 2013. 7 i. No cerrar la aplicación de Word aunque parezca inactiva (no dejará
realizar algún cambio sobre la ventana de Word).
ii. No tener abierto ningún documento en Excel.
iii. Tener abierto únicamente el documento en el que se ejecutará el
programa.
5.3Ejecución por primera vez
1. Abrir el archivo de Word en el que se aplicarán las transformaciones (archivo
fuente).
2. Presionar la combinación de teclas: “ALT” + “F11” (en algunos casos, la
combinación es “ALT” + “FN” + “F11”), que abrirá una nueva ventana
“Microsoft Visual Basic para Aplicaciones”.
8 3. Seleccionar el menú “Herramientas” y dar clic en la opción “Referencias”.
4. Buscar la leyenda “Microsoft Excel X.X Object Library”, donde X se refiere
a la versión de la librería. Esta puede ser 13, 14, 15 o superior. Luego dar clic en
la casilla ubicada en el lado izquierdo. A continuación dar clic en “Aceptar”.
9 5. Dar clic derecho sobre el panel izquierdo, en “Normal” y seleccionar
“Importar archivo”.
6. Seleccionar el archivo “AgraAD_02.bas” y presionar “Abrir”.
10 7. Dar un clic sobre el botón “+” de la opción “Módulos” y luego dar doble clic
sobre “AgraAD_02”.
1 2 8. Para ejecutar el programa, presionar el botón “Play” o “Ejecutar”.
9. Al dar clic sobre el botón “Ejecutar”, se abrirá una ventana que pedirá que
ingrese el nombre de los documentos. Por ejemplo si el documento se llama
11 SC00001.docx, se escribe SC00001. Después de escribir este nombre, presionar
“Aceptar”.
2 1 10. Lo siguiente que se mostrará será la opción de escoger la carpeta en la que
deseemos que se guarden todos los archivos y luego presionar la opción de
“Aceptar”.
1 2 11. El programa entrará en un modo de ejecución, se confirma que sigue corriendo
porque la ventana de “Microsoft Visual Basic para Aplicaciones” tendrá
una leyenda en el encabezado que dirá “[ejecutando]”.
12. Durante la ejecución del programa, aparecerá la siguiente advertencia.
Seleccionar “Sí”.
12 13. La ejecución del programa termina cuando aparece el siguiente cuadro de
información:
14. Finalmente, podremos ver los archivos con las transformaciones en la carpeta
seleccionada previamente.
5.4 Ejecuciones posteriores
Esta parte del manual considera que ya se ha importado la macro a Word.
1. Abrir un documento de Word, que será en el que se realizarán las
transformaciones; aparecerá un mensaje de advertencia que se mostrará cada
vez que abramos un documento.Sidesea utilizar el programa, dar clic en
“Habilitar contenido”.3
3Si desea conocer porque se produce una advertencia de seguridad, consulte el siguiente sitio web:
https://support.office.com/es-hn/article/Habilitar-o-deshabilitar-macros-en-documentos-de-Office7b4fdd2e-174f-47e2-9611-9efe4f860b12. 13 2. Presionar la combinación de teclas: “ALT” + “F11”, que abrirá una nueva
ventana “Microsoft Visual Basic para Aplicaciones”.
3. Presionar el botón de “Play” o “Ejecutar”.
14 4. Al dar clic sobre el botón de ejecución se repetirá la secuencia de acciones
descritas en la sección anterior, del paso 9 al13.
5.5 Eliminación del programa en Word
1. Abrir cualquier archivo de Word.
2. Presionar la combinación de teclas: “ALT”+ “F11”, que abrirá una nueva
ventana “Microsoft Visual Basic para Aplicaciones”.
3. Dar clic derecho sobre el panel izquierdo, en“AgraAD_02” y seleccionar la
opción “Quitar MacroLexico…”.Cuando aparecerá la advertencia,
seleccionar “No”.
1 2 15 4. Al realizar el paso anterior, se habrá eliminado la “MacroLexico”, se sabrá que
se ha efectuado porque no aparecerá el mensaje de advertencia de seguridad.
16