Saltar a contenido principal Saltar a navegación principal

Herramientas para el procesamiento de documentos digitales: aplicación a la construcción de corpus lingüísticos

Nicolás Martín Acosta Corin, programador computacional y experto en herramientas digitales, dictará el curso “Herramientas para el procesamiento de documentos digitales: aplicación a la construcción de corpus lingüísticos”. La actividad, con modalidad presencial, se desarrollará los días 08, 09 (10:00 a 13:00), 15 y 16 de septiembre (10:00 a 12:00) en la FFyL de la UNCuyo. Es organizada por el Proyecto SIIP 06/G009-T1 y la Secretaría de Extensión Unversitaria de la Facultad.

imagen Herramientas para el procesamiento de documentos digitales: aplicación a la construcción de corpus lingüísticos

Fundamentación

La construcción de corpus es una actividad fundamental para todas las investigaciones relacionadas con los estudios del lenguaje, ya que estos son una representación empírica de la manifestación de la capacidad lingüística de los usuarios de una o más lenguas. Se ha vuelto una característica obligatoria que los corpus tengan acceso digital (Sinclair, 2004). Esto implica un mayor trabajo en la recopilación y procesamiento de los documentos, pero aporta la posibilidad de contar con materiales de mayor extensión y volumen, además de poder consultarlos con mayor velocidad, precisión y filtro.

Debido a esta situación, el desarrollo de la lingüística computacional y de metodologías estadísticas para el estudio y el análisis de los fenómenos lingüísticos es fundamental para avanzar en la eficacia de los estudios en el campo del procesamiento de lenguaje natural (PLN). La interdisciplina entre las ciencias informáticas y la lingüística tradicional ha permitido extender los horizontes de las posibilidades que tienen los lingüistas, y otros profesionales afines, para estudiar fenómenos como la evolución diacrónica de las lenguas, la detección y descripción de neologismos, el estudio de las macroestructuras textuales, entre otros (Nazar, 2018). Por tanto, es necesario contar con una base elemental en este campo dentro de la formación de investigadores para las necesidades existentes en la actualidad en el los estudios lingüísticos.

El estudio de un lenguaje de programación orientado al procesamiento de contenido lingüístico es esencialmente útil como herramienta para el trabajo con corpus de pequeño, mediano y gran tamaño. “Perl” es un lenguaje de programación basado en scripting creado por el lingüista Larry Wall en el año 1987. El hecho de que sea de scripting implica que no debe dedicarse tiempo y recursos en la compilación de los programas. Este lenguaje fue creado para facilitar el trabajo con unidades lingüísticas, en un momento en que la mayoría de los lenguajes de programación se orientaban al trabajo con datos matemáticos. El desarrollo de Perl continúa en la actualidad, llegando a su séptima versión mayor.

 

Los objetivos

La actividad, destinada a docentes/estudiantes de Letras; docentes/estudiantes de Traductorado e interesados en las áreas de la lingüística computacional y de corpus, tiene como objetivos entender el proceso de construcción de un corpus lingüístico; adquirir los conocimientos para procesar documentos digitales de distintos formatos y conservar la integridad del contenido; aprender los fundamentos básicos del lenguaje de programación Perl, orientado al procesamiento de lenguaje natural (PLN); y desarrollar la capacidad para diseñar estrategias de procesamiento automatizado mediante la detección de regularidades.

 

Experto a cargo

Nicolás Martín Acosta Corin es Investigador asociado a @Proyecto EspaDA-UNCuyo, un corpus del discurso académico en español en construcción, perteneciente a la Universidad Nacional de Cuyo. Trabaja en el diseño digital del corpus y en el desarrollo de una interfaz web de consulta. También es Investigador Asociado a @Grupo Tecling, en el que desarrolla softwares de PLN como Estilector, Genom y Jaguar, en la Pontificia Universidad Católica de Valparaíso, Chile. Proyectos FONDECYT.

 

Aranceles e inscripción

Todos los interesados/as en participar de esta propuesta deberán registrarse e inscribirse en el enlace https://autogestion.ffyl.uncu.edu.ar/Login Para acceder al instructivo de registro e inscripción, hacer click en https://ffyl.uncuyo.edu.ar/upload/instructivo-registro-e-inscripcion.pdf

Para quienes requieran certificación, los aranceles tendrán un valor de $1.095 para Egresados, Docentes y Personal de Apoyo Académico; $750 para Alumnos, y $1.500 para Público en General. Para acceder al instructivo de pagos, Hacer click en https://ffyl.uncuyo.edu.ar/upload/instructivo-boton-de-pago.pdf

Para mayor información, podrán contactarse con formacionpermanente@ffyl.uncu.edu.ar

Destinatarios

Docentes/estudiantes de Letras; docentes/estudiantes de Traductorado e interesados en las áreas de la lingüística computacional y de corpus.

Inscripción

Todos los interesados/as en participar de esta propuesta deberán registrarse e inscribirse en el enlace https://autogestion.ffyl.uncu.edu.ar/Login Para acceder al instructivo de registro e inscripción, hacer click en https://ffyl.uncuyo.edu.ar/upload/instructivo-registro-e-inscripcion.pdf

Costos / Aranceles

Para quienes requieran certificación, los aranceles tendrán un valor de $1.095 para Egresados, Docentes y Personal de Apoyo Académico; $750 para Alumnos, y $1.500 para Público en General.

Informes y contacto

formacionpermanente@ffyl.uncu.edu.ar