Corpus de lengua de signos

corpus

 

Un corpus es una colección representativa de muestras de una lengua en formato legible por una máquina, que se utiliza para estudiar el tipo y la frecuencia de unidades lingüísticas. Además, constituye una representación amplia de la lengua y de sus variantes geográficas, de registros y generacionales. En cuanto a los corpus de lenguas de signos, se caracterizan por ser colecciones de vídeos anotados que contienen material escrito alineado con los datos principales en la correspondiente lengua de signos. También constituyen una muestra representativa de la lengua en cuestión.

El beneficio principal que presentan este tipo de corpus es preservar la lengua de signos como parte importante del patrimonio social y lingüístico de una sociedad. Es importante destacar que la iniciativa que presentamos aquí cuenta con el valioso precedente de proyectos similares de elaboración de corpus de otras lenguas de signos europeas que se encuentran ante carencias comparables. Así, en los Países Bajos, en el Reino Unido, en Australia, en Alemania, en Irlanda y en Italia ya se han constituido proyectos de corpus para las respectivas lenguas de signos del país y se encuentran en fase de construcción, anotación y finalización, según el caso. La experiencia acumulada en estos proyectos, a la cual tenemos acceso por las colaboraciones existentes con algunos de sus responsables, nos permite avanzar aún con más solidez y eficiencia en la constitución del corpus de la LSC sobre la base de criterios fiables.

Los corpus nos permiten recopilar las unidades léxicas de una lengua. De los corpus se pueden obtener las propiedades gramaticales de las unidades léxicas que contienen, puesto que nos aportan información sobre el contexto sintáctico, la fonología, la morfología, la semántica y la pragmática de esas unidades. Toda esta información se puede recoger en una base de datos léxica para clasificarla y organizarla. Algunos de los proyectos de corpus ya están suficientemente avanzados como para haber podido crear un enlace con una base de datos léxica. No todas las bases de datos muestran el mismo tipo de información, de forma que encontramos desde bases de datos que contienen la definición, la fonología, la morfología y hasta incluso aspectos pragmáticos de los signos, hasta aquellas que se encuentran en un estadio más inicial y solo muestran cómo se articula el signo y la glosa correspondiente.

-Corpus de la llengua de signes britànica (BSL)

-Corpus de la llengua de signes dels Països Baixos (NGT)

-Corpus de la llengua de signes australiana (AUSLAN)

-Corpus de la llengua de signes alemanya (DGS)

-Corpus de la llengua de signes de la Bèlgica francòfona (LSBF)

-Corpus de la llengua de signes polonesa (PJM)

-Bases de dades de la llengua de signes espanyola (LSE)

-Base de dades de la llengua de signes americana (ASL)