Corpus de llengües de signes

corpus

 

Un corpus és una col·lecció representativa de mostres d’una llengua en format llegible per una màquina, que s’utilitza per a estudiar el tipus i la freqüència d’unitats lingüístiques. A més, constitueix una representació àmplia de la llengua i de les seves varietats geogràfiques, de registres i generacionals. Quant als corpus de llengües de signes, es caracteritzen per ser col·leccions de vídeos anotats que contenen material escrit alineat amb les dades principals en la corresponent llengua de signes. També constitueixen una mostra representativa de la llengua en qüestió.

El benefici principal que aquests tipus de corpus presenten és preservar la llengua de signes com a part important del patrimoni social i lingüístic d’una societat. És important destacar que la iniciativa que presentem aquí compta amb el valuós precedent de projectes semblants d’elaboració de corpus d’altres llengües de signes europees que es troben davant de mancances comparables. Així, als Països Baixos, al Regne Unit, a Austràlia, a Alemanya, a Irlanda i a Itàlia ja s’han constituït projectes de corpus per a les respectives llengües de signes del país i es troben en fase de construcció, anotació i finalització, segons el cas. L’experiència acumulada en aquests projectes, a la qual tenim accés per les col·laboracions existents amb alguns dels seus responsables, ens permet avançar encara amb més solidesa i eficiència en la constitució del corpus de la LSC sobre la base de criteris fiables.

https:://youtu.be/ZM_eFbofq9Q

Els corpus ens permeten recollir les unitats lèxiques d’una llengua. Del corpus podem obtenir les propietats gramaticals de les unitats lèxiques que hi apareixen, ja que ens aporta informació sobre el context sintàctic, la fonologia, la morfologia, la semàntica i la pragmàtica d’aquestes unitats. Tota aquesta informació es pot recollir en una base de dades lèxica per classificar-la i organitzar-la. Alguns dels projectes de corpus ja estan prou avançats com per haver-ne pogut crear un enllaç a una base de dades lèxica. No totes les bases de dades mostren el mateix tipus d’informació, de manera que trobem des d’aquelles que contenen la definició, la fonologia, la morfologia i fins i tot aspectes pragmàtics dels signes, fins aquelles que es troben en un estadi més inicial i només mostren com s’articula el signe i la glossa corresponent.

-Corpus de la llengua de signes britànica (BSL)

-Corpus de la llengua de signes dels Països Baixos (NGT)

-Corpus de la llengua de signes australiana (AUSLAN)

-Corpus de la llengua de signes alemanya (DGS)

-Corpus de la llengua de signes de la Bèlgica francòfona (LSBF)

-Corpus de la llengua de signes polonesa (PJM)

-Bases de dades de la llengua de signes espanyola (LSE)

-Base de dades de la llengua de signes americana (ASL)