Nota 4 – Les anotacions del corpus de l’LSC

Actualment no hi ha cap programa informàtic que permeti analitzar els signes que apareixen en els enregistraments de forma directa, és a dir, partint de la imatge. Per aquest motiu, després de l’enregistrament és necessari sincronitzar les dades visuals amb una anotació, en format text, que permeti cercar qualsevol signe que aparegui en el material enregistrat. Per al nostre corpus vàrem decidir utilitzar el programa gratuït ELAN, creat pel Max Planck Institute for Psycholinguistics de Nimega (Països Baixos) (https://tla.mpi.nl/tools/tla-tools/elan/download/). Aquest programa informàtic permet segmentar cada un dels signes i anotar-hi una paraula en format text que l’identifica. Generalment, aquesta anotació en format text es correspon amb una paraula o més de la llengua oral més propera, que en el nostre projecte, és la llengua catalana. No obstant això, la tasca d’anotació no és ni de lluny senzilla. L’homogeneïtat i la coherència en les anotacions és molt important per a poder fer cerques correctes de signes. Per això vàrem dur a terme moltes sessions de discussió i d’establiment dels criteris d’anotació, que vàrem basar en els treballs previs realitzats en altres projectes de corpus en llengües de signes, com el de l’NGT i la BSL (llengües de signes dels Països Baixos, i britànica, respectivament). Aquí teniu els enllaços d’aquests projectes per si poden ser del vostre interès:

http://www.ru.nl/corpusngtuk/

http://www.bslcorpusproject.org/