El corpus de la LSC

En 2007, l’Institut d’Estudis Catalans, la Federació de Persones Sordes de Catalunya, la Universitat Pompeu Fabra, la Fundació Barcelona Media y Linguamón emprendieron una iniciativa de colaboración para crear un corpus de referencia de la LSC. Pero en aquel momento, la falta de financiación no permitió llevar a cabo el proyecto. En el 2012 el Institut d’Estudis Catalans ofreció la posibilidad de iniciar un primer proyecto de constitución de corpus con una fase preparatoria y una prueba piloto, que fue posible gracias al apoyo del Departamento de Política Lingüística de la Generalitat de Catalunya y a una subvención de la Obra Social “La Caixa”. Un año después de empezar el proyecto piloto se constató que el proyecto de corpus de la LSC era posible, con lo cual, el proyecto piloto se convirtió en el proyecto de corpus de la LSC. Desde entonces, y gracias a la continuación del apoyo del Departamento de Política Lingüística de la Generalitat de Catalunya y a la subvención de la Obra Social “La Caixa”, hemos podido grabar signantes de todo el territorio del dominio lingüístico de la LSC.

Los objetivos principales del Proyecto de Corpus de la LSC son los siguientes. En primer lugar, documentar el estado actual de la LSC mediante una muestra amplia y representativa de diferentes tipos de discurso signado. En segundo lugar, hacer una anotación básica y descriptiva y poner en línea el corpus como material accesible que puede ser utilizado con finalidades de investigación, educativas o de consulta por parte de los usuarios. En tercer lugar, ofrecer una herramienta útil para la investigación tanto teórica, ya que se tendrá acceso a un conjunto de datos anotados que permitirán hacer descripciones y análisis para conocer mejor la gramática y el léxico de la LSC, como aplicada, puesto que servirá como punto de referencia en la creación de diccionarios y bases de datos o en los programas de traducción automática. Este corpus será una contribución importante que aportará las bases para la estandarización de la LSC, tanto desde un punto de vista lingüístico, como de cara al establecimiento de unos criterios metodológicos compartidos, fijando unas convenciones de anotación.

Durante la etapa preparatoria se prepararon los materiales de elicitación necesarios, se especificaron los perfiles lingüísticos de signantes que se debía grabar con el objetivo que el corpus sea representativo, teniendo en cuenta aspectos como la edad, el sexo, la distribución geográfica, la escolarización, etc. Y se hizo un trabajo de campo para determinar los puntos de recogida de datos, a través de asociaciones y contactos personales dentro de la Comunidad Sorda. También se determinaron los criterios de anotación y los requisitos técnicos para la constitución del corpus, como por ejemplo el servidor, los programas de codificación, la interfaz web, etc. Además, se elaboró un plan de difusión e información del proyecto de corpus durante la ejecución, Finalmente, se elaboró un protocolo ético para la recogida, el procesamiento, almacenamiento y la distribución de los datos grabados.

El proceso de ejecución se dividió en tres fases. En la primera, para la recogida de los datos se determinó la ciudad o el pueblo de Cataluña donde se tenían que hacer las grabaciones. Se seleccionaron los signantes nativos y el entrevistador sordo, que utilizó los materiales de elicitación y guió los temas de conversación. La segunda fase consistió en la anotación del discurso signado en catalán escrito, mediante el programa ELAN. La tercera fase consiste en la revisión de las anotaciones y en la publicación de las grabaciones, conjuntamente con la anotación.