Informatización del Diccionario Crítico Etimológico Castellano e Hispánico de J. Corominas y J. A. Pascual

El Grupo de Lexicografía y Diacronía del Seminario ha obtenido desde 1992 de diversas ayudas del Programa Sectorial de Promoción General del Conocimiento (DGICYT) para la informatización del Diccionario crítico etimológico castellano e hispánico de J. Corominas y J. A. Pascual (n° de referencia PB92-0599, PB95-0656, PB98-0884) y actualmente tiene una subvención para el proyecto “Etimología y documentación”, también relacionado con la informatización del Diccionario, que pretende la creación de un banco de datos diacrónicos del léxico del español (nº de referencia BFF2002-04071-C02-01).

El proyecto consiste en trasladar a soporte informático las principales informaciones etimológicas e históricas contenidas en el Diccionario; esto ha implicado un estudio profundo de la estructura interna de cada artículo para la posterior creación de una estructura estándar capaz de recoger ordenadamente los datos de cada entrada. Para esta investigación se ha recurrido al tratamiento informático con bases de datos relacionales.

Dentro de este proyecto se ha creado un banco de datos diacrónicos e hispánicos integrado por diversas bases de datos que acumulan los datos procedentes del Diccionario. Las diferentes informaciones se distribuyen en ocho bases de datos que se pueden relacionar entre ellas.

 

 

 

 

 

 

 

 

 

 

 

El proyecto ha dado como resultado varios trabajos de investigación, tesis y tesinas (véase lista en el apartado de publicaciones y tesis doctorales leídas).

Los datos procedentes de la informatización del Diccionario de J. Corominas y J. A. Pascual se han complementado con informaciones procedentes de otras fuentes. Se han elaborado diversas bases de datos complementarias como las que se exponen a continuación:

 

1. Base de Datos de los Préstamos del Catalán

Como resultado de la tesis de Marta Prat, se ha elaborado una Base de documentación de los préstamos del Catalán (CD-ROM), una base de datos de unos mil registros que contiene todas aquellas voces que aparecen el Diccionario crítico etimológico castellano e hispánico como palabras procedentes del catalán o en las que esta lengua ha intervenido en el proceso de transmisión al castellano.

En colaboración con Serena Pérez, de la Facultad de Informática de la UAB, se ha elaborado un programa de interrogación para esta base de datos.

2. Los compuestos en el DECH

Está en fase de elaboración una base de datos complementaria  que contiene compuestos del Diccionario crítico etimológico castellano e hispánico (5600 registros), a los cuales se añade información de carácter semántico y documental. El trabajo se desarrolla con una beca de Formación de Personal Investigador concedida a C. Buenafuentes.

3. Fuentes citadas en el Diccionario de Autoridades

Como resultado de la tesis de M. Freixas, se ha obtenido una base de datos en la que se catalogan todas las fuentes citadas en el Diccionario de Autoridades de la Real Academia Española (1726-1739), la herramienta ha ayudado a la complementación de la base de datos de documentaciones obtenida a partir de la informatización del DCECH.

Se ha elaborado también una base de datos de la información documental (autoridades) del Diccionario de Autoridades, una herramienta diseñada con la finalidad de ofrecer datos significativos para el estudio del canon de fuentes del repertorio académico.

4. Base de datos de complementación de los datos documentales del DCECH

Creación de una base de datos de complementación de los datos documentales del DCECH que proceden de las distintas ediciones del Diccionario de la Lengua Española de la Academia Española (DRAE), elaborada por C. Morales.

J. Corominas, en el proceso de elaboración de su diccionario etimológico, no  pudo disponer de todas las ediciones del DRAE, por lo que, cuando utiliza esta fuente en la primera documentación de una palabra, puede no proporcionar la primera edición exacta en la que se documenta la voz.

La base de datos confronta los datos d el DCECH con la documentación aportada por las distintas ediciones del DRAE. Cfr. Clavería y Morales (1999-2000) y Morales (2002).

5. Base de datos de las palabras derivadas en -ismo e -ista

Se encuentra en proceso de elaboración una Base de datos de las palabras derivadas en -ismo e -ista en el siglo XIX. En ella se recogen las palabras derivadas con estos sufijos y se complementan los datos etimológicos y documentales del DCECH con el DRAE y otras fuentes. El trabajo se desarrolla con una Beca de Formación de Personal Investigador concedida a L. Muñoz.

Campus d'excel·lència internacional U A B