Informatització del DECH

 

El «Grup de Lexicografia i Diacronia del Seminari» ha gaudit des de 1992 de diverses ajudes del Programa Sectorial de Promoción General del Conocimiento (DGICYT) per a la informatització del Diccionario crítico etimológico castellano e hispánico de J. Coromines i J. A. Pascual (n. de referència PB92-0599, PB95-0656, PB98-0884) i actualment  té una subvenció per al projecte “Etimología y documentación”, també relacionat amb la informatització de l'esmentat diccionari, i que pretén la creació d'un banc de dades diacròniques del lèxic de l'espanyol (n. de referència BFF2002-04071-C02-01).

El projecte consisteix a traslladar a suport informàtic les principals informacions etimològiques i històriques contingudes en aquest diccionari; això ha implicat un estudi profund de l'estructura interna de cada article per a la posterior creació d'una estructura estàndard capaç de recollir ordenadament les dades de cada entrada. Per a aquesta investigació s'ha utilitzat el tractament informàtic en bases de dades relacionals.

Dintre d'aquest projecte s'ha creat un banc de dades diacròniques i hispàniques que consisteix en diverses bases de dades que acumulen les dades procedents del Diccionari. Les diferents informacions es distribueixen en vuit bases de dades que es poden relacionar entre elles:

El projecte ha donat com a resultat una sèrie de treballs d'investigació, tesi i tesines. (Vegueu la llista en els apartats de publicacions i tesis doctorals llegides).

Les dades procedents de la informatització del Diccionario de J. Coromines i J. A. Pascual han estat complementades amb dades procedents d'altres fonts. S'han elaborat diverses bases de dades on s'apleguen informacions complementàries: 

 1.Base de Dades dels Préstecs del Català

Com a resultat de la tesi de Marta Prat, s'ha elaborat una base de dades de documentació dels préstecs del català (CD-ROM), una base de dades d'uns mil registres que conté tots aquells mots que apareixen en el Diccionario crítico etimológico castellano e hispánico procedents del català o en les que el català ha intervingut en el procés de transmissió al castellà.

En col·laboració amb Serena Pérez, de la Facultat d'Informàtica de la UAB, s'ha elaborat un programa d'interrogació per a aquesta base de dades. 

 2. Els mots compostos en el DCECH

Està en fase d'elaboració una base de dades complementària que conté els mots compostos del Diccionario crítico etimológico castellano e hispánico (5.600 registres), als quals s'afegeixen informacions de caràcter semàntic i documental. El treball es desenvolupa amb una beca de Formació del Personal Investigador concedida a C. Buenafuentes. 

3. Fonts citades en el Diccionario de Autoridades  

Com a resultat de la tesi de M. Freixas s’ha obtingut una base de dades en qual es cataloguen totes les fonts citades al Diccionario de Autoridades de la Real Academia Española (1726-1739), aquesta eina ha ajudat a la complementació de la base de dades obtinguda a partir de la informatització del DCECH.

També s’ha elaborat una base de dades de la informació documental (autoritats) del Diccionario de Autoridades, eina dissenyada amb la finalitat d’oferir dades significatives per a l’estudi del cànon de fonts  de repertori acadèmic.

4. Base de dades de complementació de les dades documentals del DCECH

Creació d’una base de dades de complementació de les dades documentals del DCECH que procedeixen de les diferents edicions del Diccionario de la Lengua Española de la Academia Española (DRAE), elaborada per C. Morales.

J. Coromines, en el procés d’elaboració del seu diccionari etimològic, no va poder disposar de totes les edicions del DRAE; quan utilitza aquesta font en la primera documentació d’una paraula, pot no proporcionar la primera edició exacta en què es documenta el mot.

La base de dades confronta les dades del DCECH amb les diferents edicions del DRAE. Cfr. Clavería i Morales (1999 -2000) i Morales (2002).

5. Base de dades de les paraules derivades en -ismo i en -ista

Es troba en procés d’elaboració una base de dades de les paraules derivades en -ismo i en -ista en el segle XIX. En aquesta es recullen les paraules derivades amb aquests sufixos i es complementen les dades etimològiques i documentals del DCECH amb el DRAE i altres fonts. El treball es desenvolupa amb una Beca de Formació de Personal Investigador concedida a L. Muñoz.

Campus d'excel·lència internacional U A B