Gran corpus documental español de la Edad Media y de los siglos XVI y XVII

De Textos Hispánicos
Revisión de 14:44 15 feb 2015 por Cpsaez (Discusión | contribuciones)

(dif) ← Revisión anterior | Revisión actual (dif) | Revisión siguiente → (dif)
Saltar a: navegación, buscar

Gran corpus documental español de la Edad Media y de los siglos XVI y XVII BFF2001-1041

    Entidad financiadora: Ministerio de Ciencia y Tecnología
    Entidades participantes:  Universidad de Alcalá
    Duración: 2002 - 2005
    Investigador responsable: Pedro Sánchez-Prieto Borja
    Número de investigadores participantes: 6

El proyecto tenía como objetivo la preparación de un "Gran corpus documental español de la Edad Media y de los siglos XVI y XVII". El punto de partida lo constituía un corpus previo de 1500 documentos de diferentes archivos, de los cuales se contaba con facsímil, transcripción paleográfica y presentación crítica". Los objetivos del proyecto eran los siguientes:

  • Revisar los documentos ya transcritos.
  • Ampliar el corpus hasta 2400 documentos.
  • Completar la muestra preexistente con fondos de nuevos archivos que cubrieran, en la medida de lo posible, todo el espacio ocupado por el castellano peninsular antes de 1700 (Castilla y León, Asturias, Cantabria, País Vasco, Navarra, Aragón, La Rioja, Madrid, Castilla-La Mancha, Murcia y Andalucía en la regiones no bilingües (la inclusión del País Vasco se justifica porque para el período examinado la documentación está en castellano).
  • Preparar las transcripciones paleográficas y presentaciones críticas de de los documentos y en soporte electrónico los facsímiles.
  • Promover el examen de las tradiciones de escritura castellanas de la Edad Media, así como diversos estudios de historia lingüística.

La justificación estos objetivos está en el hecho de que a día de hoy falte una colección documental que comprenda toda la variedad geográfica del español, que abarque no sólo la Edad Media, como suele ser corriente en las colecciones documentales, sino también los siglos XVI y XVII, y que esté realizada con la metodología apropiada. Es evidente que la mera yuxtaposición de colecciones parciales, limitadas a un archivo o a varios de una misma zona, no resolvía esta carencia. Por ellos se entendió que era necesario elaborar un corpus amplio y representativo, y que pudiera ser, por su concepción, fácilmente ampliable.

De acuerdo con estos planteamientos, los resultados alcanzados, han sido los siguientes:

Se han revisado con los facsímiles las transcripciones de los 1500 documentos con los que ya se contaba, y, cuando ha sido necesario, se han cotejado con los documentos originales en los archivos. Ello ha eliminado un gran número de errores, inevitables en la fase de transcripción. Se consigue así el requisito principal de un corpus, la fiabilidad, sin la cual no puede ser útil a los investigadores.

Se ha completado el corpus con las transcripción de nuevas piezas, hasta un total que supera las 2400, y que proceden, entre otros, del Archivo Histórico Nacional, Archivo General de Simancas, Archivo de la Catedral de Toledo, Archivo de la Catedral de Jaén, Archivo Municipal de Sevilla, Archivo Municipal de Málaga, Archivo Municipal de Murcia, Archivo de la parroquia de San Gil de Molina de Aragón. De este modo, se han completado los "huecos" que había en el corpus del que se ha partía, y se ha logrado una representatividad geográfica amplia, que era otro de los objetivos primordiales del proyecto.

Un objetivo particular del corpus era lograr una representatividad sociolingüística lo más amplia posible. Este objetivo se ha logrado mediante la transcripción de un buen número de cartas privadas, que van desde influyentes personajes de la nobleza hasta personas poco instruidas (destacan, al respecto, las notas de abandono de niños recién nacidos procedentes del antiguo fondo de la Inclusa, conservadas en el Archivo Regional de la Comunidad de Madrid; dichas notas, por su interés especial, se han publicado aparte en la serie Textos para la historia del español, vol. IV).

Las transcripciones paleográficas y las presentaciones, acompañadas de una cabecera de presentación de cada documento, están ya preparadas para su publicación en papel. El Servicio de Publicaciones de la Universidad de Alcalá se ha comprometido a correr con un porcentaje máximo del 60% de los gastos de publicación. Actualmente se está negociando con una fundación privada la coedición de dichos fondos (en total, 5 volúmenes de aproximadamente 1000 páginas cada uno). Se está preparando también la difusión de todas las transcripciones en Internet.

Se ha obtenido fotografía digital de la mayor parte de los documentos (cerca de dos mil imágenes), y del resto se cuenta con microfilm.

Como la utilidad de los documentos es mayor si se cuenta con índices completos, dentro del proyecto María Simón Parra, becaria F.P.I. de la Universidad de Alcalá, ha elaborado una bases de datos de nombres de persona que permite saber quiénes aparecen en los documentos. Esta base de datos es de indudable interés histórico, pero también lingüístico, en concreto dentro del ámbito de la antroponimia, pues permite conocer: a) cuáles son los nombre más frecuentes en diferentes épocas y regiones y b) cómo evoluciona los procedimientos de denominación de la persona (uso del nombre de pila sólo, apellidos, topónimo de procedencia, nombre de oficio, etc.).

Se ha llevado a cabo una lematización completa de las presentaciones críticas de los documentos. Dada la variedad geográfica y cronológica del corpus, permitirá diversos estudios sobre la configuración histórica del léxico. También se han elaborado índices de frecuencias, directos e inversos.

Se ha abordado ya el estudio de los documentos del corpus, sobre todo desde la perspectiva de la historia de la escritura, y en particular de la relación entre paleografía, grafía y fonética. También se han estudiado otros aspectos gramaticales y léxicos. Los resultados se han presentado en diversos congresos, y aparecerán publicados en las respectivas actas. El corpus se ha utilizado ya para la elaboración de una tesis doctoral acerca de las tradiciones de escritura en Guadalajara, y en otra sobre la sintaxis del pronombre objeto en la Edad Media.

Resultados más relevantes alcanzados en el Proyecto

Este corpus documental, por su extensión y por la metodología con que está elaborado, se convertirá seguramente en una fuente primordial para los estudiosos de la Historia de la lengua española, pues los documentos presentan la obvia ventaja, frente a las fuentes literarias, de estar datados y de conocerse el lugar de procedencia. Esto permitirá comprender mejor el proceso evolutivo del español, con precisiones cronológicas y geográficas hasta ahora no logradas. Dado el criterio amplio para la selección de los documentos, podrán estudiarse diversos registros, y no sólo el formal, cancilleresco o notarial.

El proyecto ha servido para poner al alcance de los investigadores un corpus documental que permitirá avances significativos dentro de la dialectología histórica, pues de cada región y época se ha seleccionados documentos representativos, procurando que la distancia entre documentos no sea superior a diez años. De esta manera el corpus establece una tupida red que permite estudios que hasta ahora no eran fáciles de llevar a cabo. Por ejemplo, el examen de los documentos medievales de León y Palencia permite replantear algunas cuestiones históricas acerca de la frontera entre el castellano y el leonés oriental.

El corpus aporta también un material de enorme utilidad para los estudios de paleografía, dado el gran número de imágenes de documentos que incluye, permitirá una descripción exhaustiva de los usos locales de la escritura, monásticos y municipales, no sólo en Castilla, sino también en León y Aragón durante la Edad Media. De la misma manera, permitirá reconstruir la evolución de la escritura entre los siglos XVI y XVII, pues para esta época el corpus constituye el registro más representativo geográficamente para el ámbito peninsular

Una de las aportaciones de más peso es la que se deriva del examen directo de los fondos de diferentes archivos, en la medida en que ello puede contribuir a sacar a la luz documentos ignorados hasta ahora. Se ha de tener en cuenta que muchos archivos con fondos ricos no cuentan con un catálogo completo. En otros casos el trabajo en los archivos ha servido para corregir el catálogo existente. Por último, el corpus es útil para el conocimiento de la Historia general, para la Historia social de la escritura, y, sobre todo, para conocer la historia de las mentalidades. Dada la variedad de asuntos tratados y la diversidad de registros sociales de lso docuemntos, permite un mejor conocimiento de la vida cotidiana antes del siglo XVIII.

Aparte de los beneficios propiamente científicos, el corpus de documentos elaborado con este proyecto también tiene aplicaciones en la enseñanza de diversas materias, especialmente la Historia de la lengua española, la Dialectología y la Paleografía, y, de acuerdo con la idea del valor formativo del trabajo empírico, puede contribuir a la formación de nuevos investigadores.