Corpus de documentos españoles anteriores a 1900 (CODEA+ 2020), FFI1017-82770-P

De Textos Hispánicos
Saltar a: navegación, buscar

El "Corpus de Documentos Españoles Anteriores a 1800" (CODEA+ 2015) <http://www.corpuscodea.es> está integrado actualmente (antes del proyecto) por transcripciones directas de 2500 documentos archivísticos peninsulares desde los orígenes del español al s. XVIII. El presente proyecto tiene por objeto llevar el Corpus (CODEA+ 2015) hasta el estadio CODEA+ 2020. Esta etapa supondrá un avance en los siguientes aspectos, entre otros:

  • Se incorporarán 1500 nuevos documentos, hasta alcanzar el número total de 4000.
  • Se ampliará el arco temporal del corpus, que pasará a incluir el siglo XIX.
  • Se transcribirán documentos correspondientes a períodos y provincias ya representados, pero escasamente, en el corpus.
  • Se mejorará la representación de escriptores no profesionales y mujeres.
  • Se incorporará tecnología de web semántica.
  • Se lematizará por completo el corpus.
  • Se mejorará la cabecera, con elementos como regesto en inglés y origen social del escriptor.
  • Se incorporará audio de una selección de documentos del corpus.