En diciembre del año pasado el Conacyt me avisó que mi proyecto de investigación conjunto con Clara Inés Ramírez del IISUE había recibido un importante monto de financiamiento para ser desarrollado a lo largo de los próximos tres años. Aunque nunca antes he hecho pública las características de un proyecto como este, más por omisión que por una decisión razonada, he decidido hacerlo ahora precisamente porque es un proyecto sobre Humanidades Digitales, que parte de la premisa de que la colaboración es relevante y que, por lo mismo, puede ser de interés para muchos.
Proyecto de investigación
Cuerpo, escritura y género. Marcadores para el análisis digital de textos.
Nuestra propuesta es utilizar una metodología desarrollada en el ámbito del cómputo, para aplicarla en la
investigación en las humanidades. En este sentido, el proyecto parte de una pregunta de investigación propia de las
humanidades: ¿cuáles son las diferencias de género en el discurso sobre el cuerpo de hombres y mujeres en el
mundo novohispano? Y a ella buscamos responder generando marcadores XML (tags), sobre la base del sistema TEI
Lite de la Text Encoding Iniciative (un estándar utilizado por la comunidad de investigación en humanidades digitales), para identificar, interpretar y recuperar automáticamente, al procesar digitalmente los documentos, las variantes de género en el discurso sobre el cuerpo en obras novohispanas. Nuestro corpus de investigación esta formado por dos colecciones académicas ya establecidas y en crecimiento: una sobre la escritura de las mujeres, desarrollada por el Seminario de escritos de Mujeres del Instituto de Investigaciones Sobre la Universidad y la Educación de la UNAM, y otra de textos astrológico/astronómicos escritos por hombres, desarrollado por la Biblioteca Digital del Pensamiento Novohispano, un proyecto de la Facultad de Filosofía y Letras de la UNAM, que en conjunto conforman un fondo inicial de 20 obras para su marcado y su estudio. El desarrollo del proyecto contempla cuatro etapas fundamentales. La primera es la generación de los marcadores con los cuales identificar en los textos las variantes de género en el discurso sobre el cuerpo. La segunda consiste, propiamente, en el marcado de los textos con las categorías creadas. En la tercera, los textos maracados son procesados para indexar automáticamente: a) Los pasajes en que se habla del cuerpo por género, b) Los términos de la retórica sobre el cuerpo por género y c) las partes del cuerpo a las que cada género alude. Finalmente, en la última etapa se sistematiza la información obtenida y se identifican los hallazgos tanto cualitativos como cuantitativos, relativos a la ocurrencia de ciertos términos. Los resultados obtenidos se presentaran en articulos individuales a lo largo del proyecto, y en la elaboración de un libro colectivo en la etapa final del mismo. La hipótesis general del proyecto es que la generación de marcas adecuadas y el procesamiento digital de los textos, ofrecen datos fundamentales para investigar en humanidades, pero sobre todo, permiten ampliar los propósitos y las dimensiones del campo de estudio y búsqueda, que las técnicas tradicionales de lectura de textos, no permitirían. En este sentido, para el caso de nuestra investigación, la creación de marcas para distinguir las diferencias entre las retoricas masculinas y femeninas sobre el cuerpo humano en los siglos XVI al XVIII, harán posible manejar un conjunto de cuerpos textuales amplios, que de otra forma difícilmente podríamos trabajar.
interesante propuesta, desde lo que llaman Las Humanidades Digiales, los felicitamos e invitamos a darnos mas pistas para motivarnos en estas formas de investigar por aqui en Venezuela. ¿ya comenzo el proyecto? ¿ya tienen avances?