Análisis de contenidos: procesos y herramientas

El análisis de contenido se refiere al análisis y la representación de las características internas del documento. Para la primera parte se realiza en primer lugar una lectura del documento para comprender el contenido del documento, tras lo cuál se pasa a analizar la información que hay. De éste análisis se seleccionará la información de más relevancia y se realizará una síntesis del documento. 

 

Hay diversos procesos que ayudan a representar al documento después de extraer la información. La clasificación permite representar al documento en relación a otros documentos y así facilitar la recuperación después. La indización es el proceso de extraer los términos más representativos del documento para su posterior recuperación.

 

Para la representación y posterior recuperación del contenido de un documento contamos con los llamados “lenguajes documentales”. Existen diferentes formas de clasificarlos: según el control del vocabulario tenemos lenguajes documentaleslibres y lenguajes documentales controlados; según la coordinación de los términos tenemos lenguajes documentales precoordinados y lenguajes documentales postcoordinados; según la estructura tenemos lenguajes documentales jerárquicos y lenguajes documentales combinatorios.

 

Así, podemos encontrar listas de encabezamientos de materias, sistemas de clasificación como la CDU (Clasificación Decimal Universal) o los tesauros. En los últimos tiempos, debido al cambio que ha sufrido Internet con el nacimiento de la Web Semántica, han surgido una serie de herramientas como son las ontologías, los tesauros enriquecidos, los mapas conceptuales o las folksonomías.

 

 Una opinión

Como siempre, llegamos a la parte más dura de todo el proceso, el análisis de contenido. En este caso, los profesionales deben estar muy bien formados y tener muy claro qué es lo que se está haciendo.

Para saber más... 

-Artículo.

-Descripciones.

 

 Practica, practica

Un tesauro, una lista de encabezamientos de materias, la CDU...¿Qué elegirías para una base de datos sobre ciencias de la documentación que tiene 15.000 registros?