Documentación científica

Veíamos al final del tema anterior que la documentación científica es el principio y el final de la investigación (ya que se comienza leyendo el estado de la cuestión y se concluye publicando artículos). En este sentido la documentación científica es un asunto con muchas dimensiones: buscarla, encontrarla, entenderla, almacenarla, referenciarla, escribirla, publicarla, difundirla,... Muchos de estos aspectos se cubren en un curso aparte sobre "Competencias Informacionales" impartido por personal de la biblioteca universitaria, que son los auténticos especialistas en estas cuestiones. 
 
En este tema nos centraremos en una visión general de la documentación para centrarnos en sus aspectos más comunicativos.


Introducción a la documentación científica (con 4 lecturas)

En primer lugar hay muy distintos tipos de documentos (lectura 4) que juegan distintos papeles tanto en la función social de la investigación (lectura 4) como en el propio proceso de la creación científica (lectura 2). Pero de esos documentos hay uno que es la madre de todos los documentos: el artículo primario (lectura 1). Hay que saber qué es, qué estructura tiene y la razón histórica que ha llevado a ella (lectura 1). La historia de las revistas científicas (mucho antes de que adquirieran su estructura actual) es también un asunto interesante (lectura 3), así como la velocidad de crecimiento en la cantidad de documentos y la necesidad de disponer de sistemas que faciliten el acceso, las fuentes secundarias (eso ya se continuará en el curso sobre CI).


Lectura 1
Hay un libro, clásico ya, de Robert Day titulado "como escribir y publicar un artículo científico". De este libo hay que leer el prefacio y los 3 primeros capítulos (cada uno es de 4 hojas):
- Que es la escritura científica
- Origen histórico y estructura de los artículos
- Que es un artículo científico
En MiAulario están escaneados esos capítulos de la versión en inglés, pero descubro que está en la red, completo, en castellano, en pdf en varios lugares (por ejemplo aquí).

Lectura 2
El capítulo del libro de Ruy Pérez Montfort sobre las formas de difusión de los resultados de la investigación. Da una visión más amplia que la lectura anterior (por ejemplo incluye los congresos) y permite centrar mejor el tema. Pero creo que es mejor empezar por el anterior para asumir de una forma más rotunda algunas “verdades” sobre este tema.

Lectura 3
En el capítulo introductorio se encuentra una introducción una explicación de la historia de los documentos científicos (complementaria a la que se vio en la lectura 1), algunas cuantificaciones sobre volúmenes de información, etc. En resumen, se introduce el tema de la documentación científica.

Lectura 4

El libro en sí no nos encaja mucho ahora, pero tiene una introducción (donde está la figura adjunta) en la que analiza utilidades sociales de la actividad investigadora (la R, porque como los autore son franceses le llaman recherche) así como los distintos documentos que generan los investigadoras en cada una de esas líneas.


En resumen, hemos visto los documentos científicos desde cuatro puntos de vista:
- El papel que juegan en la producción del conocimiento científico (lectura 2)
- Documentos adecuados a las distintas funciones sociales de la investigación (lectura 4)
- El documento científico como mérito profesional del científico (lectura 1)

La comunicación posible

En la entrada anterior se analizaba la documentación científica desde distintos puntos de vista. El que más nos interesa para lo que queda del curso es el comunicativo. Desde el punto de vista del investigador (¡vosotros!) ¿qué documentos escribir?

En el siguiente vídeo nos hacen un repaso a las distintas posibilidades, listandos las características principales. (Lo prepararon en la Universidad de Lleida para un MOOC sobre estos temas):


El paper

En la entrada anterior sobre tipos de documentos deberíamos haber aprendido (en la lectura 1, en el capítulo 3) lo que es un "paper", el documento científico por excelencia. Para que no nos pase inadvertido repasamos aquí algunas cosas. Para empezar una definición que podemos encontrar en el libro de Day:

Es interesante ver que hace referencia a 4 características fundamentales que sirven para diferenciarlo de otras formas de comunicación. ¿Por qué una comunicación a un congreso no tiene la misma consideración que un paper? Hoy día la respuesta no es tan clara (de hecho hay disciplinas como ciencias de la computación en las que son los méritos más relevantes), pero tradicionalmente se consideraba que incumplían la disponibilidad (las actas de congreso no se encuentran necesariamente, hay muchas dificilísimas de encontrar). Además de las 4 características comentadas, también es importante el proceso de aceptación, la revisión por pares.

En lo que queda de este tema nos vamos a centrar en 3 cuestiones importantes:
1.- El sistema de aceptación de un paper, la revisión por pares (peer review)
2.- La estructura de los artículos (IMRAD)
3.- Características específicas de los artículos: referencias y gráficas

Revisión por pares, peer review


Como estudiantes estamos acostumbrados a que siempre hay alguien por encima que corrige nuestro trabajo. El profesor corrige los exámenes y los trabajos. Si estamos en desacuerdo con la corrección podemos solicitar un tribunal, la intervención del Decano (o Director de Escuela), etc. En cursos de doctorado uno a veces sospecha que el que te está corrigiendo no sabe más que tu. Esta situación es la norma cuando estamos hablando de la producción científica. Si la investigación científica consiste en generar conocimiento nuevo, ¿quién va a saber más como para corregirlo? Sin embargo tampoco parece que se deba publicar cualquier cosa (el móvil perpetuo u otras ocurrencias). El equilibrio al que se ha llegado históricamente en este asunto es el conocido como "revisión por pares" o "peer review", que lo revisen otros científicos que trabajan en temas próximos, personas del mismo "rango" que el evaluado pero temporalmente en posición de jueces.

 

Sobre este asunto podemos comenzar con un artículo periodístico (El País) (aquí en MiAulario, abierto)  donde se explica la idea general de forma muy divulgativa (es el párrafo anterior con declaraciones de científicos) o pasar directamente a la lectura de este texto de José R. Alonso, claro, conciso y con todo lo esencial. De ese texto está sacada la anterior ilustración, que muestra el proceso seguido por un artículo desde que se envía hasta que se publica. En la Wlikipedia se hace una descripción muy sistemática del proceso, con muchos enlaces, excesiva para lo que nos ocupa (salvo para quien quiera profundizar más).

A nadie le hace gracia que le rechacen un artículo sometido a este proceso de revisión. Algunos se enfadan muchísimo:


Tanto se enfada el personal que dispara el humor, no sólo filmando a su director de tesis en un arranque de ira (porque el del vídeo el el director de tesis de alguien ¿no?) sino que se preparan cartas de rechazo con las que contestar la carta de rechazo del editor (echadle un ojo, merece la pena, de verdad).

Pero no sólo es una cuestión de sentimientos personales, el sistema de revisión por pares tiene sus defectos, sin duda ninguna, y permanentemente están surgiendo ideas par modificarlo total o parcialmente. El uso de procedimientos análogos a los de las redes sociales es uno de moda en la actualidad: se publica todo y los lectores ya marcarán "me gusta" más veces en los mejores. Ver por ejemplo este ejemplo sobre blogs y este sobre twitter

De todos modos, no quiero concluir sin recordar que todos los problemas y defectos que centran siempre cualquier comentario sobre la revisión por pares, no invalidan el que sea un invento magnífico, parte fundamental del avance de las ciencias en las últimas décadas. 

------------- Resumen de fuentes -----------
Lectura 0 (intro obviable)  ¿Quén es capaz de poner nota a la ciencia? El Pais 5 de julio de 2013 (en MiAulario)
Lectura 1 este texto de José R. Alonso
Lectura 2 (sólo para hojear) artículo de la Wlikipedia
Lectura 3 (sólo para hojear) carta de rechazo a la carta de rechazo
Lectura 4 artículo sobre blogs vs. peer review
Lectura 5 artículo sobre twiter vs. peer review

La estructura de un paper (IMRAD)

El relato científico tiene una estructura muy bien definida. El objetivo de esta narración no es producir una lectura agradable, divertida e interesante como pueda serlo el de una novela policíaca. En el texto científico el asesino suele quedar descubierto en el mismo título, si no en el abstract seguro. En el capítulo 2  del libro de R. Day (AQUÍ en MiAulario, y AQUÍ en la red) se describe y explica este asunto de la estructura del artículo científico, que hasta tiene nombre: IMRAD. Esa estructura no es privativa del artículo, del formato, sino del relato científico en el que se quiere exponer qué se ha hecho, los resultados que se obtienen y el significado de todo ello.

Seguro que hay muchos otros productos en los que se utiliza esa estructura narrativa. A mi me llamó la atención reconocerla en el siguiente vídeo... aunque en realidad no es tan raro, es un vídeo que describe un trabajo científico:

Citas y referencias

¿Hay alguna diferencia entre las siguientes dos frases?

1.- Los alumnos que viven en entornos económicamente favorecidos obtienen mejores calificaciones.

2.- Los alumnos que viven en entornos económicamente favorecidos obtienen mejores calificaciones (Piaget, 1968; Jhonson et al. 1985; González y Herrero, 2007). (1)

Mucha. Lo primero es una afirmación del autor, sin más fundamento que el conocimiento y/o opinión del mismo, imposible de comprobar y con la credibilidad el autor como único aval. Lo segundo es una afirmación del autor fundada en conocimiento científico de otras personas, apoyada por los estudios que se han hecho ya y que se pueden comprobar para verificar el grado de veracidad de la afirmación.

Uno de los elementos clave de la escritura académica, de los documentos científicos, son las referencias. En el texto que estamos leyendo el autor aporta algo nuevo, sin duda, pero esa nueva pieza del puzle encaja con otras muchas que ya estaban en el tablero, cosa que sabemos gracias a las referencias.

Esta es la importancia esencial de las referencias en los trabajos científicos. Sin embargo, en tiempo más recientes, han adquirido otra dimensión... cuando se las mira del otro lado. Si un trabajo hace una contribución importante será muy citado en el futuro. Así pues se ha establecido el número de citas como un indicador de la calidad de un trabajo (y por extensión del autor, de la institución en que trabaja, de la revista, etc.). Desde el punto de vista de la comunicación solo nos interesa la primera cuestión.

Sobre esta cuestión de las citas y referencias hay muchas cuestiones sobre las que profundizar, por ejemplo:
- En qué se diferencias realmente cita y referencia (¿y bibliografía?)
- Para qué se incluye una referencia
- Qué tipo de informaciones (documentos) se pueden citar, ¿hay alguno que no?
- Cómo confeccionar las referencias formalmente (normativa, estilos, ...)

Hay muchas guías sobre estas cuestiones, especialmente sobre los aspectos técnicos y formales (ver por ejemplo 1, 2). También es importante decir que los gestores de referencias están cambiando mucho el panorama de recopilar y formatear referencias.

--------------
(1) Esas referencias son falsas, inventadas para el ejemplo (que es muy lejano a mi campo de especialización). Eso si, he tomado un nombre conocido en el campo de la educación, uno que suena americano y uno más local y reciente. Si existieran, solo con ver apellidos y fechas ya nos da una idea de la solidez del argumento: clásico, trabajado en distintos contextos culturales y refrendado recientemente.

Gráficas (I)

En un artículo científico hay algunos elementos muy específicos más allá del texto y el estilo literario o su estructura (de la que ya hemos hablado). Por ejemplo las referencias (vistas en la entrada anterior) y las gráficas. Vamos con estas últimas.

Esta figura, con su obviedad autoreferencial, está generada como un chiste. De hecho procede de un blog, cerrado ya, donde el autor publicaba chistes- gráfica, como este, uno tras otro sin texto.

Las gráficas son elaboraciones construidas para hacer directamente visible información cuantitativa. Se convierten números en imágenes diréctamente percibibles por el sentido de la vista y que transmiten (cuando están bien hechas) la información que contenían los números pero prescindiendo de ellos. Para conseguir ese propósito se utilizan "metáforas visuales", un concepto que puede resultar difícil y abstracto pero que se hace obvio en la tarta de la figura. Todas las gráficas de tarta son una metáfora de una tarta real como esta (o como esta otra).

El problema de hacer perceptible de maneras intuitivas, o casi, conjuntos de datos es toda una disciplina académica denominada "visualización". Es sorprendente el desconocimiento general sobre esta cuestión incluso entre los que utilizamos gráficas a menudo. Las gráficas forman parte de un lenguaje gráfico, sobre el que recibimos una nula formación. No como ocurre con el lenguaje verbal, sobre el que cursamos asignaturas a lo largo de toda la enseñanza obligatoria.

Para asomarse un poco a esa disciplina, algunos enlaces (un poco viejos, pero que no han perdido actualidad:
  • Un tutorial breve y practicón, pero preciso: http://www.alzado.org/think/graficos.html
  • La página personal de Yuri Engelhardt: http://www.yuriweb.com/
  • Galería de la Visualización de Datos (en inglés). Un sitio donde aprender mucho a partir de eajemplos sobre lo bueno y lo malo.
  • Para profundizar en la influencia de la percepciónen en la visualización, la frontera con la psicología: http://www.csc.ncsu.edu/faculty/healey/PP/index.html
  • Eduard Tuftee, pionero y profeta de la visualización y en particular de las gráficas: http://www.edwardtufte.com/tufte/index
Y un libro (pdf libre) que escribí sobre gráficas: "Gramática de las gráficas, pistas para mejorar tus representaciones de datos.

---------------------------------------------------------------------------------------
Bajando a cosas concretas, más cortas y aplicadas, un decálogo:

Un artículo interesante y práctico. Con 10 ideas sencillas, cada una bien explicada e ilustrada con figuras claras. Está en libre acceso AQUÍ. La introducción y la lista de las reglas es:


Scientific visualization is classically defined as the process of graphically displaying scientific data. However, this process is far from direct or automatic. There are so many different ways to represent the same data: scatter plots, linear plots, bar plots, and pie charts, to name just a few. Furthermore, the same data, using the same type of plot, may be perceived very differently depending on who is looking at the figure. A more accurate definition for scientific visualization would be a graphical interface between people and data. In this short article, we do not pretend to explain everything about this interface; rather, see [1], [2] for introductory work. Instead we aim to provide a basic set of rules to improve figure design and to explain some of the common pitfalls.

Rule 1: Know Your Audience
Rule 2: Identify Your Message
Rule 3: Adapt the Figure to the Support Medium
Rule 4: Captions Are Not Optional
Rule 5: Do Not Trust the Defaults
Rule 6: Use Color Effectively
Rule 7: Do Not Mislead the Reader
Rule 8: Avoid “Chartjunk”
Rule 9: Message Trumps Beauty
Rule 10: Get the Right Tool

Gráficas (II). Vídeos

En la entrada anterior hay información más que suficiente, pero si alguien quiere entretenerse un poco más con eso de la visualización de datos, a continuación hay 4 vídeos muy informativos y agradables:

El poder de la visualización de datos en menos de 2 minutos:



Versión sencilla de gráfica como representación de una correlación:



Los datos son como petróleo. Los datos son como el suelo, fértil y capaz de dar una inmensa producción. En inglés el enlace entre ambas metáforas es mucho más bonito: oil, soil. La importancia de los datos para generar una imagen coherente de los problemas, la necesidad de poner esos datos en relación para que seamos capaces de comprenderlos con propiedad. La importancia de la percepción visual como mecanismo de acceso a grandes cantidades de datos contextualizados.

Aunque el tema esté tratado en la charla de una forma general, desde una perspectiva periodística, al observarlo desde el punto de vista científico hay dos cuestiones inexcusables: (1) los datos son la materia prima de todo y (2) su visualización revela las relaciones entre ellos. A la vista de esto hacer ciencia se puede prácticamente resumir en obtener datos y representarlos (en una aproximación excesivamente minimalista, pero sugerente).


No es difícil encontrar datos, datos sobre casi cualquier cosa. El INE tiene montones, así como su equivalente europeo, entre otros muchos lugares. Sabiendo escoger los adecuados se puede profundizar mucho en cuestiones aparentemente triviales (como hacen habitualmente en WonkaPistas o En Silicio). Pero se puede ir más allá. GAPMINDER.ORG ha desarrollado una base de datos socioeconómicos junto con una herramienta de visualización de los mismos impresionante. De una forma bastante intuitiva, los gráficos que se generan incorporan un montón de información. El usuario puede elegir los datos que representar, cómo quiere hacerlo,... fascinante. Además es conocimiento libre que cada uno puede explorar a su gusto. Para comprender su potencia nada mejor que una conferencia del padre intelectual de la criatura, Hans Rosling. (Además de la forma, el contenido merece mucho la pena los 20 minutos que dura, aunque se aleje un poco del las ciencias que nos ocupan.