La ciencia de la Wikipedia
La enciclopedia virtual como canal de comunicación pública de la ciencia
Wikipedia, «la enciclopedia libre que todo el mundo puede editar», es actualmente la quinta página web más visitada –solo superada por Google, YouTube, Facebook y Baidu–. La versión inglesa recibe más de 500 millones de visitantes únicos y tiene una media de unos 18.000 millones de páginas vistas cada mes. A diferencia de los otros grandes portales de Internet, Wikipedia no es propiedad de ninguna empresa ni de ninguna gran corporación multinacional. En términos estrictos es un «bien común» y todo su contenido se publica bajo la licencia Creative Commons, que permite a cualquier persona copiar, distribuir y modificar o adaptar sus contenidos de manera libre.
Existe una fundación sin ánimo de lucro, la Fundación Wikimedia, que da apoyo tanto a la Wikipedia como a sus proyectos «hermanos» (Wikidata, Wiktionary, Wikibooks, etc.). Este apoyo consiste, básicamente, en actividades de promoción y en el mantenimiento de la infraestructura técnica de servidores. La financiación para sustentar esta infraestructura se obtiene a partir de donaciones voluntarias. Hay que decir, sin embargo, que la Fundación Wikimedia no se encarga en absoluto de organizar o gestionar la tarea más importante y más intensiva de la enciclopedia virtual: la edición, revisión y mejora de sus artículos. Este trabajo, monumental, recae en manos de la inmensa comunidad de wikipedistas voluntarios formada por más de 65 millones de usuarios registrados, un número aún mayor de editores anónimos y, entre todos ellos, más de 300.000 personas que llegan a hacer más de diez ediciones al mes. Estas cifras de participación y las complejas dinámicas de interacción entre los usuarios han hecho que algunos autores vean Wikipedia como un verdadero «movimiento social» más que como una simple comunidad virtual (Konieczny, 2009) o como el mayor proyecto colectivo en la historia de la humanidad (Jemielniak, 2014).
La versión inglesa de Wikipedia tiene más de cinco millones de artículos, la española cerca de 1,3 y la catalana (la segunda en ser creada, casi al mismo tiempo que la alemana), poco más de medio millón; unas cifras que la sitúan muy por encima de cualquier otro proyecto enciclopédico anterior. Existen, de hecho, más de 290 versiones lingüísticas de la Wikipedia que suman en total más de 40 millones de artículos. Para muchas de estas lenguas Wikipedia se ha convertido en la primera enciclopedia que han tenido nunca.
Wikipedia como principal canal de comunicación pública de la ciencia
«Internet se ha convertido, para la mayoría de ciudadanos, en la principal fuente de información científica»
Diferentes estudios recientes sobre comunicación y percepción pública de la ciencia coinciden en señalar que Internet se ha convertido, para la mayoría de ciudadanos, en la principal fuente de información científica (Brossard y Scheufele, 2013; FECYT, 2012; National Science Board, 2012). En los últimos años, Internet ha sobrepasado en este terreno a los medios de comunicación tradicionales: prensa escrita, radio y televisión. Los datos de la encuesta de percepción social de la ciencia de la FECYT (2012) mostraban que Internet era la principal fuente de información científica para el público español –en concreto para el 40,9 % de los encuestados–. Por primera vez en España, Internet se situaba por encima de la televisión (31 %) y muy por encima del resto. Preguntados por el tipo de recursos en Internet que utilizan para obtener información científica, el 21,7 % manifestaban utilizar Wikipedia como fuente prioritaria. Solo blogs y redes sociales están por encima, pero, dado que tanto unos como otros engloban una gran diversidad de instancias, Wikipedia se convierte de hecho en la fuente singular más consultada y, por tanto, en el canal de comunicación pública de la ciencia más importante en la actualidad.
Análisis del contenido científico de Wikipedia
A pesar de este hecho indiscutible, las instituciones científicas (sociedades, centros de investigación, universidades…) viven de espaldas a esta realidad y concentran sus acciones de divulgación y comunicación pública en otros canales –en las redes sociales (privadas) en Internet, por ejemplo–. Incluso los estudiosos de la comunicación y la divulgación de la ciencia tampoco le han prestado mucha atención. La comunidad wikipedista, en cambio, empieza a ser consciente y, de hecho, el 2016 fue considerado el año de la ciencia por la Fundación Wikimedia con el objetivo de mejorar la cobertura de temas científicos en Wikipedia.
Es por todo ello que nuestro grupo de investigación ha desarrollado un proyecto con el objetivo de analizar el contenido científico de Wikipedia en su versión en castellano. Básicamente, hemos identificado el subgrupo de artículos que tratan cuestiones de ciencia y tecnología, para analizar la calidad, la distribución por ámbitos científicos, el perfil de los editores de este contenido y las prácticas de edición, así como el tratamiento de temas controvertidos.
El punto de partida ha sido, pues, identificar los artículos de ciencia y tecnología, una tarea muy compleja por diferentes motivos. Nosotros hemos optado por el siguiente procedimiento indirecto inspirado en el trabajo de Groves, Figuerola, Alonso y Quintanilla (2014). En primer lugar hemos utilizado el algoritmo Infomap para generar automáticamente comunidades temáticas entre todos los artículos de la Wikipedia, a partir de los análisis de los enlaces internos entre todos los artículos. En segundo lugar, se ha empleado la clasificación Unesco de ámbitos de conocimiento de seis dígitos para detectar en qué comunidades se encontraban los artículos –en caso de que los hubiese– con el mismo nombre. El conjunto de 975 comunidades resultante ha sido posteriormente analizado para eliminar repeticiones y dejar fuera comunidades con contenido mayoritariamente ajeno. El resultado final ha sido un corpus de 340 comunidades que engloban un total de 60.108 artículos. Eso representa un 5 % de los artículos aunque, a causa de las características restrictivas del procedimiento, es muy probable que el corpus total de artículos de ciencia y tecnología se acerque al 20 % del total; es decir, alrededor de 200.000 artículos en la versión castellana, 100.000 en la catalana y un millón en la inglesa. En cualquier caso, el estudio evidencia el enorme volumen de información científica, en diferentes idiomas, que Wikipedia pone al alcance de cualquier persona que disponga de conexión a la red.
Calidad y referencias bibliográficas
Uno de los hechos más sorprendentes de Wikipedia, especialmente si atendemos a su contenido científico y tecnológico, es que está hecha –escrita y editada– mayoritariamente por legos, es decir, por personas no expertas. De hecho, en la historia de los proyectos enciclopédicos, es la primera vez que se crea una iniciativa de este tipo al margen de la comunidad académica (O’Sullivan, 2011) y, curiosamente, parece la más exitosa desde varios puntos de vista.
«Wikipedia se encuentra en estado de permanente construcción y los artículos pueden estar en estadios muy diversos de elaboración»
El hecho de que los artículos de Wikipedia estén mayoritariamente escritos por legos y que la participación no dependa de ninguna clase de acreditación previa ha sido causa, tradicionalmente, de un cierto escepticismo y desconfianza respecto a su calidad y fiabilidad, particularmente en el entorno académico, aunque eso parece estar cambiando últimamente (Jemileniak y Aibar, 2016). Pero si ya es difícil acotar cuantitativamente el alcance del contenido científico de la Wikipedia, aún lo es más evaluar la calidad. Aparte de la enorme cantidad de artículos que la componen, Wikipedia se encuentra en estado de permanente construcción y los artículos pueden estar en estadios muy diversos de elaboración.
A pesar de eso, diferentes estudios han intentado aproximarse a la cuestión mediante varias estrategias. Entre estas hay que destacar la de Wedemeyer et al. (2008) que realiza un estudio comparativo entre algunos artículos científicos publicados en la Enciclopedia Británica y sus análogos en Wikipedia, o el de Brown (2011) sobre la calidad de los artículos de ciencia política en la Wikipedia inglesa. De hecho, el trabajo pionero en la comparación de la calidad de artículos científicos entre Wikipedia y la Británica es el artículo de Giles (2005). Finalmente, hay que mencionar el estudio de Nielsen (2007), pionero en el análisis de las citas y referencias a artículos científicos convencionales como indicador de calidad de los artículos de Wikipedia y el trabajo de Reich (2011) sobre el valor de las referencias en Wikipedia como índice de la reputación de los científicos. La mayoría de estos estudios sitúan la calidad de los artículos de la Wikipedia en una franja bastante alta y, en todo caso, en un nivel comparable y a menudo más alto que el de las enciclopedias tradicionales –en particular de la Británica, que acostumbra a tomarse como modelo de referencia en términos de calidad.
Nosotros hemos elegido el estudio de las referencias como estrategia indirecta para evaluar la calidad de los artículos y se han examinado de manera automática las referencias bibliográficas de todos los artículos del corpus. Hay que mencionar que recientemente la Fundación Wikimedia ha publicado un conjunto de datos que contiene todas las referencias a las publicaciones científicas extraídas de la Wikipedia en inglés (Halfaker y Taraborelli, 2015), pero no en el resto de versiones lingüísticas.
«La mayoría de las revistas científicas más importantes aparecen citadas en los artículos de Wikipedia»
El estudio de las referencias que incluyen los artículos muestra que los editores de Wikipedia utilizan mayormente fuentes altamente fiables para escribirlos. En particular se fundamentan a menudo en literatura científica primaria y no en fuentes secundarias o divulgativas. La mayoría de las revistas científicas más importantes aparecen citadas en los artículos de Wikipedia y, lo que es aún más sorprendente, lo hacen siguiendo la frecuencia y distribución propias del mundo de la publicación científica. En concreto el 73 % de las 1.160 revistas científicas más importantes –considerando las cinco revistas más destacadas en cada uno de los ámbitos de la ciencia– aparecen referenciadas.
Los artículos, además, cuentan con numerosas referencias y, por tanto, permiten al lector profundizar en los contenidos si lo desea. Hay que decir, sin embargo, que existe una gran variabilidad en el conjunto de artículos: desde los llamados «artículos de calidad» –muy extensos y completos– a los borradores, con unas pocas líneas de texto. Pero proporcionalmente hay tres veces más artículos de calidad en el corpus científico que en el resto.
Áreas de conocimiento
El estudio también analiza la presencia relativa de los artículos de Wikipedia en los diferentes campos de la ciencia y la tecnología, para compararla con la distribución de artículos en revistas científicas en bases de datos académicas estándar como Web of Science o Scopus. Curiosamente, la distribución temática en Wikipedia se corresponde fuertemente con la distribución de la producción científica global en las diferentes áreas de conocimiento. No solo eso, sino que las relaciones entre estas áreas –analizadas a partir de los vínculos internos entre los artículos– muestran una gran semejanza con las relaciones entre disciplinas que se dibujan a partir de los vínculos entre las publicaciones científicas.
Básicamente el mapa cognitivo de la ciencia en Wikipedia muestra un espacio sin un centro claro, con diferentes polos destacados: las ciencias de la vida, la física, la astronomía y la astrofísica, las ciencias de la tierra y, el más voluminoso, el de las ciencias tecnológicas (recordemos que se emplea la nomenclatura Unesco). Únicamente este último muestra una medida ligeramente superior a la de los mapas estándar de la producción científica.
Por todo ello, podemos concluir que la imagen de la ciencia que Wikipedia ofrece es, en resumen, muy ajustada a la ciencia contemporánea. El hecho de que Wikipedia esté editada principalmente por personas que no son científicos profesionales, al margen de que pueda generar errores esporádicos, no produce una imagen deformada de la ciencia.
Editores y temas controvertidos
También se han estudiado los perfiles de los editores y sus registros de edición. Aunque resulta difícil conocer su perfil –más allá de lo que puedan decir en su página de usuario– enviamos una pequeña encuesta a los cincuenta editores más frecuentes del corpus científico de la Wikipedia en castellano y obtuvimos 23 respuestas. Lo primero que hay que decir es que los 23 son hombres, algo congruente con el gran desequilibrio de género que otros estudios han mostrado entre los editores de Wikipedia. En general tienen un perfil educativo considerablemente superior a la media de población general y mayoritariamente tienen estudios universitarios (un 74 %). El 43 % son españoles y el resto, de otros países iberoamericanos. Por último, solo uno de los 23 manifiesta ser científico, dato coherente con estudios anteriores sobre la participación de científicos en Wikipedia (Aibar, Lladós, Minguillon, Meseguer y Lerga 2015; Reich, 2011).
Finalmente, se han analizado las páginas de discusión de los artículos más controvertidos del corpus, el espacio donde los editores de un artículo hablan y polemizan sobre los diversos aspectos que hay que mejorar. A partir del número de editores implicados y de la extensión de la página de discusión, se han identificado los artículos más controvertidos (como «Sensibilidad química múltiple», «Efecto invernadero» o «Alimento transgénico») y se han analizado las páginas de discusión.
Lo primero que hay que señalar es que muchas de las discusiones entre los editores son prácticamente indistinguibles de un intercambio habitual entre científicos. Los editores, aun no siendo científicos profesionales, son capaces de utilizar y analizar con profundidad técnica los artículos científicos más relevantes para el tema en cuestión; de hecho, a menudo se quejan de que muchos de estos artículos solo son accesibles mediante pago previo (Aibar, 2014). Los artículos reflejan normalmente el consenso existente –o la falta de este– en la comunidad científica y no presentan sesgos destacables.
Herramienta de gran potencial
Pese a la buena salud general de la ciencia en la Wikipedia en castellano –y teniendo en cuenta la necesidad de ampliar y mejorar el contenido existente– los científicos y científicas españolas están poco presentes en ella. Las referencias a artículos científicos con autoría española no son muy frecuentes y, de hecho, las instituciones científicas españolas (universidades y centros de investigación, principalmente) aparecen poco referenciadas si lo comparamos con países próximos del ámbito europeo. Por ejemplo, solo 14 de los 26 centros de investigación más importantes de España cuentan con una entrada propia en la Wikipedia en castellano.
«Wikipedia es ya la principal fuente de información científica para la población y todo indica que lo continuará siendo durante mucho tiempo»
Nuestro estudio pone de manifiesto el enorme potencial de Wikipedia en dos aspectos clave de la ciencia contemporánea. Por una parte, en la comunicación pública de la ciencia, Wikipedia es ya la principal fuente de información científica para la población y todo indica que lo continuará siendo durante mucho tiempo. Pero, además, el estudio muestra la enorme capacidad de enrolar a los ciudadanos de manera activa en el propio proceso de comunicación pública de la ciencia, y no solo como meros receptores pasivos. En este sentido Wikipedia se puede entender, también, como una plataforma sui generis de ciencia ciudadana.
«Los artículos de mayor calidad constituyen, a menudo, una excelente puerta de entrada o texto introductorio de gran utilidad para cualquier estudiante»
En segundo lugar, Wikipedia se muestra como una herramienta muy útil para la propia enseñanza de la ciencia, en todos los niveles educativos, incluyendo el universitario. Los artículos de mayor calidad constituyen, a menudo, una excelente puerta de entrada o texto introductorio de gran utilidad para cualquier estudiante. Y, en el caso de los universitarios, les ofrece la posibilidad de explorar la literatura científica primaria más relevante en cada caso. De hecho, estudios anteriores muestran que la mayoría de profesores universitarios consultan con frecuencia Wikipedia (Aibar et al., 2015).
Este hecho se complementa con la estrategia, que cada vez utilizan más profesores universitarios en todo el mundo, de diseñar actividades docentes en las que los estudiantes, individualmente o por grupos, crean o mejoran artículos relacionados con la temática del curso. Se trata, en todo caso, de una de las diversas formas posibles de implicar a la comunidad científica en la que, sin duda, se ha convertido en una de sus vías de comunicación más importantes con el resto de la sociedad.
AGRADECIMIENTOS
Este artículo forma parte del proyecto «Análisis del contenido científico de la Wikipedia española» financiado por la Fundación Española para la Ciencia y la Tecnología (FECYT), con referencia FCT-14-8269. El informe final del proyecto se puede descargar en http://hdl.handle.net/10609/51461.
REFERENCIAS
Aibar, E. (2014). Ciència oberta, encerclament digital i producció col·laborativa. En T. Iribarren, O. Gassol, & E. Aibar (Eds.), Cultura i tecnologia: els reptes de la producció cultural en l’era digital (pp. 99–120). Lleida: Punctum. Consultado en http://hdl.handle.net/10609/30983
Aibar, E., Lladós, J., Minguillon, J., Meseguer, A., & Lerga, M. (2015). Wikipedia at university: What faculty think and do about it. The Electronic Library, 33(4), 668–683.
Brossard, D., & Scheufele, D. A. (2013). Science, new media, and the public. Science, 339(6115), 40–41. doi: 10.1126/science.1232329
Brown, A. R. (2011). Wikipedia as a data source for political scientists: Accuracy and completeness of coverage. Political Science & Politics, 44(12), 339–343. doi: 10.1017/S1049096511000199
FECYT. (2012). Encuesta de percepción social de la ciencia. Consultado en https://icono.fecyt.es/informesypublicaciones/Documents/Percepci%C3%B3n%20Social_2012.pdf
Giles, J. (2005). Internet encyclopaedias go head to head. Nature, 438, 900–901. doi: 10.1038/438900a
Groves, T., Figuerola, C. G., Alonso, J. L., & Quintanilla, M. A. (2014). Wikipedia as a tool for introducing social concerns into science education. En C. P. Constantinou, N. Papadouris, & A. Hadjigeorgiou (Eds.), Science education research for evidence-based teaching and coherence in learning. Proceedings of the ESERA 2013 Conference (pp. 824–830).
Halfaker, A., & Taraborelli, D. (2015). Scholarly article citations in Wikipedia. Figshare. doi: 10.6084/m9.figshare.1299540
Jemielniak, D. (2014). Common knowledge? An ethnography of Wikipedia. Stanford, CA: Stanford University Press.
Jemielniak, D., & Aibar, E. (2016). Bridging the gap between Wikipedia and academia. Journal of the Association of Information Science and Technology, 67(7), 1773–1776. doi: 10.1002/asi.23691
Konieczny, P. (2009). Wikipedia: Community or social movement? Interface: A Journal for and about Social Movements, 1(2), 212–232.
National Science Board. (2012). Science and engineering indicators 2012. Arlington, VA: National Science Foundation.
Nielsen, F. (2007). Scientific citations in Wikipedia. First Monday, 12(8).
O’Sullivan, D. (2011). What is an encyclopedia? A brief historical overview from Pliny to Wikipedia. En G. Lovink, & N. Tkacz (Eds.), Critical point of view: A Wikipedia reader (pp. 34–49). Amsterdam: Institute of Network Cultures.
Reich, E. S. (2011). Online reputations: Best face forward. Nature, 473(7346), 138–139. doi: 10.1038/473138a
Wedemeyer, B., Yakubova, N., Kallenbach, J., Ekdahl, A., Lesko, L., Reed, E., & Schwartz, K. (2008, 17-19 de juliol). Quality of the science articles on the English Wikipedia: Preliminary results. Wikimania 2008, Alejandría (Egipto).