Análisis de textos sobre salud
Métodos para investigar contenidos de los medios de comunicación
Normalmente, los investigadores sociales analizan los mensajes en los medios a través de la lectura y codificación. Este método conlleva mucho tiempo y restringe muchos estudios a muestras pequeñas. Hoy en día se encuentran disponibles ingentes cantidades de texto en formato electrónico, por lo que es fácil recopilar mucha información sobre la comunicación de la salud. Sin embargo, puede ser abrumador para un analista con recursos limitados que utilice métodos convencionales. En este artículo explicaré e ilustraré métodos para el análisis de textos de los medios de comunicación mediante herramientas especializadas (Wordsmith Tools y Wordstat). Estos programas aportan un resumen estadístico de las características clave de los textos para compararlos (observando, por ejemplo, los cambios a lo largo del tiempo) y seleccionar citas ilustrativas que ejemplifiquen las tendencias detectadas.
Palabras clave: textos de los medios de comunicación, análisis de datos, análisis asistido por ordenador, análisis de palabras clave, minería de textos.
El análisis de los mensajes sobre salud de los medios de comunicación de masas es un aspecto importante para la promoción de la salud. Dichos mensajes suelen estar inmersos en un mar de texto. Gran parte de estos textos están disponibles para los especialistas en comunicación, a veces mediante una simple descarga de Internet. Existen bases de datos de artículos de periódicos y revistas que facilitan la obtención de grandes muestras de material relevante para temas de salud. Por ejemplo, Nexis ofrece una base de datos indexada de artículos de medios impresos de todo el mundo en diversos idiomas. Es tan fácil como buscar artículos relacionados con un tema en particular y descargarlos. El reto, por lo tanto, es cómo analizar cantidades tan extensas de material.
«El análisis de los mensajes sobre salud de los medios de comunicación de masas es un aspecto importante para la promoción de la salud»
«El enfoque tradicional era recoger los materiales, leerlos y diseñar un esquema de codificación para identificar temas recurrentes. Hay programas como NVivo que facilitan este tipo de análisis. Esto se ve en un estudio que realicé con Hannah Parke sobre la imagen en los medios británicos de las medidas políticas que incentivan a la gente –con dinero, por ejemplo– a adoptar comportamientos más saludables (Parke, Ashcroft, Brown, Marteau y Seale, 2013). Queríamos comprobar si la cobertura mediática apoyaba o no estas medidas, qué tipo de argumentos se presentaban a favor y en contra y si estos diferían dependiendo del problema de salud que se tratara. Para ello diseñamos un esquema de codificación. A continuación, se muestran algunos ejemplos de los argumentos que codificamos.
Argumentos «en contra»:
• Mejor inversión
El dinero gastado en planes de incentivos se podría gastar mejor en otras cosas. Se incluyen menciones al coste de los planes y referencias al dinero del contribuyente.
«¿Se va a destinar el dinero del NHS [National Health Service] a pagar sesiones de baile a los gorditos cuando la gente necesita medicamentos contra el cáncer y mejores cuidados paliativos?» (Street Porter, 2008).
• Soborno
Los incentivos fuerzan a los pacientes a tomar decisiones que no tomarían en condiciones normales.
«La opción de recibir dinero por someterse a un tratamiento con un medicamento podría influir en las decisiones personales en relación a qué tratamientos son buenos para la gente» (Eaton, 2009).
Argumentos «a favor»:
• Beneficia a la sociedad
Beneficia a todos, no solo a quien recibe el incentivo.
«Si tener a la gente en tratamiento funciona, habría beneficios considerables para el público» (Hall, 2007).
• Es lo mejor para ellos
Los incentivos ayudan a la gente a hacer lo que más les conviene. Se incluyen menciones a los beneficios para la salud del individuo.
«Se intenta que este pago único ayude a las madres embarazadas a mantenerse en forma y sanas antes del parto» (South Wales Echo, 2009).
Entre otras cosas, observamos que una política que daba dinero a las embarazadas para gastar en comida saludable era más popular que una política que premiaba a la gente por perder peso con éxito. Como habíamos codificado los argumentos a favor y en contra que se ofrecían en cada caso, podíamos recuperar los más relevantes para el análisis.
Todo esto llevó una gran cantidad de tiempo. Los dos tuvimos que leer cada artículo, diseñar códigos, acordar cómo se aplicarían y modificarlos cuando encontrábamos ejemplos en los que discrepábamos o que no se ajustaban a los códigos elegidos. Pero solo se incluían unos cien artículos en el estudio, así que era manejable.
La mayoría de análisis de este tipo se hacen con muestras pequeñas por la cantidad de tiempo que requiere analizarlas. Esto restringe el alcance del estudio y, ahora que es fácil obtener grandes cantidades de textos de los medios de comunicación, resulta interesante llevar a cabo estudios mucho más grandes. Pero, ¿qué hacemos cuando un estudio implica miles de artículos y millones de palabras?
Analizar muestras grandes
Me enfrenté a este problema cuando quise analizar las publicaciones en foros de Internet de gente con cáncer de mama o de próstata, y el programa Wordsmith Tools resultó ser muy útil (Seale, 2005; 2006). Había más de un millón y medio de palabras para analizar. ¡No pretendía leerlas todas! Pero sí que quería analizarlas todas, no solo una submuestra.
Wordsmith Tools permite comparar la frecuencia de palabras en dos textos. Por ejemplo, las palabras más comunes en el texto sobre cáncer de próstata eran PSA (test de antígeno prostático específico [“Prostate Specific Antigen”, por sus siglas en inglés]) y brachytherapy (“braquiterapia”, un tratamiento para el cáncer de próstata). En el texto sobre cáncer de mama, palabras como breast (“pecho”) y tamoxifen (“tamoxifeno”) eran más comunes. Todo esto resultaba bastante previsible y poco sorprendente.
Pero algunas otras palabras apuntaban a diferencias entre hombres y mujeres en los aspectos de su experiencia que consideraban importantes al enfrentarse a una enfermedad grave. Los hombres mostraban una mayor contención emocional al final de sus mensajes. Por ejemplo, usaban más regards (“atentamente”) en lugar de X (representando un beso). Las mujeres se referían mucho más a menudo a otra gente además de a sí mismas en sus mensajes, con palabras como I (“yo”), me (“mí”), her (“a ella”), I’m (“yo soy”), women (“mujeres”), mum (“mamá”), they (“ellos”) y my (“mi”).
En este tipo de análisis es importante, por supuesto, investigar palabras concretas y asegurarse de que significan lo que uno cree (en un proceso conocido como desambiguación). El problema no se da con palabras como mastectomy (“mastectomía”) o brachytherapy (“braquiterapia”), pero ¿qué ocurre con X? ¿Se refiere a un beso o es parte de rayos X?
El programa permite ver el contexto real de cada palabra de forma individual (mediante las visualizaciones «Keyword in Context», [KWIC por sus siglas en inglés]). Generalmente conviene excluir palabras con múltiples significados. En esta colección de textos (o corpus, como se le conoce en ocasiones), la palabra X se usaba casi de forma exclusiva para referirse a besos, no a rayos X.
En un ensayo anterior (Seale y Charteris-Black, 2010) expliqué cómo pasar de las visualizaciones cuantitativas a la selección de ejemplos cualitativos que ilustren las diferencias clave entre los textos, y cómo se pueden hacer comparaciones más interesantes que simplemente mostrar que las mujeres son más emocionales y se centran más en la gente que los hombres. También he mostrado la utilidad de este procedimiento simple de Wordsmith Tools para generar resultados en toda una serie de temas relacionados con la salud, algunos de los cuales implican el análisis de textos de los medios de comunicación (Seale, 2008; Seale, Boden, Lowe, Steinberg y Williams, 2007; Seale y Charteris-Black, 2008a, b; Seale, Charteris-Black, Dumelow, Locock y Ziebland, 2008; Seale, Charteris-Black y Ziebland, 2006; Shepherd y Seale, 2010).
En lugar de repetirlo, quiero centrarme ahora en un enfoque más sofisticado para el análisis de textos asistido por ordenador. Para ello, me gustaría hablar de un estudio no publicado en el que estoy trabajando. Describe la cobertura en la prensa británica de los debates sobre la muerte asistida (por ejemplo la eutanasia o el suicidio asistido) a lo largo del tiempo, desde principios del siglo xx. Para ello, utilicé un programa llamado Wordstat. También usé Nexis para descargar los textos electrónicos de cinco periódicos nacionales (The Guardian, The Times, The Daily Mail, The Mail on Sunday y The Observer), así como del British Medical Journal. Los términos de búsqueda fueron los siguientes (! es un comodín para cualquier terminación, OR significa “o”): euthanasia OR assist! dying OR mercy killing OR right to die OR assist! suicid.
Los estudios existentes de la cobertura mediática de la muerte asistida se basan en muestras pequeñas de texto, debido a la gran cantidad de tiempo que requiere el tipo de análisis que eligen (normalmente un enfoque de codificación). Wordstat me permitió realizar un análisis de toda la cobertura de este tema (unos 4.340 artículos) en los periódicos y revistas científicas interesados desde que comenzó el debate alrededor de este tema.
La cobertura ha aumentado con el tiempo (salvo una disminución temporal durante la Segunda Guerra Mundial). Los debates modernos empezaron cerca de 1935, con la formación de la Voluntary Euthanasia Legalisation Society (“Sociedad para la Legalización de la Eutanasia Voluntaria”) y el primer intento del parlamento del Reino Unido de aprobar una ley que permitiera la eutanasia en ciertos casos.
El análisis en Wordstat implica la creación de un diccionario que identifica los temas que interesan al analista. Las categorías del diccionario contienen palabras y sintagmas que se pueden asignar sin ambigüedades a la categoría después de investigar cada palabra o frase en su contexto, si fuera necesario. Se pueden describir los pasos de la siguiente manera:
- Las palabras y sintagmas utilizados en los documentos se enumeran en orden descendiente por su puntuación tf-idf [frecuencia del término-frecuencia inversa del documento, medida utilizada para evaluar la importancia de una palabra en un corpus de texto]; esto es, una medida que indica qué términos son especialmente importantes para distinguir documentos.
- Se examinan las trescientas palabras o sintagmas más importantes en contexto y se seleccionan las que tienen un significado único más consistente para incluirlas en un diccionario definido por el usuario cuyas categorías agrupan términos con similitud semántica.
- Se añaden al diccionario otras palabras y sintagmas que aparecen en los textos en base a la similitud semántica y a una inspección más detallada del contexto.
- Se examina la distribución de las categorías del diccionario con la comparación de grupos.
En este estudio, el sintagma con la puntuación tf-idf más alta fue assisted suicide (“suicidio asistido”). Esta es la nueva terminología empleada en los debates sobre la muerte asistida. Anteriormente se hablaba de voluntary euthanasia (“eutanasia voluntaria”), expresión que podemos encontrar en muchas más ocasiones en textos anteriores y, por lo tanto, también tenía una puntuación tf-idf alta. La puntuación identifica las palabras o sintagmas en las que se debe centrar el analista, porque proporcionan la clave para entender las diferencias entre periódicos, o las tendencias a lo largo del tiempo, o cualquier comparación en la que esté interesado el analista.
El programa también utiliza un tesauro incorporado para identificar sinónimos (palabras con un significado similar). Los sinónimos de la palabra assisted (“asistida”), por ejemplo, incluyen aided, helped, supported y abetted. Se debe revisar cada sinónimo sugerido en contexto (desambiguación) antes de decidir si incluirlo o no en el diccionario. Podría ser, por ejemplo, que muchos de los usos de la palabra helped no estén relacionados con ayudar a alguien a morir, sino con ayudar a alguien en alguna otra cosa, por lo que no tiene sentido incluir esta palabra en una categoría del diccionario relacionada con ayudar a morir. Los sintagmas de dos o tres palabras son más útiles que las palabras sueltas, porque no suelen necesitar desambiguación tan a menudo.
Se pueden consultar algunos ejemplos de categorías de diccionario utilizadas en el proyecto en la figura 1. El diccionario completo contenía muchas otras categorías (se pueden consultar algunas más en la tabla 1), por lo que resulta una herramienta útil para comparar grupos de textos. En este caso, podemos comparar diferentes periódicos o realizar un seguimiento de los cambios en la popularidad de los temas a lo largo del tiempo. También podemos usar categorías para seleccionar ejemplos paradigmáticos de los periódicos.
La importancia de algunos temas ha disminuido con el tiempo. Las perspectivas cristianas, por ejemplo, aparecen menos en las discusiones de los periódicos, y los argumentos eugenésicos ya no están de moda. Algunos crecieron en popularidad y luego la perdieron, como por ejemplo nazi. Parece que los recuerdos sobre la eutanasia en el régimen nazi se van desvaneciendo.
Hoy en día, otros temas como los cuidados paliativos, los derechos humanos y el suicidio asistido enmarcan el debate sobre la muerte asistida más comúnmente. Los argumentos han cambiado, se han olvidado los viejos, o se consideran irrelevantes, y otros nuevos han aparecido de la mano tanto de los partidarios de la legalización como de los que se oponen a ella. En este punto, el programa informático ofrece un resumen estadístico de estos cambios.
Pero como estas visualizaciones estadísticas están conectadas en todo momento con el texto subyacente, este se puede recuperar para ofrecer citas ilustrativas y permitir un escrutinio más detallado y cualitativo de los argumentos clave. A continuación, mostraré uno de estos argumentos a lo largo del tiempo: los argumentos eugenésicos.
The Guardian informó el 5 de septiembre de 1935 de unas declaraciones del doctor T. W. Hill, subconsejero de sanidad de West Ham, quien, en una intervención en la escuela de verano de la New Health Society en Margate (Reino Unido), preguntó qué hacer con los miles de «imbéciles profundos de nuestras instituciones», y continuó:
Cuando vemos los horribles monstruos que mantenemos vivos bajo los cuidados de gente capacitada… nos vemos obligados a preguntarnos: ¿No puede encontrar nuestra civilización una forma de ocuparse de ellos? ¿No estamos extendiendo mucho nuestra humanidad? Tales criaturas estarían mejor fuera de nuestro camino. Estamos haciendo todo lo posible por asegurar la supervivencia del menos apto. Si queremos engendrar una raza vigorosa debemos revocar nuestras falsas nociones sobre la sacralidad de la vida humana. No necesitamos volver al cruel código de la selección natural, pero podemos lograr los mismos resultados sin dolor, rápidamente y sin crueldad, mediante la eutanasia científica.
(The Guardian, 1935)
Aquí se puede observar que el doctor Hill no tiene ningún problema en describir a la gente con discapacidades cognitivas o de otro tipo como «imbéciles» y «monstruos» y en matarlos en beneficio de la sociedad en su conjunto. En la década de 1930, la gente que apoyaba la eutanasia voluntaria solía apoyar también la eugenesia como forma de mejorar la sociedad. La experiencia de los nazis cambió todo esto, por lo que, después de la guerra, argumentos de ese tipo tomaron formas mucho más suaves, y la oposición fue recogida por los periodistas. Por ejemplo, el 30 de abril de 1969 The Guardian publicó una noticia sobre el doctor Kenneth Vickery, consejero de salud de Eastbourne (Reino Unido), que hablaba de la necesidad de empezar a pensar ahora en la creciente cantidad de gente mayor en la sociedad, que ya empezaban a saturar los servicios de salud y bienestar en zonas como la suya. No defendía la eutanasia, pero sí sugería que «las personas de más de una cierta edad no deberían mantenerse vivas gracias a ingenios médicos, sino recibir atención enfermera hasta el día que mueran» (Shearer, 1969). Un portavoz de Help the Aged (“Ayudemos a los ancianos”) dijo haber reaccionado a estas palabras con horror y repulsión.
Y hoy en día, la únicas personas que se atreven a proponer ideas tan impopulares públicamente son gente que busca notoriedad, como el novelista Martin Amis. Se publicó en 2010 que había sugerido implantar «cabinas de eutanasia» en las calles para que la gente mayor que se había convertido en una carga para la sociedad pudiera poner fin a su vida con «un martini y una medalla», conservando así los escasos recursos actuales y evitando una guerra civil entre los viejos y los jóvenes. Dignity in Dying (“Morir con dignidad”, nuevo nombre de la Sociedad por la Legalización de la Eutanasia Voluntaria) se ha distanciado claramente de esta postura en los medios de comunicación.
«Los métodos asistidos por ordenador proporcionan un resumen estadístico de las diferencias entre textos»
Métodos asistidos por ordenador
En definitiva, estos métodos, que hacen buen uso de la potencia de los ordenadores y de los progamas especializados, nos permiten analizar grandes cantidades de texto minimizando la influencia de las preferencias del analista, en comparación con el enfoque de la codificación, que conlleva mucho más tiempo. Proporcionan un resumen estadístico de las diferencias entre textos, lo que permite realizar todo tipo de comparaciones interesantes. Se ajustan a las condiciones actuales, puesto que ahora es muy sencillo recolectar grandes colecciones de texto electrónico en Internet pero resulta muy difícil analizarlas mediante los métodos convencionales que dependen de la lectura del texto.
Referencias
Eaton, L. (2009, 12 de octubre). Trial that pays patients to take antipsychotic drugs comes under attack. British Medical Journal, 339, b4202. doi: 10.1136/bmj.b4202
Hall, C. (2007, 27 de enero). NICE wants incentives for addicts days after refusing cancer drug. The Daily Telegraph, p. 8.
Parke, H., Ashcroft, R., Brown, R., Marteau, T. M., & Seale, C. (2013). Financial incentives to encourage healthy behaviour: an analysis of UK media coverage. Health Expectations, 16(3), 292–304. doi: 10.1111/j.1369-7625.2011.00719.x
Seale, C. (2005). Portrayals of treatment decision-making on popular breast and prostate cancer web sites. European Journal of Cancer Care, 14(2), 171–174. doi: 10.1111/j.1365-2354.2005.00544.x
Seale, C. (2006). Gender acommodation in online cancer support groups. Health, 10(3), 345–360. doi: 10.1177/1363459306064495
Seale, C. (2008). Mapping the field of medical sociology: A comparative analysis of journals. Sociology of Health and Illness, 30(5), 677–695. doi: 10.1111/j.1467-9566.2008.01090.x
Seale, C., Boden, S., Lowe, P., Steinberg, D., & Williams, S. (2007). Media constructions of sleep and sleep disorders: A study of UK national newspapers. Social Science and Medicine, 65(3), 418–430.
Seale, C., & Charteris-Black, J. (2008a). The interaction of class and gender in illness narratives. Sociology, 42(3), 453–469. doi: 10.1177/0038038508088835
Seale, C., & Charteris-Black, J. (2008b). The interaction of age and gender in illness narratives. Ageing and Society, 28(7), 1025–1043. doi: 10.1017/S0144686X0800737X
Seale, C., & Charteris-Black, J. (2010). Keyword analysis: a new tool for qualitative research. En I. L. Bourgeault, R. DeVries, & R. Dingwall (Eds.), The SAGE handbook of qualitative methods in health research (pp. 536–556). Londres: SAGE.
Seale, C., Charteris-Black, J., Dumelow, C., Locock, J., & Ziebland, S. (2008). The effect of joint interviewing on the performance of gender. Field Methods, 20, 107–128. doi: 10.1177/1525822X07313837
Seale, C., Charteris-Black, J., & Ziebland, S. (2006). Gender, cancer experience and internet use: A comparative keyword analysis of interviews and online cancer support groups. Social Science and Medicine, 62(10), 2577–2590. doi: 10.1016/j.socscimed.2005.11.016
Shearer, A. (1969, 30 de abril). Elderly should be «allowed to die». The Guardian, p. 5.
Shepherd, E., & Seale, C. (2010). Eating disorders in the media: The changing nature of newspaper reports. European Eating Disorders Review, 18(6), 486–495. Reimpresión en K. Eli, & S. Ulijaszek (Eds.) (2014), Obesity, eating disorders and the media (pp. 91–106). Farnham: Ashgate.
South Wales Echo (2009, 30 de abril). New grant for mums-to-be. South Wales Echo, p. 9.
Street-Porter, J. (2008, 13 de noviembre). What we really need to solve our obesity epidemic. Belfast Telegraph, p. 36.
The Guardian. (1935, 5 de septiembre). Problem of human suffering: Scientific euthanasia. Doctor urges its adoption. The Guardian, p. 6.