Fiabilidad Test-Retest y Validez Diagnostica

International Journal of Cultic Studies Volume 3, 2012, 35-48

Fiabilidad Test-Retest y Validez Diagnóstica de la Escala de Abuso Psicológico en Grupo (GPA-S)

Carmen Almendros

José Antonio Carrobles

Álvaro Rodríguez-Carballeira

Manuel Gámez-Guadix

Omar Saldaña

Rubén García-Sánchez

Noelia Salazar

Universidad Autónoma de Madrid;

Universidad de Barcelona;

Universidad de Deusto

Resumen

Las propiedades psicométricas preliminares de la versión española de la escala Group Psychological Abuse Scale (GPA) (Chambers, Langone, Dole y Grice, 1994) fueron examinadas anteriormente en Almendros, Carrobles, Rodríguez-Carballeira y Jansà (2004). El presente trabajo tiene por objeto ampliar (fiabilidad test-retest y validez diagnóstica) los datos apuntados por los autores para la adaptación del instrumento, que se limitaron a proporcionar datos sobre la estructura factorial y la consistencia interna de la GPA-S, con una muestra de 101 personas auto-identificadas como ex-miembros de grupos de manipulación psicológica diversos, así como proporcionar datos normativos de la GPA-S para la población española. Los resultados muestran una adecuada estabilidad temporal de la escala global y subescalas. Se establece un punto de corte de 81 para la GPA-S, de modo que las puntuaciones por encima de 80 en la escala global indican que el grupo es considerado abusivo. Se aportan nuevas evidencias empíricas de fiabilidad y validez para hacer accesible el instrumento permitiendo profundizar en el estudio del abuso psicológico con un interés investigador y clínico.

Palabras clave: abuso psicológico, grupos de manipulación psicológica, sectas, nuevos movimientos religiosos.

Abstract

Test-retest reliability and diagnostic validity of the Escala de Abuso Psicológico en Grupo (GPA-S). Almendros, Carrobles, Rodríguez-Carballeira and Jansà (2004) examined the preliminary psychometric properties of the Spanish version of the Group Psychological Abuse Scale (GPA) (Chambers, Langone, Dole & Grice, 1994). The present work expands (test-retest reliability and diagnostic validity) the data given by the authors for the adaptation of the instrument (factorial structure and internal consistency), with a sample of 101 self-identified former members of manipulative groups, as well as provides normative data for the Spanish population for the GPA-S. Results endorse temporal stability of the global scale and subscales. A cut-off score of 81 is established for the GPA-S, so that scores above 80 in the global scale indicate that the group is considered abusive. New empirical evidences of reliability and validity are provided so as to make the instrument appropriate for its use in Spain, thoroughly interesting both for research and clinical purposes.

Keywords: psychological abuse, psychologically manipulative groups, cults, new religious movements.

Introducción

El estudio del abuso psicológico, en general, y el de su particular manifestación a través de los grupos de manipulación psicológica (GMP), coloquialmente denominados “sectas”, no sólo constituye un fenómeno de gran actualidad, sino, sobre todo, de gran relevancia, por las múltiples facetas y modos de expresión del mismo a través de campos tan variados como el político, el religioso, el esotérico, el psicoterapéutico y otros.

A pesar de la importancia del tema, no son, sin embargo, tan abundantes las investigaciones empíricas realizadas sobre el fenómeno de las “sectas” o del abuso psicológico sectario, limitándose en gran medida los estudios existentes a encuestas estadísticas, a observaciones más o menos planificadas y a estudios clínicos o terapéuticos en su mayor parte no sistemáticos.

La Group Psychological Abuse Scale (GPA) (Chambers, Langone, Dole y Grice, 1994) fue la primera medida derivada empíricamente (Gasde y Block, 1998) que caracterizó los contextos grupales en función de la variedad y extensión del abuso psicológico. Aunque con posterioridad se han desarrollado otros instrumentos que abordan el abuso psicológico o conceptos relacionados con el mismo (Bohm y Alison, 2001; Winocur, Whitney, Sorensen, Vaughn y Foy, 1997; Wolfson, 2002), la escala GPA fue la que contó con unas mejores condiciones metodológicas y la que con mayor frecuencia es empleada tanto a nivel investigador (p.ej.: Chambers, Langone y Malinoski, 1996) como clínico (Martin, Almendros, Burks y Carrobles, 2004).

La GPA pregunta sobre actos o acontecimientos específicos no pretendiendo medir las actitudes de los participantes hacia las prácticas abusivas ni las causas o consecuencias de dicho abuso (Almendros, Gámez-Guadix, Carrobles y Rodríguez-Carballeira, 2011). La versión original en inglés de la GPA consta de cuatro subescalas: Acatamiento/Sumisión, Explotación, Control Mental y Dependencia Ansiosa, formada cada una por 7 ítems codificados en una escala Likert de 5 puntos (1= nada característico a 5 = totalmente característico). El rango posible para cada subescala original es de 7-35, siendo el rango para la medida global de 28-140. Las puntuaciones por encima del punto medio aritmético (21 para cada subescala y 84 para la escala global) son consideradas positivas, indicando que el participante percibe el grupo como abusivo. Los coeficientes de fiabilidad identificados en el estudio original oscilaron entre 0,70 para la subescala Control Mental y 0,81 para la de Sumisión.

Almendros et al. (2004) propusieron una versión española (GPA-S) del instrumento, a la que llegaron empleando una metodología de traducción y retrotraducción y tomando las cautelas metodológicas recomendadas para tratar de asegurar la equivalencia conceptual de la escala con la versión original (Hambleton, 1994; Hambleton, 1996; Muñiz y Hambleton, 2000). Los autores encontraron una estructura factorial compuesta de tres subescalas: Sumisión, Control Mental y Explotación. Según los autores, una parte esencial de la subescala Dependencia Ansiosa, que desaparece en la versión española, pasa a formar parte de la subescala Sumisión que, en la versión española, contiene elementos propios del acatamiento y la obediencia a una figura de autoridad (líder/es o grupo), así como de dependencia hacia la misma. La consistencia interna informada en dicho trabajo presentó valores entre 0,74 para la subescala Control Mental y 0,86 para la de Sumisión. En una revisión posterior con una muestra ampliada, Almendros (2006) y Almendros, Carrobles, Rodríguez-Carballeira y Jansà (2007), sugieren modificaciones sobre la estructura interna de la GPA-S, de modo que los ítems 14 (Relaciones íntimas dictadas) y 26 (Líderes raramente critican miembros), asignados preliminarmente al factor Explotación, se desplazan al factor Sumisión (peso factorial: 0,70 frente a -0,24) y el factor Control Mental (0,46 frente a 0,26) respectivamente, coincidiendo la nueva asignación de ambos ítems con la factorialización de la escala original (Almendros, 2006). También proponen la recuperación del ítem 5, que fue descartado de la versión preliminar por su mal funcionamiento con el resto de ítems que componen la escala, que es asignado a la subescala Explotación (peso factorial: 0,41). Finalmente, señalan valores de correlación ítem-total bajos para el ítem 1 (comportamiento sexual no dictado), tanto en relación con la escala global (rj(x-j) = 0,11) como con la subescala a la que se adscribe (rj(x-j) = 0,08). Puesto que se ha encontrado un comportamiento similar de este ítem en muestra norteamericana (Almendros, 2006), los autores proponen que ello pueda deberse a que la redacción negativa del ítem pudiera estar afectando a la comprensión de su enunciado y proponen modificar su redacción de modo que el ítem se lea de forma directa: “El grupo indica a sus miembros cómo comportarse sexualmente” (Almendros et al., 2007), en futuras aplicaciones de la escala.

El presente trabajo se propone valorar la fiabilidad test-retest y la validez diagnóstica, así como proporcionar datos normativos de la versión española del instrumento. Respecto a lo primero, no existe estudio previo que examine la estabilidad temporal de la GPA. En cuanto a la validez diagnóstica, si bien se han empleado grupos de comparación de ex-miembros de grupos no manipulativos en estudios norteamericanos previos (Adams, 1998; Gasde y Block, 1998; Langone, 1996; Malinoski, Langone y Lynn, 1999) de cara a establecer la capacidad del instrumento para discriminar entre personas que han sufrido o no abuso, no hay antecedente que trate de establecer puntos de corte empíricos para la GPA. Por tanto, este trabajo pretende valorar la idoneidad de emplear el punto de corte teórico, indicado por los autores originales para la GPA como el punto medio aritmético entre las puntuaciones posibles a la escala.

Método

Participantes

Las muestras se presentan atendiendo a la valoración inicial de los participantes del carácter manipulativo o no de los grupos a los que habían pertenecido en el pasado:

Muestra 1: Ex-miembros de GMP

Se recabó la participación de 101 españoles auto-identificados como ex-miembros de GMP que habían pertenecido en el pasado a alguno de 27 grupos diferentes y que respondieron a la versión en castellano de la escala GPA. La edad media de los participantes, en el momento en que participaron en el estudio, fue de 43,47 años (DT=12,22) y los mismos se distribuían, prácticamente de modo equitativo, entre varones (n=55; 54,5%) y mujeres (n=46; 45,5%). Se unieron al grupo a una edad media de 26,75 años (DT=12,26). El tiempo medio de pertenencia al grupo fue de 9,83 años (DT=9,55) y había transcurrido un tiempo medio de 6,35 años (DT=6,68) desde que lo abandonaron.

Muestra 2: Ex-miembros de Grupos No Manipulativos (GNM)

Adicionalmente, se recabó la participación de otros dos grupos con los que comparar los datos obtenidos, que respondieron igualmente a la versión española de la GPA:

Grupo 1. El primero de los grupos estuvo compuesto por 38 participantes españoles auto-identificados como ex-miembros de grupos no manipulativos diversos. Los participantes fueron seleccionados atendiendo a las características sociodemográficas de la muestra empírica intentando obtener un grupo lo más homogéneo posible al mismo. El 55,3% de ellos fueron mujeres (n=21) y el 44,7% restante varones (n=17). La edad media de los participantes fue de 40,84 años (DT=13,14). Pertenecieron a grupos diversos de variado carácter, a los que se unieron a una edad media de 22,46 (DT = 10,86). El tiempo medio de pertenencia fue de 5,01 años (DT=4,52) y el tiempo medio desde que abandonaron fue 12,27 años (DT=11.03).

Grupo 2. Adicionalmente, también se contó con la participación de otras 70 personas, en su mayoría estudiantes universitarios de Psicología, que se auto-identificaban como ex-miembros de algún GNM. La edad media de los participantes fue de 21,43 años (DT=1,23) y la mayoría de ellos eran mujeres (n=64; 91,4%) frente a una minoría de varones (n=6; 8,6%). Se unieron al grupo con una edad media de 13,47 años (DT=2,85), pertenecieron una media de 3,86 años (DT=3,05) y, en el momento de participar, llevaban 4,43 años (DT=2,84) fuera del grupo.

Instrumentos

La “Escala de Abuso Psicológico en Grupo” (GPA-S; Almendros, 2006; Almendros et al., 2004). La escala GPA original (Chambers et al., 1994) fue desarrollada para la evaluación del abuso psicológico en entornos grupales. La versión española consta de 28 ítems distribuidos en tres subescalas: Sumisión (Ítems: 4, 7, 8, 10, 14, 18, 19, 23, 27, 28), Control Mental (Ítems: 1, 9, 11, 15, 16, 21, 22, 24, 25, 26) y Explotación (Ítems: 2, 3, 5, 6, 12, 13, 17, 20). Cada ítem está codificado en una escala tipo Likert de cinco puntos (de “1=nada característico” a “5=totalmente característico”) con un rango posible para cada subescala de 10-50 para las subescalas Sumisión y Control Mental y de 8-40 para la de Explotación, siendo el rango para la medida global de 28-140. Los coeficientes de fiabilidad identificados para la muestra de GMP que se ha empleado para este estudio para la escala GPA-S (α =0,88) y las subescalas: Sumisión (α =0,86), Control Mental (α =0,75) y Explotación (α =0,70) fueron, en general, apropiados y se sitúan en torno a lo que es habitual encontrar en la investigación psicológica (Charter, 2003). Este instrumento fue respondido en dos ocasiones, separadas por intervalos de tiempo variables.

La “Hoja de Seguimiento de la Historia del Participante” de elaboración ad hoc (Almendros, 2006), también formó parte del material test-retest para evaluar los posibles cambios en la historia del participante y el grado de reflexión informado acerca de su experiencia grupal entre dos aplicaciones de la escala GPA-S.

Procedimiento

La recolección de datos de la muestra de 101 ex-miembros de GMP abarcó un período de tiempo amplio, entre Junio de 2001 y Mayo de 2005. Los participantes, españoles de procedencia diversa, fueron contactados a partir de los datos proporcionados por asociaciones de información sobre GMP (32,7%), profesionales (32,7%) y otros ex-miembros de GMP (34,6%). Debido a la dificultad de acceso a la muestra se plantearon dos modalidades de participación en el estudio de modo que, de los 101 participantes, el 57,4% (58 personas) participaron de modo presencial y el 42,6% (43 personas) contestaron los instrumentos siguiendo la modalidad de correo ordinario.

Respecto a los 108 ex-miembros de GNM, la mayoría de las personas del primer grupo participaron presencialmente y de modo individual, mientras que el resto de las personas del Grupo 1 (n=14) y la totalidad de las del Grupo 2, participaron en sesión colectiva.

El material para el estudio test-retest se envió a aquellos participantes de la muestra empírica de 101 ex-miembros del GMP que proporcionaron una dirección de correo ordinario en la primera evaluación (70 personas). De estos, cincuenta devolvieron los instrumentos correctamente cumplimentados, siendo la tasa efectiva de respuesta del 71,4%. No se encontraron diferencias significativas al comparar las medias de las puntuaciones obtenidas en la primera aplicación de la escala GPA-S entre aquellos participantes que, habiendo recibido el material para el estudio test-retest, lo completaron y enviaron y aquellos que no lo hicieron

(t (65)=0,35; p=0,73).

Plan de Análisis

El análisis estadístico de los datos se realizó mediante el paquete estadístico SPSS-PC, versión 15.0, empleándose el programa estadístico MedCalc, versión 8.1, para el procedimiento de la Curva COR.

Resultados

Se compararon las puntuaciones medias entre los participantes según que su participación fuera presencial o por correo, no encontrándose diferencias significativas (GPA-S: Media Correo: 103,37; Media Presencial: 103,79; t (99)=-0,12; p=0,91). Por tanto, los datos se han considerado conjuntamente para el resto de los análisis

Análisis de Fiabilidad Test-Retest

La reproducibilidad de las puntuaciones de la escala se valoró mediante el coeficiente de correlación intraclase y la comparación de las puntuaciones medias obtenidas en las dos administraciones del instrumento mediante la prueba t de Student. Los valores de correlación intraclase encontrados entre la primera y la segunda administración del instrumento a 50 personas para la escala global, las subescalas y la mayoría de los ítems (véase Tabla 1) parecen, en general, óptimos para afirmar la estabilidad temporal de la medida (Anastasi, 1988). La prueba t de Student para muestras relacionadas no reveló la existencia de diferencias significativas para la escala global o las subescalas entre las dos aplicaciones del instrumento. Por otro lado, encontramos que los valores alfa de Cronbach en la segunda medición son aceptables, similares y ligeramente superiores a los mismos valores encontrados para la muestra total de 101 participantes en la primera medición, para la escala global y las subescalas Control Mental y Explotación.

Tabla 1

Matriz de correlaciones test-retest (escala global y subescalas)

ICCr

p

Diferencia media

t de Student

p

Alfa

GPA-S

0,86

0,00

-0,60

0,46

0,65

0,89

Sumisión

0,90

0,00

-0,42

0,82

0,42

0,85

Control M.

0,73

0,00

0,54

-0,78

0,44

0,79

Explotación

0,81

0,00

-0,72

1,23

0,22

0,74

Correlación test-retest (Ítems)

Ítem 1

Ítem 2

Ítem 3

Ítem 4

Ítem 5

Ítem 6

Ítem 7

0,30*

0,57***

0,57***

0,67***

0,54***

0,77***

0,71***

Ítem 8

Ítem 9

Ítem 10

Ítem 11

Ítem 12

Ítem 13

Ítem 14

0,63***

0,86***

0,67***

0,43**

0,66***

0,68***

0,84***

Ítem 15

Ítem 16

Ítem 17

Ítem 18

Ítem 19

Ítem 20

Ítem 21

0,63***

0,73***

0,61***

0,61***

0,83***

0,78***

0,54***

Ítem 22

Ítem 23

Ítem 24

Ítem 25

Ítem 26

Ítem 27

Ítem 28

0,25

0,43**

0,59***

0,69***

0,32*

0,85***

0,80***

* p<0,05; ** p<0,01; *** p<0,001; ICCr = Coeficiente de correlación intraclase

Los intervalos de tiempo entre las evaluaciones fueron altamente variables de una persona a otra (1,25 meses - 32,32 meses) siendo el tiempo medio transcurrido de 15,52 meses (DT=7,26). Los participantes fueron agrupados, según el intervalo de tiempo transcurrido entre las dos evaluaciones, en cuatro períodos temporales: Corto – Menos de seis meses (6 personas); Medio - Entre 6 meses y menos de 12 meses (7 personas); Largo – Entre 12 meses y menos de 18 (21 personas); Muy Largo – 18 o más meses (16 personas). La prueba de los rangos con signo de Wilcoxon efectuada sobre las puntuaciones obtenidas por los participantes en la escala GPA-S y en las subescalas entre la primera y segunda administraciones del instrumento no reveló la existencia de diferencias significativas entre los cuatro grupos (p>0,35, en todos los casos) (Véase Figura 1).

Figura 1

Puntuaciones medias en dos aplicaciones de la GPA-S según intervalos temporales y grados de reflexión

Nota.: T: Estadístico de Wilcoxon para muestras relacionadas

Se inquirió a los participantes sobre el grado de reflexión acerca de su experiencia grupal durante el intervalo de tiempo transcurrido desde que participaron en la primera aplicación de la GPA-S hasta que lo hicieron en el estudio test-retest. Contestaron que habían reflexionado: En absoluto (n=4; 8%); Menos (n=8; 16%); Igual (n=16; 32%); Algo (n=10; 20%); Mucho (n=12; 24%). La prueba de Wilcoxon para muestras relacionadas reveló la existencia de diferencias significativas entre los rangos de las puntuaciones para la escala GPA-S para el grupo de mayor reflexión (z=-2,17; p=0,03) (Véase Figura 1), siendo éste el único grupo que incrementó su puntuación media en la segunda aplicación respecto de la primera (Media GPA-S1: 108,67; DT=17,44; Media GPA-S2: 114,50; DT=11,29).

Validez Diagnóstica

Para determinar la eficacia discriminativa o la precisión diagnóstica, expresada como sensibilidad y especificidad diagnósticas, de la GPA-S, así como para determinar el mejor punto de corte, se empleó el procedimiento de la curva COR (Curva característica de operación del receptor) incluyendo los datos de los participantes de la muestra empírica (“Abuso”; n=101) y los del Grupo 1 de comparación (“Ausencia de Abuso”; n=38). Se ha sugerido que se pueden derivar conclusiones cualitativas significativas de los resultados de la prueba COR aplicada con un total de alrededor de 100 observaciones (Metz, 1978). Sin embargo, puede ser importante contar con un tamaño de los grupos homogéneo, siendo preferible que cada grupo contenga al menos 50 observaciones (MedCalc Manual, 2005). Con todo, en nuestro caso se ha preferido exponer los resultados de comparar la muestra empírica con el Grupo 1 de comparación y prescindir del Grupo 2, por no cumplir este segundo grupo el supuesto de normalidad y por aproximarse los datos sociodemográficos más entre las dos muestras a comparar. Teniendo en cuenta esto, y ante la posibilidad de que la estructura de la muestra a emplear para análisis de la curva COR, presentara divergencias respecto de la estructura real de la población (Pardo y Ruiz, 2002), se efectuó una validación cruzada empleando como muestra de validación el Grupo 2 (n=70) y como muestra de entrenamiento los datos procedentes de la muestra empírica y del Grupo 1 (n=139). De este modo, se llevó a cabo un análisis discriminante donde la variable dependiente fue la variable de agrupación en función del abuso o ausencia de abuso informado y la variable independiente fue la prueba GPA-S. Se consideró la probabilidad a priori de asignación de los sujetos a cada grupo proporcional al tamaño del mismo (0,727 y 0,273). La función discriminante adoptó un autovalor de 2,09. El valor de correlación canónica entre las puntuaciones discriminantes y la variable de agrupación fue de 0,82, indicando una buena diferenciación entre los grupos. Finalmente, el estadístico Lambda de Wilks adoptó el valor 0,32, cuya significación (

(1)= 153,92; p=0,00) permite rechazar la hipótesis nula de que las medias multivariantes de los grupos son iguales. El valor de los centroides en la función discriminante para el grupo de abuso fue 0,88 y el mismo valor para el grupo de no abuso fue -2,34. En la Figura 2, observamos las matrices de confusión correspondientes a los casos seleccionados (muestra de entrenamiento) y los no seleccionados (muestra de validación), mostrando altos porcentajes de acierto en la clasificación para ambas muestras.


Grupo de pertenencia pronosticado

Casos seleccionados*

No Ab

Abuso

Total

No Ab

34

4

38

Abuso

7

94

101

%NoAb

89,5

10,5

100

%Ab

6,9

93,1

100

Casos no seleccionados**

No Ab

Abuso

Total

No Ab

68

2

70

Abuso

0

0

0

%NoAb

97,1

2,9

100

%Ab

0,0

0,0

100

* Clasificados correctamente el 92,1% de los casos agrupados originales seleccionados.

** Clasificados correctamente el 97,1% de casos agrupados originales no seleccionados.

Figura 2

Resultados de la clasificación. Histogramas y centroides de los grupos (Abuso; Ausencia de Abuso) representados sobre la función discriminante

Posteriormente, se empleó el procedimiento con la Curva COR, que representa los pares (1-especificidad, sensibilidad) obtenidos al considerar todos los posibles puntos de corte de la prueba. En la Figura 3 se presentan las curvas COR para la GPA-S y las subescalas. Se incluye en los gráficos la diagonal de referencia que une los vértices inferior izquierdo y superior derecho. Si la prueba no permitiera discriminar entre grupos, la curva COR coincidiría con dicha diagonal, aumentando la exactitud de la prueba a medida que la curva se desplaza hacia el vértice superior izquierdo (Zweig y Campbell, 1993). A la derecha de la misma figura, se presentan algunos de los valores criterio con sus correspondientes valores de Sensibilidad y Especificidad (S/E) para la GPA-S.

Así, observamos que una puntuación en la GPA-S > de 80 adopta los valores de mayor S/E (S: 92,1%; E: 100%). Respecto al área bajo la curva COR (ABC), como indicador global de la precisión, adopta el valor 0,98 (I.C.95%: 0,947-0,998). El contraste bajo el supuesto no paramétrico sobre la hipótesis nula de que el área verdadera fuera igual a 0,5 (cuya representación gráfica correspondería a la diagonal de referencia) reveló que el ABC difería significativamente de la misma (p < 0,00). El punto de corte que adopta valores de mayor S/E para la subescala Sumisión es una puntuación mayor que 27 (S: 92,1%; E: 97,4%; ABC: 0,977; I.C.95%: 0,94-0,99; P (Área=0,5) < 0,00). En cuanto a la subescala Control Mental, el punto de corte de mayor S/E es una puntuación mayor de 31 (S: 88,1%; E: 94,7%; ABC: 0,973; I.C.95%: 0,93-0,99; P (Área=0,5) < 0,00). Respecto a la subescala Explotación, una puntuación mayor de 12 adopta los valores de mayor S/E (S: 88,1%; E: 76,3%; ABC: 0,895; I.C.95%: 0,83-0,94; P (Área=0,5) < 0,00).


Criterio Sens. Espec.

> 60 98,0 84,2

> 63 98,0 86,8

> 65 97,0 86,8

> 66 94,1 89,5

> 68 93,1 89,5

> 72 93,1 92,1

> 75 93,1 94,7

> 76 93,1 97,4

> 79 92,1 97,4

> 80 * 92,1 100,0

> 81 91,1 100,0

> 84 88,1 100,0


Sumisión (10 ítems)

> 25 94,1 92,1

> 26 93,1 92,1

> 27 * 92,1 97,4

> 28 91,1 97,4

> 29 90,1 97,4

Control M (10 ítems)

> 29 94,1 81,6

> 30 89,1 89,5

> 31 * 88,1 94,7

> 32 85,1 97,4

> 33 83,2 97,4

Explotación (8 ítems)

> 10 97,0 50,0

> 11 95,0 60,5

> 12 * 88,1 76,3

> 13 83,2 76,3

> 14 77,2 76,3

> 15 72,3 78,9

* Valores criterio que la prueba ha identificado como más precisos

Figura 3

Curvas COR para GPA-S y subescalas

Como se ha visto, la curva COR estima la habilidad de la prueba para discriminar entre dos subclases de sujetos examinando todos los posibles umbrales de decisión entre los resultados positivos y negativos de la prueba (Domínguez y González, 2002) moviéndose la sensibilidad y la especificidad en direcciones opuestas. En el gráfico inferior de la Figura 4, se presentan los valores de S/E frente a los puntos de corte posibles de la GPA-S, incluyendo la representación de los intervalos de confianza de ambas. En el gráfico inmediatamente superior se representan las distribuciones de las puntuaciones para la muestra empírica y el Grupo 1 de comparación en torno al punto de corte escogido para la GPA-S (>= 81), recogiéndose los coeficientes de validez de la escala para el mismo en la tabla contigua. En la tabla inferior se presenta la información que correspondería si se asumiera el punto de corte (>= 84) postulado para la versión original del instrumento por los autores del mismo (Chambers et al., 1994) como promedio entre el rango de puntuaciones posibles de la GPA-S.


Abuso

No

Abuso

Total

GPA-S>=81

93

0

93

GPA-S< 81

8

38

46

Total

101

38

139

Valores expresados en porcentajes:

Sens (I.C.95%) = 92,1 (85-96,5)

Espec (I.C.95%) = 100 (90,7-100)

VPP = 100

VPN =82,6

Bien clasificados = 94,2


Abuso

No Abuso

Total

GPA-S>=84

92

0

92

GPA-S< 84

9

38

47

Total

101

38

139

Valores expresados en porcentajes:

Sens (I.C.95%) = 91,1 (83,8-95,8)

Espec (I.C.95%) = 100 (90,7-100)

VPP = 100

VPN =80,9

Bien clasificados = 93,5

Figura 4

Escala GPA-S: Puntos de corte y valores de sensibilidad-especificidad

Nota. VN: Verdadero negativo; VP: Verdadero positivo; FN: Falso negativo; FP: Falso positivo;

VPP: Validez predictiva positiva; VPN: Validez predictiva negativa.

Observamos que en la población que obtuvo una puntuación en la GPA-S mayor o igual a 81 (puntuación obtenida por el 66,9% de la muestra) se encuentran el 92,1% de los casos de Abuso, reduciéndose este porcentaje a 91,1% para aquellos que obtuvieron un puntuación mayor o igual a 84 (66,2% de la muestra). Es importante destacar que el 100% de los que obtienen una puntuación >= 81 son caso, por lo que seleccionar dicho punto de corte, con una especificidad del 100%, indica que si quisiéramos estimar la prevalencia real de la experiencia de abuso grupal percibido a partir de este instrumento, el 100% de aquellas personas con una puntuación >= 81 serían caso, desconsiderando, sin embargo, al 7,9% que, siendo caso, no son identificados como tal (representados en el gráfico superior izquierdo de la Figura 4 como puntos en el cuadrante “FN”).

Derivación de Normas

La puntuación media obtenida en la escala GPA-S de 28 ítems fue de 103,61 (DT=18,16) para la muestra de 101 ex-miembros de GMP. Si dividimos las puntuaciones medias obtenidas por los participantes en las subescalas por el número de ítems que las componen, encontramos que la que presentó un mayor valor medio fue la de Sumisión (4,15; DT =0,86) seguida de cerca por Control Mental (4,11; DT =0,68), siendo la subescala Explotación la que presentó un menor valor (2,62; DT =0,84).

Dada la ausencia de diferencias significativas entre las puntuaciones medias de los participantes en la GPA-S según el sexo (t (99)=0,48; p=0,63) y la ausencia de relación entre las puntuaciones obtenidas y la edad de participación (r=0,08; p=0,40), al igual que en la mayoría de las variables sociodemográficas, se presenta la baremación del instrumento para el total de la muestra.

Previamente se calcularon los estimadores robustos centrales o Estimadores – M, menos sensibles que la media a la presencia de valores extremos (ver Tabla 2) observándose, en general, una similitud entre la media de las puntuaciones (103,61) y los valores de dichos estimadores. Igualmente, se examinaron los valores extremos, observándose que entre los valores más bajos de la distribución destacaba la puntuación de uno de los casos (39), situada muy por debajo de la siguiente puntuación más baja (58), de modo que se prescindió del mismo a la hora de establecer la baremación. Los centiles correspondientes a las puntuaciones de la escala para la muestra utilizada permiten comparar a un sujeto concreto con personas que han pertenecido a un GMP (Tabla 2).

Tabla 2

Baremos para GPA-S: Muestra Española (n=100)

CENTILES

CENTILES

95

128,9

45

102,0

90

125,0

40

101,0

85

123,9

35

99,35

80

122,0

30

97,00

75

117,8

25

93,50

70

114,0

20

89,20

65

112,0

15

86,00

60

109,6

10

84,00

55

107,0

8

81,24

50

104,0

5

66,10

Estimadores-M para GPA-S

Estimador-M de Huber(a)

Biponderado de Tukey(b)

Estimador-M de Hampel(c)

Onda de Andrews(d)

104,90

105,70

105,10

105,70

a La constante de ponderación es 1,339.

b La constante de ponderación es 4,685.

c Las constantes de ponderación son 1,700, 3,400 y 8,500.

d La constante de ponderación es 1,340*pi.

Discusión

Este trabajo pretende aportar más evidencias de fiabilidad y validez que permitan valorar el grado de adaptación al español del instrumento: Group Psychological Abuse Scale (GPA) (Chambers et al., 1994). Este objetivo se planteó como un primer paso necesario para el estudio del abuso psicológico en contextos grupales, teniendo en cuenta el precedente de la no existencia de tal estudio en nuestro país. Postulamos, por ello, este estudio como un primer paso satisfactorio a partir del cual poder construir nuevos instrumentos de medida del constructo aquí estudiado, en etapas tempranas de comprensión y entendimiento empírico.

Teniendo en cuenta los resultados expuestos, creemos haber aportado las garantías necesarias para hacer accesible el instrumento para su empleo en nuestro país. No obstante, puesto que las propiedades psicométricas no se “logran y retienen simplemente” (Anastasi, 1986), no son algo que fijemos a través de este trabajo, sino que deberán volver a ser estimadas a medida que el instrumento se emplee con nuevas muestras.

Los tres factores encontrados para la segunda aplicación de la GPA-S mostraron valores Alfa de Cronbach adecuados, sobre todo si tenemos en cuenta el número reducido de ítems que componen las subescalas. Además, en el caso del presente instrumento, esperábamos que la percepción de abuso psicológico se mantuviera estable en el tiempo. Si se pretende que la GPA-S ayude a evaluar el grado de abuso ejercido en un grupo específico, la estabilidad de la medida debe ser un requisito imprescindible. En conjunto, nuestros resultados sugieren una escasa fluctuación de la escala GPA-S, cuyas puntuaciones se muestran estables a lo largo de períodos de tiempo considerables, e igualmente, se muestran poco variables según los diversos grados de reflexión. Por otro lado, la versión original de la escala parece haberse mostrado poco sensible a la intervención psicológica con una muestra norteamericana (Martin et al., 2004). En este sentido, conviene recordar que la GPA no está diseñada para medir actitudes acerca del abuso o la violencia, ni analiza las consecuencias del abuso, centrándose, en cambio, en la posible existencia o no de actos o prácticas específicas (Almendros et al., 2011). Por tanto, nuestros resultados parecen sugerir la estabilidad en la información proporcionada por los ex-miembros sobre su experiencia en grupos abusivos. Únicamente observamos que las personas que habían reflexionado mucho acerca de su experiencia incrementaron sus puntuaciones medias en la escala GPA-S de modo significativo. Este hecho podría ser congruente con las afirmaciones por parte, principalmente, de los profesionales de la salud que tratan ex-miembros de GMP, en torno a que muchos de los que abandonan estos grupos no son plenamente conscientes de lo que ha ocurrido durante su pertenencia o que los términos empleados en la escala pueden resultar prematuros para algunos ex-miembros recientes (Langone y Chambers, 1991). Es posible que un período de reflexión sirva para hacer explícitas las intenciones de determinadas prácticas llevadas a cabo por el grupo que, en la mayoría de los casos, fueron ejercidas de forma sutil haciendo que la persona aceptara como propias ciertas imposiciones, sacrificios, etc.

La GPA-S mostró una óptima capacidad clasificatoria, discriminando adecuadamente entre los ex-miembros de GMP y los ex-miembros de GNM. En este sentido, hemos determinado puntos de corte óptimos para la GPA-S (>=81) y sus subescalas: Sumisión (>= 28), Control Mental (>=32) y Explotación (>=13). No obstante, respecto a la última subescala, debe considerarse que para dicho punto de corte la especificidad es de 76,3% y adecuar, si resultara necesario, los criterios proporcionados según el propósito evaluador con el que quiera emplearse el instrumento: investigación o clínica.

Por otro lado, como ya apuntaron Almendros et al. (2004), hemos encontrado una relativa menor importancia o presencia de los comportamientos descritos como Explotación. Almendros (2006) no encontró diferencias significativas entre las puntuaciones medias de la muestra española aquí empleada y una muestra norteamericana. Ello nos sugiere la posible inconveniencia, en la versión original del instrumento, de adoptar el mismo punto de corte para esta subescala que para las restantes, compuestas cada una por el mismo número de ítems (7).

Finalmente, no era esperable encontrar diferencias entre los distintos grupos en razón del sexo o de las características sociodemográficas, dado que la GPA es un instrumento que no revela la experiencia personal de la persona en el grupo, sino la mera observación de si determinados abusos tuvieron lugar en su seno, con independencia de que el propio participante los haya sufrido.

Esta investigación comparte algunas de las limitaciones habituales en este ámbito de estudio, como el reducido tamaño de la muestra estudiada, así como la imposibilidad de determinar el posible grado de representatividad de la muestra. Por otro lado, consideramos como una prioridad futura, el recabar grupos de comparación más numerosos y apropiados para poder extraer unas mejores conclusiones de las investigaciones realizadas con estos colectivos. No obstante, nuestra muestra reúne unas condiciones mejores que la mayoría de las que se encuentran en la bibliografía y, especialmente, de las empleadas para el desarrollo de instrumentos de evaluación, tanto en lo que se refiere a la ratio sujeto-ítem, como al hecho de no ser una muestra clínica ni recabada exclusivamente por correo. Contamos, además, con una muestra de comparación que, a pesar de sus limitaciones, consideramos más apropiada que otras de las empleadas en los pocos estudios en los que se han incluido, sobre todo en lo que respecta a la forma de acceder a los participantes que, de igual modo que en la muestra empírica, no ha conllevado la participación de los propios grupos a la hora de seleccionar a los ex-miembros (Ayella, 1990).

Referencias

Adams, D. L. (1998). Perceived psychological abuse and the Cincinnati Church of Christ. Brief report. Cultic Studies Journal, 15, 87–88.

Almendros, C. (2006). Abuso psicológico en contextos grupales. Tesis doctoral sin publicar, Universidad Autónoma de Madrid, España.

Almendros, C., Carrobles, J. A., Rodríguez-Carballeira, A., & Jansà, J. M. (2004). Propiedades psicométricas de la versión española de la Group Psychological Abuse Scale para la medida de abuso psicológico en contextos grupales. Psicothema, 16, 132–138.

Almendros, C., Carrobles, J. A., Rodríguez-Carballeira, A., & Jansà, J. M. (2007). Measuring psychological abuse in group contexts in Spain. In P. T. Nowakowski (Ed.), The phenomenon of cults from a scientific perspective (pp. 192–208). Cracovia: Dom Wydawniczy Rafael.

Almendros, C., Gámez-Guadix, M., Carrobles, J. A., y Rodríguez-Carballeira, A. (2011). Abuso psicológico en grupos manipuladores. Psicología Conductual, 19, 157–182.

Anastasi, A. (1986). Evolving concepts of test validation. Annual Review of Psychology, 37, 1–15.

Anastasi, A. (1988). Psychological testing. New York, Estados Unidos: Macmillan.

Ayella, M. (1990). “They must be crazy.” Some of the difficulties in researching “cults.” American Behavioral Scientist, 33, 562–577.

Barker, E. (1989). New Religion Movements: A Practical Introduction. Londres: HMSO.

Bohm, J., & Alison, L. (2001). An exploratory study in methods of distinguishing destructive cults. Psychology, Crime & Law, 7, 133–165.

Chambers, W. V., Langone, M. D., Dole, A. A., & Grice, J. W. (1994). The Group Psychological Abuse scale: A measure of the varieties of cultic abuse. Cultic Studies Journal, 11, 88–117.

Chambers, W. V., Langone, M. D., & Malinoski, P. T. (1996, agosto). The Group Psychological Abuse Scale. Ponencia presentada en la División 36 (Psychology of Religion), American Psychological Association Annual Meeting, Toronto, Canadá.

Charter, R. A. (2003). A breakdown of reliability coefficients by test type and reliability method, and the clinical implications of low reliability. Journal of General Psychology, 130, 290–304.

Domínguez, E. y González, R. (2002). Análisis de las curvas Receiver-Operating Characteristic: Un método útil para evaluar procederes diagnósticos. Revista Cubana de Endocrinología, 13, 169–176.

Gasde, I., & Block, R. A. (1998). Cult Experience: Psychological abuse, distress, personality characteristics, and changes in personal relationships reported by former members of Church Universal and Triumphant. Cultic Studies Journal, 15, 192–221.

Hambleton, R. K. (1994). Guidelines for adapting educational and psychological tests: A progress report. European Journal of Psychological Assessment, 10, 229–244.

Hambleton, R. K. (1996). Adaptación de tests para su uso en diferentes idiomas y culturas: Fuentes de error, posibles soluciones y directrices prácticas. En J. Muñiz (Coord.), Psicometría. Madrid: Universitas.

Langone, M. D. (1996). An investigation of a reputedly psychologically abusive group that targets college students. Rep. Téc. Preparado para el Danielsen Institute, Boston University. Extraído el 15 de Diciembre de 2003, desde http://www.culticstudies.org/infoserv_articles/ langone_michael_bu_bcc_study.htm

Langone, M. D., & Chambers, W. V. (1991). Outreach to ex-cult members: The question of terminology. Cultic Studies Journal, 8, 134–150.

Malinoski, P. T., Langone, M. D., & Lynn, S. J. (1999). Psychological distress in former members of the International Churches of Christ and noncultic groups. Cultic Studies Journal, 16, 33–51.

Martin, P. R., Almendros, C., Burks, R., y Carrobles, J. A. (2004, octubre). Psychological consequences of cult membership. Ponencia presentada en el Congreso Internacional de ICSA: Understanding Cults and New Religious Movements, Atlanta, GA, Estados Unidos.

MedCalc Manual (1993–2005). MedCalc for Windows. Statistics for biomedical research. Software manual. Bélgica.

Metz, C. E. (1978). Basic principles of ROC analysis. Seminars in Nuclear Medicine, 8, 283–298.

Muñiz, J. y Hambleton, R. K. (2000). Adaptación de los tests de unas culturas a otras. Metodología de las Ciencias del Comportamiento, 2, 129–149.

Pardo, A., y Ruiz, M. A. (2002). SPSS 11: Guía para el análisis de datos. Madrid: McGraw-Hill.

Winocur, N., Whitney, J., Sorensen, C., Vaughn, P., & Foy, D. (1997). The Individual Cult Experience Index: The assessment of cult involvement and its relationship to postcult distress. Cultic Studies Journal, 14, 290–306.

Wolfson, L. B. (2002). A study of the factors of psychological abuse and control in two relationships: Domestic violence and cultic systems. Dissertation Abstracts International, 63, 2794.

Zablocki, B., & Robbins, T. (Eds.) (2001). Misunderstanding cults: searching for objectivity in a controversial field. Canadá: University of Toronto Press.

Zweig, M. H., & Campbell, G. (1993). Receiver-operating characteristic (ROC) plots: A fundamental evaluation tool in clinical medicine. Clinical Chemistry, 39, 561–577.

Agradecimientos

Este trabajo ha sido redactado en el marco del proyecto de investigación financiado por el Ministerio de Ciencia e Innovación con el código PSI2010-16098.

Acerca de la autora principal

Carmen Almendros, PhD, Facultad de Psicología, Universidad Autónoma de Madrid, Ciudad Universitaria de Cantoblanco, 28049 Madrid. (carmen.almendros@uam.es)