Si se limita el rango de variación de la variable dependiente al seleccionar los casos, la relación entre las X y las Y se atenúa. En análisis cuantitativos se encontrará que la pendiente de la ecuación de regresión subestima el valor del parámetro poblacional y en el caso en que se empleen técnicas cualitativas sabremos que la verdadera relación entre las variables será mayor que la observada.
Sin embargo, el sesgo de selección no sólo surge de la no respuesta o de los criterios que emplea el investigador para elegir sus casos de estudio, sino que también lo pueden originar el mundo o la naturaleza. Para ilustrar esta idea considérese, a manera de ejemplo, un modelo que postula que no hay relación entre regímenes políticos y crecimiento económico y que las democracias tienen mayor probabilidad de morir ante condiciones económicas adversas. Transcurrido el tiempo, el cruce entre regímenes políticos y crecimiento económico mostrará que las democracias crecen más rápido que las dictaduras. Este resultado será producto del sesgo de selección, ya que se sabe que los regímenes políticos y el crecimiento económico no están asociados (Przeworski, Álvarez, Cheibub y Limongi, 2000: 8-9). La relación observada entre regímenes democráticos y bajas tasas de crecimiento puede deberse a que es más frecuente encontrar democracias en países ricos y éstos, a su vez, son los que sistemáticamente crecen con más lentitud. En este caso, el sesgo de selección se originaría en los vínculos que mantiene el ingreso per cápita tanto con el régimen político como con la tasa de crecimiento de los países.
Algo similar ocurre con el estudio de las culturas por medio del análisis de las esculturas. En algunas sociedades se esculpe la piedra y en otras la madera. Pasado el tiempo, la piedra sobrevive mientras la madera se pudre, pero el historiador de la cultura puede subestimar la calidad del arte de trabajar la madera porque la “historia” ha eliminado de forma selectiva unas esculturas y ha mantenido otras (King, Keohane y Verba, 2000: 146).
Como último ejemplo de sesgo de selección producido por el mundo supóngase que se quiere dar cuenta de los procesos que han originado los estados modernos. Alrededor del año 1500 había una gran variedad de unidades organizativas, pero hacia el año 1900 todas o casi todas eran Estados nación. En el lapso considerado, muchas unidades desaparecieron y, si se emprendiera un estudio retrospectivo, se haría evidente que los Estados actuales son sobrevivientes de una lucha en que la mayoría perdió: pasaron de ser, más o menos, quinientos, alrededor del 1500, a veinticinco, en 1900. Si se eligen los casos a partir del listado de países de 1900, es decir, en función de haber sobrevivido durante cuatrocientos años, la selección se haría a partir de la variable dependiente y, por lo tanto, los resultados de la investigación estarían sesgados (King, Keohane y Verba, 2000: 147).
A lo largo de esta breve sección hemos visto que el sesgo de selección puede surgir: i) en muestras aleatorias cuando hay una proporción significativa de valores perdidos —bajo el supuesto de que no se distribuyen al azar— y ii) en la elección intencional de observaciones cuando los criterios de selección se relacionan con la variable dependiente. Los últimos ejemplos muestran que también puede surgir por sesgos producidos por el mundo. Las dos primeras fuentes de este sesgo se pueden evitar con relativa facilidad pues la solución está en manos del investigador.
Para finalizar, vale la pena tomar consciencia de que el mundo que nos rodea no se genera aleatoriamente, sino que es el resultado de gente cuyas acciones persiguen objetivos. Se nutre de los éxitos y elimina las fallas, estos procesos son sistemáticos y así son sus efectos (Przeworski, Álvarez, Cheibub y Limongi, 2000: 9).
Acerca de la operacionalización
La construcción teórica en las ciencias factuales —entre las cuales se encuentran las ciencias sociales—, a diferencia de las ciencias formales —lógica y matemáticas—, debe “someterse a instancias exteriores que exigen un trabajo de adaptación aún mucho mayor (y psicológicamente más costoso)” (Piaget, 1982: 64). En las ciencias formales, donde impera la deducción y la construcción libre de la inteligencia, se agrega la restricción de poner en correspondencia con el plano de la experiencia las teorías y los conceptos. En nuestro ámbito disciplinario al proceso de hacer observables los conceptos teóricos suele denominársele operacionalización y fue sistematizado por Paul Lazarsfeld (1974).
En este mismo tenor Albert Einstein, en sus reflexiones metodológicas acerca de la física, ciencia también factual, se planteaba como problema examinar el vínculo entre la teoría —es decir, entre los conceptos teóricos, las proposiciones que los vinculan y sus relaciones— y la experiencia. Y, en este sentido, afirmaba que el objetivo último de la ciencia “es el intento de hacer que la diversidad caótica de nuestra experiencia corresponda al sistema lógicamente (unificado) del pensamiento” (Holton, 1985: 39).
Suele discutirse si los conceptos devienen de la experiencia o si se originan y se reproducen en el pensamiento. Esta discusión pierde sentido si se toma como punto de partida que toda observación está cargada de teoría, que la construcción teórica en ciencias sociales, a diferencia de la filosofía social, deviene de la investigación y que el proceso que sigue esta última no es lineal, sino helicoidal, cuyos movimientos en ocasiones se acercan más al plano de la experiencia y, en otras, al de la teoría y, por lo tanto, los conceptos y proposiciones a veces parecen originarse en la teoría y otras en las operaciones relacionadas con la sistematización de la experiencia, como son la observación, la experimentación y la medición.
Ahora bien, Lazarsfeld plantea que para operacionalizar un concepto es necesario: i) realizar la descripción literaria precisa del concepto en cuestión, ii) identificar sus dimensiones y subdimensiones, iii) proceder a identificar los indicadores apropiados, y iv) resumir los indicadores en índices sintéticos.
Sin embargo, para que un concepto tenga significado —en otros términos: que esté bien construido; o, en la terminología de Lazarsfeld, que sea preciso—, se requiere que tenga una clase de referencia y un sentido, entendiendo éste como “lo que dice respecto de su referente o referentes” (Bunge, 1999: 87). Y sólo tiene pleno sentido por las proposiciones de que forma parte, así como por los enunciados que lo implican —su ascendencia lógica— y por los que implica —descendencia lógica—. El significado de una proposición proviene de su clase de referencia y de su sentido (Bunge, 1999: 87-88).
La teoría de la significación de Bunge enriquece el modelo de Lazarsfeld en tanto deja claro que, para hacer una buena descripción literaria del concepto, hay que considerar la teoría en que se inserta. Conceptos aislados, tales como exclusión social, vulnerabilidad, marginalidad, actividades informales, no tienen significado en sí mismos —que, como sabemos, depende de la clase de referencia y el sentido—, sino que lo adquieren en el entramado teórico. Por ejemplo, la clase social en Weber y en Marx es un concepto pleno de significado, pero difiere tanto por la clase de referencia como por el sentido, considerando que este último proviene, en cada caso, de los cuerpos teóricos en que están incluidos.
Por otra parte, hay que consignar que, tal vez la idea más difundida de medición, aun en el campo de las ciencias sociales, es aquella que la concibe como “la asignación de números a los objetos o eventos de acuerdo a reglas” (Stevens, 1951: 22). Esta definición parece ser adecuada para las ciencias naturales, pero en las ciencias sociales no se trabaja con objetos —cosas que se pueden ver y tocar— o con eventos —resultados, consecuencias— (Carmines y Zeller, 1979: 9-10), sino con conceptos abstractos, tales como desigualdad social, representación política, exclusión social, marginación.
Читать дальше