Definición y Tipos de Análisis de Contenido
Conceptos fundamentales y clasificación según enfoque metodológico.
| Symbole | Signification | Unité |
|---|---|---|
| \text{AC} | Análisis de contenido Método no invasivo para examinar patrones en comunicación escrita u oral. Aplicable a corpus como discursos presidenciales o redes sociales. |
Exemple : Un estudio sobre discursos de candidatos a Ser Bachiller en Ecuador analiza 120 discursos de 5 provincias usando etiquetas como 'educación', 'economía' y 'seguridad'.
Formes alternatives
- — Fórmula equivalente cuando hay múltiples categorías (k).
| Symbole | Signification | Unité |
|---|---|---|
| f_i | Frecuencia relativa de la categoría i Se expresa en porcentaje para comparar categorías dentro de un mismo corpus. | % |
| n_i | Conteo de unidades en la categoría i Ejemplo: número de veces que aparece la palabra 'desarrollo' en un discurso. | unidades |
| N | Total de unidades codificadas en el corpus Incluye todas las unidades analizadas (palabras, frases, párrafos). | unidades |
Dimensions :
Exemple : En un corpus de 850 palabras de un discurso de Rafael Correa, la palabra 'educación' aparece 42 veces. Calcula su frecuencia relativa: .
| Symbole | Signification | Unité |
|---|---|---|
| D | Índice de diversidad léxica Valores cercanos a 1 indican alta diversidad (poco uso de repetición). Valores cercanos a 0 indican baja diversidad (repetición excesiva). | |
| V | Vocabulario único Ejemplo: en un texto de 500 palabras con 200 palabras distintas, V = 200. | palabras |
| N | Total de palabras Incluye todas las palabras, incluyendo repeticiones. | palabras |
Dimensions :
Exemple : Un artículo de opinión en el diario El Comercio tiene 1 200 palabras con 480 palabras únicas. Su índice de diversidad es . Comparado con un informe técnico de 1 200 palabras con 300 únicas (), el artículo es más diverso.
Proceso de Codificación y Categorización
Fórmulas para evaluar la calidad y consistencia del proceso de asignación de códigos.
| Symbole | Signification | Unité |
|---|---|---|
| K | Coeficiente Kappa de Cohen Valores: K < 0 (peor que azar), 0 ≤ K < 0.20 (ligero), 0.21 ≤ K ≤ 0.40 (razonable), 0.41 ≤ K ≤ 0.60 (moderado), 0.61 ≤ K ≤ 0.80 (sustancial), K > 0.80 (casi perfecto). | |
| P_o | Proporción de acuerdo observado Calculado como (número de unidades donde los codificadores coinciden) / (total de unidades). | |
| P_e | Proporción de acuerdo esperado por azar Depende de la distribución de categorías. Para dos codificadores: , donde es la proporción de unidades asignadas a la categoría i por cada codificador. |
Dimensions :
Exemple : Dos estudiantes codifican 150 tweets sobre migración en Ecuador. Acuerdan en 120 unidades. La probabilidad esperada de acuerdo por azar es 0.45. Calcula K: (confiabilidad sustancial).
| Symbole | Signification | Unité |
|---|---|---|
| P | Porcentaje de acuerdo Fórmula simple pero sensible a sesgos por azar. Se recomienda usar Kappa para mayor rigor. | % |
| A | Unidades con acuerdo entre codificadores Ejemplo: si 80 de 100 unidades coinciden, A = 80. | unidades |
| T | Total de unidades codificadas Incluye todas las unidades analizadas por ambos codificadores. | unidades |
Dimensions :
Exemple : En un estudio sobre memes políticos ecuatorianos, dos codificadores analizan 200 unidades. Acuerdan en 165. Calcula P: .
| Symbole | Signification | Unité |
|---|---|---|
| T_c | Tasa de codificación Útil para planificar proyectos. Valores típicos: 50-150 unidades/hora para codificación manual. | unidades/hora |
| U | Unidades codificadas Puede ser palabras, frases, párrafos o tweets. | unidades |
| t | Tiempo empleado Incluye tiempo de entrenamiento de codificadores y revisión. | horas |
Dimensions :
Exemple : Un estudiante codifica 300 tweets sobre COVID-19 en 4 horas. Su tasa es . Para un corpus de 1 200 tweets, estima el tiempo necesario: .
Técnicas Cuantitativas en Análisis de Contenido
Métricas para analizar frecuencias, asociaciones y patrones en datos textuales.
| Symbole | Signification | Unité |
|---|---|---|
| n_i | Frecuencia absoluta de la palabra i Ejemplo: en un corpus de 1 000 palabras, la palabra 'turismo' aparece 15 veces: . | ocurrencias |
| x_{ij} | Variable indicadora = 1 si la palabra i está presente en la unidad j (ej: frase, párrafo), 0 en caso contrario. | |
| N | Número total de unidades Puede ser frases, párrafos o documentos completos. | unidades |
Dimensions :
Exemple : En 500 tweets sobre Galápagos, la palabra 'ecoturismo' aparece 28 veces. Calcula .
| Symbole | Signification | Unité |
|---|---|---|
| \chi^2 | Estadístico chi-cuadrado Valores altos indican asociación significativa entre variables categóricas. Compara con tabla de chi-cuadrado con gl = (r-1)(c-1) grados de libertad. | |
| O_{ij} | Frecuencia observada en celda (i,j) Ejemplo: número de veces que la categoría 'política' aparece en tweets de Quito vs. Guayaquil. | ocurrencias |
| E_{ij} | Frecuencia esperada en celda (i,j) Calculada como (total fila i × total columna j) / total general. | ocurrencias |
| r | Número de filas en la tabla de contingencia Ejemplo: 2 filas (Quito, Guayaquil). | |
| c | Número de columnas en la tabla de contingencia Ejemplo: 3 columnas (política, economía, cultura). |
Dimensions :
Exemple : En una tabla 2×2 con O = [[30, 20], [10, 40]] y E = [[25, 25], [15, 35]], calcula χ²: . Con gl = 1, este valor es significativo al 95% (χ² crítico = 3.84).
| Symbole | Signification | Unité |
|---|---|---|
| J(A,B) | Índice de similitud de Jaccard Valores cercanos a 1 indican alta similitud. Valores cercanos a 0 indican baja similitud. Útil para comparar textos cortos como tweets. | |
| A | Conjunto de palabras del texto A Ejemplo: {'turismo', 'ecológico', 'Galápagos'} para un texto sobre ecoturismo. | palabras |
| B | Conjunto de palabras del texto B Ejemplo: {'turismo', 'naturaleza', 'Islas'} para otro texto. | palabras |
Dimensions :
Exemple : Texto A: {'café', 'quito', 'turismo'} (3 palabras). Texto B: {'café', 'quito', 'montaña'} (3 palabras). Intersección = {'café', 'quito'} (2 palabras), unión = {'café', 'quito', 'turismo', 'montaña'} (4 palabras). Índice: .
Técnicas Cualitativas en Análisis de Contenido
Métodos para interpretar significados, contextos y patrones no cuantificables.
Formes alternatives
- — Fórmula acumulativa para evaluar saturación en todo el proceso.
| Symbole | Signification | Unité |
|---|---|---|
| S | Razón de saturación teórica Cuando S < 0.1 durante 2 iteraciones consecutivas, se considera que se ha alcanzado saturación teórica (no emergen nuevas categorías). | |
| C_n | Nuevas categorías en iteración n Ejemplo: en la 5ª iteración de codificación, emergen 2 nuevas categorías. | categorías |
| C_{n-1} | Nuevas categorías en iteración anterior Ejemplo: en la 4ª iteración, emergieron 20 nuevas categorías. | categorías |
Dimensions :
Exemple : En un estudio sobre remesas, las iteraciones muestran: C_3 = 5, C_4 = 3, C_5 = 1. Razones: , . No se alcanza saturación (S > 0.1).
| Symbole | Signification | Unité |
|---|---|---|
| P | Profundidad temática Indica qué porcentaje de temas identificados fueron analizados en detalle (ej: con citas textuales, contexto histórico). | % |
| T_d | Temas profundizados Ejemplo: de 12 temas sobre 'migración a España', se profundiza en 8. | temas |
| T_t | Temas totales identificados Incluye todos los temas emergentes del análisis. | temas |
Dimensions :
Exemple : Un análisis de 15 entrevistas a agricultores de Cotopaxi identifica 22 temas. Se profundiza en 14. Profundidad: .
| Symbole | Signification | Unité |
|---|---|---|
| M | Matriz de contexto Organiza datos cualitativos en filas (categorías) y columnas (contexto: género, edad, región, etc.). Permite identificar patrones transversales. | |
| c_{ij} | Valor de la categoría i en contexto j Puede ser binario (1/0), ordinal (1-5) o nominal (ej: 'alto', 'medio', 'bajo'). | |
| m | Número de categorías Ejemplo: 5 categorías como 'motivación', 'dificultades', etc. | |
| n | Número de contextos Ejemplo: 3 contextos (hombres, mujeres, jóvenes). |
Dimensions :
Exemple : Matriz 3×2 para estudiar turismo comunitario: filas = {'participación', 'beneficios', 'conflictos'}, columnas = {'Comunidad A', 'Comunidad B'}. Valores: =1 (alta participación en A), =0 (baja en B).
Herramientas Digitales para Análisis de Contenido
Fórmulas para evaluar el rendimiento de algoritmos y herramientas automatizadas.
Formes alternatives
- — Fórmula para precisión en clasificación multiclase, donde I es la función indicadora.
| Symbole | Signification | Unité |
|---|---|---|
| P | Precisión Porcentaje de unidades correctamente clasificadas como positivas. Valores altos indican bajo ruido en la clasificación. | |
| VP | Verdaderos positivos Ejemplo: tweets correctamente etiquetados como 'política'. | unidades |
| FP | Falsos positivos Ejemplo: tweets etiquetados como 'política' pero que hablan de 'deportes'. | unidades |
Dimensions :
Exemple : Un algoritmo clasifica 200 tweets sobre Ser Bachiller. VP = 85, FP = 15. Precisión: (85%).
| Symbole | Signification | Unité |
|---|---|---|
| R | Recuperación (Recall) Capacidad del clasificador para encontrar todas las unidades positivas. Importante cuando el costo de omitir una unidad es alto (ej: análisis de discurso de odio). | |
| VP | Verdaderos positivos Mismo significado que en la fórmula de precisión. | unidades |
| FN | Falsos negativos Ejemplo: tweets que hablan de 'política' pero no fueron etiquetados como tales. | unidades |
Dimensions :
Exemple : Mismo corpus de 200 tweets: VP = 85, FN = 30. Recuperación: (74%). El algoritmo omite el 26% de los tweets relevantes.
| Symbole | Signification | Unité |
|---|---|---|
| F_1 | F1-score Balance entre precisión y recuperación. Útil para comparar modelos cuando hay desbalance de clases (ej: pocos tweets sobre 'ciencia' en un corpus general). | |
| P | Precisión Mismo significado que en la fórmula anterior. | |
| R | Recuperación Mismo significado que en la fórmula anterior. |
Dimensions :
Exemple : Para el clasificador de tweets: P = 0.85, R = 0.74. F1-score: .
| Symbole | Signification | Unité |
|---|---|---|
| T_p | Tiempo de procesamiento por unidad Indica la eficiencia de la herramienta. Valores bajos son deseables para análisis de grandes corpus. | segundos/unidad |
| t | Tiempo total de procesamiento Incluye tiempo de carga, limpieza de datos y generación de resultados. | segundos |
| N | Número de unidades procesadas Ejemplo: 10 000 tweets. | unidades |
Dimensions :
Exemple : Una herramienta procesa 5 000 tweets en 180 segundos. Tiempo por unidad: (36 milisegundos).