En Palabras de Franco: análisis de los Mensajes de Año Nuevo (teoría y práctica de un análisis cuantitativo y cualitativo).
Tesis doctoral de Alma Valencia Uy por la Universidad de Valladolid, España
La Autoría de los Mensajes de Año Nuevo de Francisco Franco
Esta Investigación se centra en la autoría de los discursos anuales del dictador español, analizando si fueron escritos por él mismo o por colaboradores cercanos mediante técnicas de estilometría y análisis lingüístico computacional.
¿Quién escribió los Mensajes de Año Nuevo?
La controversia histórica
La figura de Francisco Franco y la autoría de sus discursos anuales han sido objeto de debate entre historiadores, cuestionando si fueron escritos por él o por colaboradores cercanos.
Análisis estilométrico
Esta investigación aplica técnicas de estilometría y análisis lingüístico computacional para determinar patrones de escritura y posibles autores de los mensajes.
La huella autoral
Se busca identificar el "idiolecto" o estilo lingüístico único que caracteriza a cada autor, analizando patrones en el uso del lenguaje que revelan la identidad del escritor.
El Contexto Histórico de Franco
Consolidación del Régimen (1939-1953)
Tras la victoria en la Guerra Civil, Franco establece un régimen autoritario, reprime la oposición y promueve un nacionalismo tradicionalista aliado con la Iglesia Católica.
Aislamiento Internacional y Autarquía (1953-1959)
España experimenta aislamiento internacional y adopta políticas de autosuficiencia económica, con intervención estatal y sustitución de importaciones.
Apertura Económica y Reformas (1959-1975)
El régimen adopta políticas de apertura económica, desarrolla el turismo y firma acuerdos comerciales internacionales, preparando una eventual transición.
Los Mensajes de Año Nuevo
La tradición de los Mensajes de Año Nuevo en España fue iniciada por Francisco Franco en 1937, cuando el país aún estaba en guerra. Desde entonces, cada fin de año enviaría un mensaje a los españoles, hasta 1974.
Significado político
Estos mensajes representaban una oportunidad para que Franco comunicara sus visiones, objetivos y políticas para el próximo año, infundiendo esperanza y lealtad entre la población.
Duda sobre la autoría
A lo largo de los años han surgido dudas sobre si Franco fue el verdadero autor o si fueron redactados por sus colaboradores más cercanos.
Corpus de estudio
El conjunto analizado se compone de 32 Mensajes de Año Nuevo, con un total de 140.827 palabras, aunque faltan los correspondientes a 1940-1945.
El Problema de la Autoría
La cuestión de la autoría de textos ha sido objeto de estudio desde la antigüedad. Desde los escribas de la Biblia judía hasta los modernos análisis computacionales, determinar quién escribió un texto ha sido fundamental para comprender su significado y contexto.
En el caso de los Mensajes de Año Nuevo de Franco, esta cuestión cobra especial relevancia por su valor histórico y político. ¿Fueron realmente escritos por el dictador o por alguno de sus colaboradores cercanos?
La atribución de autoría puede clasificarse en diferentes categorías: "clase cerrada" (determinar si un texto anónimo fue escrito por un autor específico), "clase abierta" (identificar al autor entre varios candidatos), "trabajos en colaboración" y "trabajo anónimo".
¿Qué es la Estilometría?
Huella lingüística
La estilometría se basa en la premisa de que cada autor posee un estilo único que puede ser identificado mediante análisis cuantitativo, como una "huella digital" literaria.
Análisis estadístico
Utiliza métodos estadísticos para analizar características del texto como frecuencia de palabras, longitud de oraciones y patrones sintácticos.
Tecnología avanzada
Emplea herramientas computacionales para procesar grandes volúmenes de texto y detectar patrones que serían imperceptibles para el ojo humano.
La estilometría moderna combina lingüística, estadística e informática para identificar patrones únicos en la escritura de cada autor, permitiendo determinar la autoría de textos dudosos o anónimos con un alto grado de precisión.
Evolución de la Estilometría

Orígenes (siglo XIX)
Augustus De Morgan (1851) y Thomas Mendenhall (1887) proponen analizar la longitud de palabras para determinar autoría.
Desarrollo estadístico (1940-1960)
Udny Yule y Mosteller & Wallace aplican métodos estadísticos avanzados para analizar frecuencias de palabras.
Era computacional (1980-actualidad)
Incorporación de inteligencia artificial, redes neuronales y algoritmos genéticos para el análisis estilométrico.
La estilometría ha evolucionado desde simples conteos de palabras hasta sofisticados análisis computacionales que pueden procesar millones de características textuales simultáneamente, aumentando significativamente su precisión y aplicabilidad.
El Idiolecto: La Huella Lingüística Personal

1

1
Unicidad individual
Cada persona desarrolla un estilo lingüístico único basado en sus experiencias y cognición.
Procesos cognitivos
El cerebro almacena experiencias que influyen inconscientemente en el vocabulario y estructuras lingüísticas.
Patrones lingüísticos
Estos patrones son tan distintivos como una huella dactilar, permitiendo identificar al autor.
El idiolecto representa la variación lingüística individual, respaldada por la afirmación de Herman: "existen tantos lenguajes como individuos hay en el mundo". Cada persona modula el lenguaje según sus convenciones personales, creando un estilo único que puede ser detectado mediante análisis estilométrico.
Metodología de la Investigación
Recopilación del corpus
Digitalización de los Mensajes de Año Nuevo y textos de referencia de Franco y posibles colaboradores.
Preparación de textos
Limpieza y normalización de los textos para análisis computacional.
Análisis estilométrico
Aplicación de técnicas estadísticas y computacionales para identificar patrones de autoría.
Comparación de resultados
Triangulación de datos de diferentes métodos para validar conclusiones.
Corpus de Análisis

Corpus A: Textos dubitados
32 Mensajes de Año Nuevo (1937-1974) y el Testamento de Franco.

Corpus B: Textos indubitados de Franco
Diario de una Bandera, Apuntes personales, Memorias y libro sobre Masonería.

Corpus C: Textos de posibles colaboradores
Obras de figuras cercanas al régimen como Serrano Suñer, Luis Suárez Fernández y otros.

Preparación del corpus
Conversión a formato de texto plano Unicode UTF-8 para análisis computacional.
Herramientas de Análisis
Stylo
Librería de R para análisis estilométrico que permite identificar patrones de autoría mediante análisis de clúster y árboles de consenso.
LIWC (Linguistic Inquiry and Word Count)
Programa que analiza el uso de palabras para determinar aspectos psicológicos y cognitivos del autor.
Índice de Probabilidad (LR)
Marco estadístico que compara la probabilidad de dos hipótesis competidoras sobre la autoría de un texto.
LSM (Linguistic Style Matching)
Medida que evalúa la similitud estilística entre diferentes textos basándose en el uso de palabras funcionales.
Análisis de Palabras Funcionales
¿Qué son las palabras funcionales?
Las palabras funcionales (preposiciones, artículos, conjunciones, pronombres) representan entre el 55% y 60% de todas las palabras que empleamos en el habla y la escritura.
A diferencia de las palabras de contenido (sustantivos, verbos, adjetivos), las palabras funcionales son independientes del tema y reflejan mejor el estilo personal del autor.
Importancia en la estilometría
Las palabras funcionales son especialmente valiosas para el análisis estilométrico porque:
  • Son más estables a lo largo del tiempo
  • Son menos susceptibles a manipulación consciente
  • Reflejan procesos cognitivos subyacentes
  • Son menos dependientes del tema tratado
Primera Fase de Análisis
En esta fase inicial, se analizaron los textos del Corpus A (Mensajes de Año Nuevo) junto con el Testamento de Franco, utilizando la herramienta Stylo con diferentes parámetros.
Los resultados mostraron que el Testamento se asocia exclusivamente con los mensajes de los años 1937, 1938, 1946 y 1947, y esta agrupación se distancia notablemente del resto de textos. Esta separación se mantuvo constante al variar los parámetros de análisis.
Conclusión preliminar: En la redacción de los Mensajes de Año Nuevo intervinieron varias manos, y la mano de Franco solo se hace evidente en los años 1937, 1938, 1946 y 1947.
Segunda Fase de Análisis
En esta fase se amplió el análisis incluyendo todos los textos presuntamente indubitados de Franco (Corpus B) junto con los Mensajes de Año Nuevo.
Los resultados confirmaron que los textos históricamente atribuidos a Franco se asocian claramente con el Testamento y con los Mensajes de los años 1937, 1938, 1946 y 1947.
Esta agrupación se mantuvo constante al variar el número de palabras más frecuentes analizadas (50, 100 y 350), lo que indica que las asociaciones observadas dependen de algo más que del contenido, el momento o el género.
Conclusión: La mano del dictador es, con muy alta probabilidad, la mano dominante en todos los escritos que se le atribuyen, salvo la mayoría de los Mensajes de Año Nuevo.
Tercera Fase de Análisis
En esta fase se incorporó el Corpus C (textos de potenciales colaboradores) al análisis, para intentar identificar posibles autores de los Mensajes no escritos por Franco.
Hallazgos principales
Se confirmó la separación de los Mensajes de 1937, 1938, 1946 y 1947 (junto con el Testamento) del resto de mensajes, reforzando la conclusión de que estos fueron escritos por Franco.
Colaboradores detectados
Entre los Mensajes de Año Nuevo se insertó uno de los testimonios de Ramón Serrano Suñer, asociándose particularmente con el mensaje del año 1973.
Otras asociaciones
El "Diario de Una Bandera" (texto indubitado de Franco) se agrupó con textos de Adelardo Fernández Arias, sugiriendo posible colaboración.
Árboles de Consenso
Para superar la posible inestabilidad en los resultados y el problema de "cherry-picking", se aplicó el procedimiento estadístico de Bootstrap para generar árboles de consenso que recogen únicamente las relaciones más estables entre los textos.
El árbol de consenso confirmó la agrupación de los Mensajes de 1937, 1938, 1946 y 1947 con el Testamento de Franco, reforzando la conclusión de que fueron escritos por la misma persona.
Los mensajes restantes se agruparon en clústeres dispersos, sugiriendo la existencia de al menos tres autores ajenos a la lista de candidatos analizados.
Análisis de Probabilidad (LR)
Para verificar la posible autoría de Ramón Serrano Suñer del Mensaje de 1973, se aplicó el marco LR (Likelihood Ratio o índice de probabilidad) para comparar ambos textos.
1.63
Índice LR
Valor obtenido al comparar el Mensaje de 1973 con textos de Serrano Suñer
0.83
Comparación control
Valor al comparar con textos de Luis Suárez (otro candidato)
Un LR mayor que 1 indica que la hipótesis de que los dos textos fueron escritos por el mismo autor es más probable que la hipótesis contraria. El resultado de 1.63 sugiere que Ramón Serrano Suñer fue probablemente el autor del Mensaje de 1973.
Análisis LIWC: El Lenguaje del Poder
El análisis LIWC reveló un patrón interesante en el uso de pronombres. Excepto en el Mensaje de 1937, hay una reducida presencia del pronombre "yo" y una sobrerrepresentación del "nosotros". Según Pennebaker, este patrón es característico de líderes políticos que muestran "estar en total control de la situación".
Este análisis complementa los hallazgos estilométricos, mostrando diferencias en el uso del lenguaje que podrían indicar diferentes autores.
Análisis LSM: Coincidencia Estilística
El análisis LSM (Linguistic Style Matching) mide el grado de coincidencia entre diferentes textos en su uso de palabras funcionales, indicando similitud estilística.
0.97
Serrano Suñer
Coincidencia con Mensaje 1973
0.97
Luis Suárez
Coincidencia con Mensaje 1968
0.98
Gutiérrez Iglesias
Coincidencia con Mensaje 1964
Los resultados mostraron que los autores cuyos textos presentan mayor coincidencia con los Mensajes de Año Nuevo son Luis Suárez Fernández, Ramón Serrano Suñer y Agustín Gutiérrez Iglesias, sugiriendo su posible participación en la redacción.
Mecanismos Cognitivos en los Textos
Pensamiento analítico vs. intuitivo
El uso de artículos y preposiciones indica un pensamiento analítico, mientras que los adverbios, verbos auxiliares y conjunciones reflejan un estilo narrativo más intuitivo.
Los textos atribuidos a Franco muestran diferencias significativas: más analítico en sus escritos personales y más intuitivo y directo en los Mensajes al pueblo español.
Esta diferencia podría interpretarse como la capacidad de Franco para adaptar su estilo al destinatario, o como evidencia de que los textos fueron escritos por diferentes personas.
Triangulación de Resultados

Análisis de clúster
Identificó que los Mensajes de 1937, 1938, 1946 y 1947 fueron escritos por Franco, mientras que el resto muestra patrones diferentes.

Índice de probabilidad
Confirmó la probable autoría de Serrano Suñer del Mensaje de 1973 con un LR de 1.63.

Análisis LIWC
Reveló patrones en el uso de pronombres y mecanismos cognitivos que sugieren diferentes autores.

Análisis LSM
Identificó a Luis Suárez, Serrano Suñer y Gutiérrez Iglesias como posibles colaboradores en la redacción.
La convergencia de estos diferentes métodos refuerza la conclusión principal: la autoría de los Mensajes de Año Nuevo es múltiple, con clara participación de Franco en algunos y colaboración de otros en el resto.
Conclusiones Principales
Autoría múltiple
Los Mensajes de Año Nuevo de Franco fueron escritos por varias personas, no exclusivamente por el dictador.
Mensajes de Franco
Franco escribió personalmente los mensajes de los años 1937, 1938, 1946 y 1947, como demuestra su similitud estilística con su Testamento.
Colaboradores identificados
Ramón Serrano Suñer, Luis Suárez Fernández y Agustín Gutiérrez Iglesias probablemente participaron en la redacción de algunos mensajes.
La investigación ha demostrado que la autoría de los Mensajes de Año Nuevo es heterogénea, con la participación de Franco en algunos y la colaboración de otros individuos en el resto, reflejando la complejidad del aparato propagandístico del régimen.
Limitaciones del Estudio
Dependencia de herramientas
Los resultados dependen de las herramientas utilizadas (Stylo, LIWC), que tienen sus propias limitaciones y supuestos.
Tamaño de la muestra
La variabilidad en el tamaño de los textos podría haber afectado los resultados, aunque se tomaron medidas para minimizar este impacto.
Interpretación subjetiva
La interpretación de dendrogramas y análisis LSM requiere un juicio interpretativo, no solo conclusiones cuantitativas.
Corpus incompleto
Faltan los Mensajes de 1940-1945, lo que podría afectar a la comprensión completa de la evolución estilística.
Aportaciones Metodológicas
Análisis de textos en español
Esta investigación demuestra la efectividad de las técnicas estilométricas en textos en español, ampliando su aplicación más allá del ámbito anglosajón.
Combinación de métodos
La triangulación de diferentes técnicas (análisis de clúster, LR, LIWC, LSM) proporciona resultados más robustos y fiables.
Análisis de muestras heterogéneas
Se ha demostrado que es posible obtener resultados consistentes incluso con muestras de texto de tamaños diversos.
Este estudio contribuye al campo de la estilometría demostrando la aplicabilidad de estas técnicas a textos políticos en español y estableciendo un marco metodológico para futuras investigaciones similares.
El Idiolecto y la Estilometría
La huella lingüística personal
Esta investigación confirma la existencia del idiolecto o estilo lingüístico único de cada individuo, formado por la recolección consciente e inconsciente de experiencias que se reflejan en el uso del lenguaje.
Las palabras funcionales tienen propiedades psicométricas que aproximan la huella autoral a los procesos cognitivos del autor, revelando su estado psicológico y cognitivo.
La estabilidad diacrónica de las palabras funcionales las convierte en indicadores fiables para la comparación de textos de diferentes épocas, especialmente relevante en un corpus que abarca cuatro décadas como el analizado en este estudio.
El Lenguaje del Poder en Franco
Uso reducido del "yo"
Los Mensajes muestran un uso mínimo del pronombre "yo", característico de personas en posiciones jerárquicas altas.
Predominio del "nosotros"
Frecuente uso del "nosotros" político, que diluye la responsabilidad y sugiere complicidad colectiva.
Adaptación al público
Estilo más directo e intuitivo en los Mensajes al pueblo y más analítico en sus escritos personales.
El análisis lingüístico revela cómo Franco utilizaba el lenguaje como herramienta de poder, adaptando su estilo según el contexto y la audiencia para proyectar una imagen de autoridad y control.
Ramón Serrano Suñer: El Colaborador Clave
Entre los posibles colaboradores en la redacción de los Mensajes de Año Nuevo, Ramón Serrano Suñer emerge como una figura clave. Cuñado de Franco y ministro durante parte de su régimen, Serrano Suñer muestra una fuerte conexión estilística con varios de los Mensajes, particularmente el de 1973.
El análisis de probabilidad (LR) confirma esta conexión con un valor de 1.63, indicando que es más probable que Serrano Suñer escribiera el Mensaje de 1973 a que lo hiciera otra persona.
La influencia de Serrano Suñer en el régimen franquista fue notable, especialmente en sus primeros años. Su estilo retórico y su visión política parecen haber permeado varios de los Mensajes de Año Nuevo, reflejando su papel como uno de los principales ideólogos del régimen.
Luis Suárez Fernández: El Historiador del Régimen
Perfil
Historiador y académico que mantuvo estrechos vínculos con la familia Franco y ocupó cargos importantes durante el régimen.
Conexión estilística
El análisis LSM muestra una alta coincidencia (0.97) entre su estilo y varios Mensajes de Año Nuevo, especialmente los de los años 60 y 70.
Influencia ideológica
Compartía con Franco la misma visión sobre los valores tradicionales y la civilización cristiana, temas recurrentes en los Mensajes.
Luis Suárez Fernández parece haber tenido un papel significativo en la redacción de algunos Mensajes de Año Nuevo, aportando su visión histórica y su estilo académico a los discursos del dictador.
Agustín Gutiérrez Iglesias: El Colaborador Inesperado
Uno de los hallazgos más sorprendentes del análisis LSM fue la alta coincidencia estilística entre los textos de Agustín Gutiérrez Iglesias y varios Mensajes de Año Nuevo, especialmente el de 1964 (0.98).
¿Quién era Gutiérrez Iglesias?
Aunque no era una figura de primera línea del régimen, Gutiérrez Iglesias recibió la Medalla de Madrid en su categoría de Plata en 1959 por su labor como guardián de documentos de estado durante la guerra civil.
Su relación personal con Franco y su experiencia con documentos oficiales podrían explicar su posible participación en la redacción de algunos Mensajes.
Este hallazgo subraya la importancia de incluir en los análisis de autoría no solo a las figuras más prominentes, sino también a colaboradores menos conocidos que podrían haber tenido un papel significativo en la producción de textos oficiales.
Evolución Estilística de los Mensajes
1
1937-1947
Estilo más personal, con mayor presencia de Franco como autor. Tono bélico y de reconstrucción nacional.
2
1950-1960
Estilo más institucional, con probable participación de colaboradores. Enfoque en logros económicos y reconocimiento internacional.
3
1960-1974
Estilo más técnico y elaborado, con clara intervención de diferentes manos. Énfasis en la modernización y el desarrollo.
El análisis estilométrico revela una evolución en los Mensajes de Año Nuevo que coincide con las diferentes etapas del régimen franquista, reflejando tanto cambios políticos como la creciente participación de colaboradores en su redacción.
Implicaciones Históricas
Aparato propagandístico
La participación de múltiples autores en los Mensajes revela la complejidad del aparato propagandístico del régimen franquista.
Evolución del régimen
Los cambios estilísticos reflejan la evolución del régimen desde el autoritarismo militar hacia un sistema más tecnocrático.
Imagen pública de Franco
Los Mensajes construían una imagen pública cuidadosamente elaborada del dictador, adaptada a cada momento histórico.
Este estudio contribuye a la comprensión de cómo el régimen franquista utilizaba la comunicación política para legitimar su poder y adaptarse a los cambios sociales y políticos a lo largo de cuatro décadas.
Futuras Líneas de Investigación
Ampliar el corpus
Incorporar los Mensajes faltantes (1940-1945) y más textos de los posibles colaboradores para un análisis más completo.
Nuevas técnicas
Aplicar técnicas de aprendizaje profundo y procesamiento del lenguaje natural más avanzadas para un análisis más preciso.
Análisis comparativo
Comparar con discursos de otros líderes autoritarios para identificar patrones comunes en la retórica dictatorial.
Otros textos de Franco
Extender el análisis a otros textos atribuidos a Franco para verificar su autoría y comprender mejor su estilo personal.
El Caso de "A Funeral Elegy"
Un caso comparable al de los Mensajes de Franco es el de "A Funeral Elegy", un poema publicado en 1612 con las iniciales "W.S." que Donald W. Foster atribuyó a William Shakespeare en 1989.
Foster utilizó técnicas estilométricas para argumentar que el poema había sido escrito por Shakespeare, generando un intenso debate académico que culminó en la portada del New York Times.
Sin embargo, investigaciones posteriores de Elliot, Valenza y Brian Vickers demostraron que el poema probablemente fue escrito por John Ford, no por Shakespeare. En 2002, el propio Foster aceptó esta conclusión.
Este caso ilustra tanto el potencial como las limitaciones de la estilometría, y la importancia de contrastar resultados con múltiples métodos.
El Caso de "The Federalist Papers"
Uno de los casos más célebres de atribución de autoría es el de "The Federalist Papers", una serie de ensayos publicados entre 1787 y 1788 bajo el seudónimo de "Publius" para promover la ratificación de la Constitución de Estados Unidos.
1
El misterio de la autoría
Aunque se sabía que Alexander Hamilton, James Madison y John Jay habían participado en su redacción, la autoría de 12 ensayos específicos era disputada entre Hamilton y Madison.
2
El análisis de Mosteller y Wallace
En 1964, Frederick Mosteller y David Wallace aplicaron métodos estadísticos bayesianos al análisis de palabras funcionales, concluyendo que Madison era el autor de los 12 ensayos disputados.
3
Un hito en la estilometría
Este estudio se convirtió en un referente para la estilometría moderna, demostrando la eficacia del análisis de palabras funcionales para la atribución de autoría.
El Caso de "The Revenger's Tragedy"
"The Revenger's Tragedy" es una obra teatral anónima presentada por primera vez en 1607, cuya autoría ha sido objeto de debate durante siglos.
Inicialmente atribuida a Cyril Tourneur en 1656 sin evidencia sólida, en 1926 E.H.C. Oliphant propuso a Thomas Middleton como su verdadero autor, iniciando un largo debate académico.
Diversos análisis estilométricos, desde Peter Murray (1964) hasta Hugh Craig (2004), han aplicado diferentes técnicas para resolver esta cuestión, incluyendo análisis de frecuencias de palabras, contracciones y análisis discriminatorio.
Los resultados sugieren que Middleton fue el autor principal, aunque posiblemente con la colaboración de otros dramaturgos, demostrando la complejidad de la autoría en textos históricos.
El Método CUSUM de Morton
Andrew Morton desarrolló en 1978 el método CUSUM (suma acumulativa) para la atribución de autoría, que generó tanto entusiasmo como controversia en el campo de la estilometría.
El método
CUSUM analiza la homogeneidad o estabilidad de características textuales, tradicionalmente el porcentaje de palabras con dos o tres letras, para identificar cambios en la media de frecuencias.
Aplicaciones
Morton aplicó su método a textos bíblicos como Las Epístolas Paulinas y a casos forenses, ganándose el apodo de "detective literario" por su colaboración con la policía londinesa.
Controversia
En 1993, Morton fue desafiado en un programa de televisión británico donde fracasó al intentar distinguir entre los escritos de un delincuente y los de un juez, dañando la credibilidad del método.
Aunque el método CUSUM ha sido ampliamente criticado por su subjetividad y falta de base teórica sólida, representa un importante capítulo en la historia de la estilometría y ha inspirado desarrollos posteriores en el campo.
Neuronas Espejo y Coincidencia Estilística
La base neurológica del estilo
Investigaciones recientes sugieren que las neuronas espejo, descubiertas inicialmente en monos macacos en los años 80, podrían explicar por qué tendemos a imitar el estilo lingüístico de otros.
Estas neuronas se activan tanto cuando realizamos una acción como cuando observamos a otros realizarla, creando una base neurológica para la empatía y la imitación.
Curiosamente, existe una mayor densidad de neuronas espejo en el área de Broca del cerebro, que también cumple un papel destacado en el procesamiento de palabras funcionales.
Esta conexión podría explicar por qué la coincidencia de estilos lingüísticos (medida por el LSM) refleja no solo similitud estilística sino también sincronía emocional o conceptual entre autores.
El Lenguaje como Huella Digital vs. ADN
La metáfora del ADN
A menudo se compara el estilo lingüístico con el ADN o las huellas dactilares, sugiriendo que cada autor tiene una "firma" única e inconfundible.
Sin embargo, esta analogía tiene limitaciones importantes. A diferencia del ADN, que es estable y único, el lenguaje es dinámico y está influenciado por múltiples factores.
Diferencias clave
  • El ADN es un sistema biológico; el lenguaje es un sistema sociocultural
  • El ADN tiene unidades discretas; el lenguaje tiene infinitas combinaciones
  • El ADN es estable; el estilo lingüístico puede evolucionar
  • El ADN tiene pocos polimorfismos; el lenguaje tiene innumerables variantes
Una formulación más precisa sería: "Al igual que el análisis de ADN se utiliza para la individualización genética, la estilometría se utiliza para la individualización lingüística del estilo del individuo".
La Evolución de las Herramientas Estilométricas
Desde sus humildes comienzos hasta las técnicas computacionales más avanzadas, las herramientas para el análisis de la autoría han experimentado una transformación radical. Esta evolución refleja no solo el avance tecnológico, sino también una comprensión más profunda de los patrones lingüísticos que definen el estilo individual de un autor.

Métodos estadísticos básicos
Análisis de frecuencias de palabras, longitud de oraciones y distribuciones estadísticas. Estos métodos pioneros, desarrollados a finales del siglo XIX y principios del XX, permitieron las primeras aproximaciones científicas al problema de la autoría textual.
Análisis multivariante
Análisis de componentes principales, análisis discriminante y medidas de distancia como Delta. Estas técnicas, popularizadas entre los años 1960 y 2000, permitieron analizar simultáneamente múltiples variables estilísticas, aumentando significativamente la fiabilidad de los resultados.
Inteligencia artificial
Redes neuronales, algoritmos genéticos y técnicas de aprendizaje automático para el análisis estilométrico. A partir del 2000, estas tecnologías han revolucionado la estilometría al identificar patrones sutiles que escapan al análisis humano.
Análisis de redes y procesamiento contextual
Técnicas avanzadas que analizan no solo las características lingüísticas aisladas, sino también las relaciones entre ellas y su contexto semántico. Estos métodos contemporáneos integran aspectos cognitivos y sociolingüísticos, permitiendo análisis más holísticos.
La estilometría ha evolucionado desde simples conteos manuales hasta sofisticados algoritmos de inteligencia artificial, aumentando significativamente su precisión y aplicabilidad en la atribución de autoría. Esta transformación metodológica ha permitido que los investigadores aborden textos más complejos y diversificados, desde documentos históricos hasta publicaciones digitales contemporáneas.
El desarrollo paralelo de herramientas informáticas especializadas como JGAAP, Stylo R, y más recientemente, aplicaciones basadas en modelos de lenguaje de gran escala, ha democratizado el acceso a estos análisis, permitiendo que investigadores de diversas disciplinas puedan incorporar técnicas estilométricas en sus estudios. Esta democratización tecnológica ha propiciado un aumento exponencial en las aplicaciones de la estilometría, que trascienden el ámbito filológico para extenderse a campos como la historia, el derecho, la psicología e incluso la seguridad informática.
El Problema del "Cherry Picking"
Uno de los desafíos más importantes en la estilometría es el problema del "cherry picking" o selección arbitraria de características a analizar, que puede influir significativamente en los resultados.
El problema
La elección del número y tipo de características lingüísticas a analizar (palabras frecuentes, raras, funcionales) puede condicionar los resultados del análisis.
Solución: Bootstrap
El método Bootstrap genera múltiples permutaciones aleatorias de los datos, creando miles de dendrogramas virtuales que se combinan en un árbol de consenso.
Árboles de consenso
Estos árboles muestran solo las relaciones más estables entre los textos, aumentando la fiabilidad de los resultados estilométricos.
En esta investigación, el uso de árboles de consenso con un umbral de robustez de 0.6 permitió superar el problema del cherry picking, ofreciendo resultados más fiables sobre la autoría de los Mensajes de Año Nuevo.
La Autoría Colaborativa en Textos Políticos
Un fenómeno común
La autoría colaborativa es habitual en textos políticos, donde líderes, asesores y redactores participan en la creación de discursos y documentos oficiales.
El caso de los Mensajes de Año Nuevo de Franco no es excepcional, sino que refleja una práctica común en regímenes políticos de todo tipo.
Otros ejemplos incluyen los discursos de presidentes estadounidenses como Bill Clinton, cuyos textos eran elaborados por equipos de redactores y revisados por asesores antes de su aprobación final.
Esta realidad plantea desafíos metodológicos para la atribución de autoría, que debe considerar la posibilidad de múltiples manos en un mismo texto.
Tipos de Coautoría en Textos Políticos

Coautoría colectiva
Varios autores contribuyen directamente a la redacción del texto, alternando secciones o trabajando conjuntamente.

Coautoría precursora
Incorporación de material significativo de escritores previos, adaptándolo al nuevo contexto.

Coautoría ejecutiva
El líder político presta su nombre y autoridad al texto, aunque no lo haya escrito personalmente.

Coautoría revisionista
Editores y revisores modifican sustancialmente el texto original, alterando su estilo y contenido.
Los Mensajes de Año Nuevo de Franco probablemente combinaron varios de estos tipos de coautoría, con el dictador escribiendo algunos personalmente, mientras que otros fueron redactados por colaboradores y posteriormente aprobados por él.
Aplicaciones de la Estilometría en la Historia
Textos bíblicos
Determinación de la autoría de textos bíblicos como las Epístolas Paulinas, distinguiendo entre aquellos escritos por Pablo y los atribuidos a él.
Literatura clásica
Resolución de controversias sobre la autoría de obras de Shakespeare, Cervantes y otros autores clásicos.
Lingüística forense
Identificación de autores de notas de rescate, amenazas y otros documentos relevantes en investigaciones criminales.
El Futuro de la Estilometría
Inteligencia artificial avanzada
Desarrollo de algoritmos de aprendizaje profundo capaces de analizar patrones lingüísticos complejos con mayor precisión.
Análisis multilingüe
Expansión de técnicas estilométricas a más idiomas, superando el predominio actual del inglés en la investigación.
Integración con neurociencia
Combinación de estilometría con estudios de neuroimagen para comprender mejor la relación entre cerebro y estilo lingüístico.
Aplicaciones históricas
Resolución de controversias históricas sobre autoría de documentos políticos, literarios y religiosos.
El futuro de la estilometría promete avances significativos que ampliarán su aplicación y precisión, contribuyendo a nuestra comprensión del lenguaje, la historia y la identidad individual.
Conclusión: Más Allá de la Autoría
Esta investigación sobre los Mensajes de Año Nuevo de Franco va más allá de la simple determinación de autoría, ofreciendo una ventana a la complejidad del régimen franquista y sus mecanismos de comunicación política.
Contribución metodológica
Demuestra la eficacia de combinar múltiples técnicas estilométricas para abordar problemas complejos de autoría en textos políticos en español.
Aportación histórica
Revela la evolución del aparato propagandístico del franquismo y la participación de diferentes colaboradores en la construcción de la imagen pública del dictador.
Perspectiva interdisciplinar
Integra conocimientos de lingüística, estadística, informática, psicología e historia para ofrecer una visión más completa del fenómeno estudiado.
La estilometría se revela así no solo como una herramienta para resolver enigmas de autoría, sino como un puente entre las humanidades digitales y la investigación histórica tradicional, abriendo nuevas vías para comprender nuestro pasado.