Al momento de utilizar los signos de puntuación todos nos hemos hecho las mismas preguntas: ¿Debería ir un punto aquí o una coma? ¿No sería mejor usar comillas? Y como bien sabemos, no hay una respuesta precisa.
Para muchos, la puntuación es un mal necesario que sería mejor ignorar siempre que sea posible. Por eso hay personas que dirán que un signo es mejor que otro, y viceversa. Pero te podemos asegurar que todas las elecciones gramaticales que hacemos sobre un papel no son triviales. Al contrario, siguen patrones matemáticos universales y compartidos por todos los idiomas.
En un análisis reciente de la Academia de Ciencias de Polonia (IFJ PAN) se descubrió que la literatura está llena de matemáticas. Hay cientos de obras occidentales que emplean las mismas características estadísticas en el uso de signos de puntuación.
Por lo tanto, las comas, los signos de exclamación y los puntos finales podrían ser indispensables para la perfección de cada lengua estudiada.
La estadística de los signos

En total, los investigadores estudiaron 240 obras literarias populares escritas en siete idiomas occidentales: inglés, alemán, francés, italiano, español, polaco y ruso. Esto debido a que ellos asumieron que no menos de 50 millones de personas deberían hablar el idioma en cuestión, y que las obras escritas en él deberían haber sido galardonadas con no menos de cinco premios Nobel de Literatura. En pocas palabras, era una prueba de validez para encontrar escritores como Dickens, Doyle, Hemingway, Kipling, Orwell, Nietzsche, Verne, Eco o Cervantes.
Aunque también se aseguraron de que cada libro tuviera al menos 1.500 secuencias de palabras separadas por signos de puntuación. Esto con la finalidad de poder comparar los resultados a través de estadísticas.
Una vez reunidos los datos, los investigadores verificaron la distancia entre los signos de puntuación consecutivos y el tipo de signo que usaban en mayor o menor medida. Fue entonces cuando se hizo evidente que en todos los idiomas estudiados había un patrón matemático al escribir, el cual se describía con una de las variantes de la distribución de Weibull.
“Hemos tomado todos los signos de puntuación bajo una lupa estadística, y también hemos observado lo que sucede con la puntuación durante la traducción».
Stanislaw Drozdz, profesor de la IFJ PAN
Una literatura predecible

La distribución de Weibull es una gráfica continua y triparamétrica, es decir, está completamente definida por tres parámetros. Una curva de este tipo tiene una forma característica: crece rápidamente al principio y luego, después de alcanzar un valor máximo, desciende lentamente hasta un cierto valor crítico.
Curiosamente, las longitudes de las secuencias de palabras entre signos de puntuación coincidían con la forma funcional de la distribución de Weibull. Para todos las obras literarias estudiadas la concordancia resultó ser casi completa, lo cual es bastante curioso desde el punto de vista matemático. En especial porque esta distribución se usa generalmente para describir fenómenos de supervivencia, como un grupo de población en función de la edad.
“Dado que la distribución de Weibull se ocupa de fenómenos como la supervivencia, se puede decir sin demasiada ironía que la puntuación tiene en su naturaleza una lucha literalmente incrustada por supervivencia”.
Stanislaw Drozdz
El presente análisis es una extensión de otras observaciones previas del equipo sobre la variación de la longitud de las oraciones en las obras de la literatura mundial. La diferencia está en que, en este caso, decidieron analizar directamente la puntuación en lugar de la separación entre dos oraciones. Incluso determinaron la función de riesgo, es decir, la probabilidad condicional de hallar el siguiente signo de puntuación.
Gracias a esto ahora sabemos tres cosas muy importantes:
- Primero, que los idiomas dependen de la puntuación y, a su vez, la puntuación depende de las matemáticas.
- Segundo, que el idioma caracterizado por la menor propensión a usar puntuación es el inglés, con el español no muy lejos.
- Y tercero, que la puntuación alemana parece combinar características de muchos idiomas, convirtiéndola en una especie de puntuación en esperanto.
¿Qué significa todo esto?

En pocas palabras, no elegimos los signos de puntuación de forma aleatoria. Todo sigue una gran secuencia estadística que nos ayuda a interpretar el mensaje de forma rápida y clara.
Si no hubiera orden en los elementos en el texto, sería mucho más difícil interpretarlo a medida que se añaden nuevas palabras. Por lo tanto, lo signos de puntuación son ese respiro lógico que evita que una oración demasiado larga pueda volverse incomprensible.
En la comunicación hablada, también seguimos patrones justificados por la fisiología humana: cada vez que recuperamos el aliento o nos tomamos un momento para estructurar lo que vamos a decir a continuación. Pero en la literatura no podemos hacer eso, así que, inconscientemente, hemos creado patrones matemáticos para darle sentido y valor a nuestras palabras.
Referencias:
Universal versus system-specific features of punctuation usage patterns in major Western languages https://dx.doi.org/10.1016/j.chaos.2023.113183