Ley de Benford o cómo detectar un fraude a Hacienda mirando números

La ley matemática detrás de la altura de las montañas y los fraudes fiscales

Ley de Benford

La Ley de Benford o ley del primer dígito es una fórmula matemática que calcula la probabilidad de que un conjunto de datos numéricos comiencen por una cifra en concreto.

Es decir, podemos recopilar cifras aleatorias como facturas, datos demográficos, número de vecinos de una escalera o la altura de todas las montañas de España y el patrón se repetirá constantemente: los números que empiezan por 1 representarán el 30%, el 2 un poco más del 17%, el 3 algo más del 12 % y el resto, del 4 al 9, irán disminuyendo.

la ley de benford: ¿Magia o lógica?

La Ley de Benford se cumple en dos escenarios.

  1. Datos originados en procesos de crecimiento exponencial. Suelen tener magnitudes muy diferentes, de muy pequeños a muy grandes, por ejemplo, entre 0,005 y 10.000.000, una característica común de los conjuntos que siguen esta ley.
  2. Datos que no cambian si les aplicamos un conjunto de transformaciones respecto a la escala. Cumplen la ley los datos expresados en cualquier unidad de medida, por ejemplo, centímetros, pies o millas.

Lo ideal es trabajar con datos de cuatro o más dígitos y con una muestra significante.

Existen, sin embargo, excepciones, ya que si quisiéramos recopilar los teléfonos móviles de España, todos empezarían por el número seis. Por eso hay que insistir en que esta fórmula matemática solo se cumple cuando analizamos datos aleatorios. En esta web la aplican con ejemplos tan dispares como la distancia, en kilómetros, entre ciudades europeas o la contraseña más común utilizada en teléfonos Iphone.

Quién la descubrió

En 1881 el astrónomo y matemático Simon Newcomb se percató, mientras miraba unos libros de logaritmos, que las primeras páginas estaban más desgastadas. Eran las que aparecían los números que empezaban por uno.

Esto le llevó a formular el siguiente principio: “En una lista de números tomada de un conjunto arbitrario de datos hay más números que comienzan por uno que con cualquier otro dígito”. Newcomb publicó esta hipótesis en la revista ‘American Journal of Mathematics’, estableciendo la fórmula para la probabilidad de que un número en una serie de datos comience por el dígito d:

Pd = log10 (1 + 1/d) 

Unos años más tarde, en 1938, el físico Frank Benford retomó esta teoría en artículo ‘The law of anomalous numbers’ que publicó en la ‘Proceedings of the American Philosophical Society’, tras detectar una coincidencia mientras observaba una serie de tablas numéricas: los números más bajos se repetían como primer dígito con más frecuencia que los más altos, algo que verificó en más de 20 000 números de muestras dispares.

Para qué sirve

Además de anecdótica, la Ley de Benford se emplea con más frecuencia de lo que podría parecer. La serie de Netflix ‘Connected’ le dedica un capítulo, ‘Digits’, en el que desgranan cómo se aplica en la vida real. En entrevista, la profesora de la University of Maryland Jen Golbeck comparte cómo empleó esta teoría en una investigación sobre las redes sociales para descubrir que las cuentas que no seguían el patrón de Benford eran bots rusos, revelando miles de cuentas falsas.

También se utiliza para detectar posible fraude electoral, como hizo el profesor Boudewijn Roukem de la Universidad Nicolás Copérnico de Polonia para analizar los resultados de los comicios celebrados en Irán en 2009. A Roukema le sorprendió el hecho de que los votos a Mahmoud Ahmadinejad tuvieran menos unos y más dos y tres de lo esperado, y que su opositor, Mehdi Karroubi, computara el doble de votos empezando por siete, contradiciendo a la ley matemática.

Miguel Ángel Pesquera, de la Universidad de Cantabria, empleó esta hipótesis para comprobar la eficiencia de los puertos españoles y plantear mejoras para su funcionamiento, según los resultados que obtuvo del volumen de tráfico y de contenedores.

Ley de Benford

Fórmula antifraude

La aplicación estrella de Ley de Benford es para detectar el fraude fiscal. El profesor de contabilidad Mark Nigrini introdujo esta hipótesis en su tesis doctoral en 1992 mediante el diseño de un programa informático para detectar en qué medida encajan con  esta ley matemática algunos datos suministrados. 

Su teoría es que si alguien intenta falsificar su declaración de la renta tendrá que inventar algún dato. Por lo visto, la tendencia del defraudador es utilizar números que empiezan por dígitos situados a mitad de la escala, como el 5, el 6 y el 7 y pocos que empiezan por uno. Esta violación de la Ley de Benford no implica necesariamente  que se ha cometido, pero sí da pie a comenzar una inspección más detallada.

Hay instituciones que confían en la teoría de Nigrini. El Departamento de Hacienda de Estados Unidos, sin ir más lejos, determinó que si una cifra empieza por tres y aparece el 40% de las veces, en vez del 12,5%, indica que hay indicios para investigar el fraude fiscal.

En Nobbot | El ecólogo que dibuja con matemáticas las relaciones en la naturaleza

Fotos | Paine Publishing, YouTube/Universidad Miguel Hernández de Elche, Gerd Altmann / Pixabay, Jack Prichett/Unsplash

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *