Teoría de la Información en Polymarket: Cómo una fórmula de 77 años imprime millones para quants

En 1986, Barron's rankeó 1.026 fondos mutuos por rendimiento. El portafolio personal de Claude Shannon superó a 1.025 de ellos.

Shannon no era un gestor de fondos. No era un quant de Wall Street. Era el profesor del MIT que inventó la teoría de la información — la matemática detrás de cada JPEG, cada módem, cada algoritmo de compresión en la Tierra. Entre finales de los '50 y 1986, su portafolio rindió 28% anual. Durante las mismas tres décadas, el Berkshire Hathaway de Warren Buffett rindió 27%.

Shannon le ganó a Buffett usando la misma matemática que había diseñado para líneas telefónicas.

Esto suena a coincidencia. No lo es. El enfoque de Shannon era metódico, derivado directamente de sus propios papers de teoría de la información. No elegía acciones con el gut. Medía el contenido de información de cada apuesta — en bits — y dimensionaba las posiciones en consecuencia.

Y uno de sus colegas llevó el método aún más allá.

Edward Thorp — profesor de matemática, leyenda del blackjack — llegó a la oficina del MIT de Shannon en los '60 con un sistema de conteo de cartas. Shannon escuchó, y le entregó un paper de Bell Labs de John Kelly titulado A New Interpretation of Information Rate. El paper usaba la entropía de Shannon para derivar el tamaño de apuesta matemáticamente óptimo para cualquier juego con edge positivo.

Thorp llevó la matemática a Vegas. Ganó $11.000 en un solo fin de semana en blackjack. Luego la llevó a Wall Street.

Midiendo el Edge con KL-Divergencia

Thorp calculó una versión de este número en cada warrant que operó. Buffett lo usa implícitamente al dimensionar posiciones. En Polymarket tiene un nombre limpio: KL-divergencia.

La mayoría de los traders de Polymarket miden el edge en dólares. Rastrean ganancias, ignoran pérdidas, y confunden suerte con habilidad. Shannon y Thorp medían el edge en bits de información — y construían portafolios que se capitalizaban por décadas mientras todos los demás estallaban en una sola mala apuesta.

P = tu estimación de probabilidad
Q = la estimación del mercado (el precio)
D_KL = literalmente cuántos bits de información tenés que el mercado no tiene

La KL-divergencia no es una metáfora del edge. Literalmente ES el edge — medido en bits.

Ejemplo: Mercado: "¿Trump perdonará a X antes del 31 de dic?" Precio actual: 0.35 (mercado estima 35% SÍ). Tu modelo (basado en 20 perdones históricos): 0.55.

DKL = 0.55 · log2(0.55 / 0.35) + 0.45 · log2(0.45 / 0.65)
= 0.55 · 0.652 + 0.45 · (−0.530)
= 0.359 − 0.239
= 0.120 bits

Workflow en 5 pasos

# 1. Obtener todos los mercados abiertos de Polymarket
import requests

markets = requests.get(
    "https://clob.polymarket.com/markets"
).json()

# 2. Calcular tu probabilidad para cada mercado
def estimate_probability(market_id):
    # Tu modelo acá — datos históricos, signals, etc.
    return your_model_estimate

# 3. Calcular KL-divergencia para cada mercado
import numpy as np

def kl_divergence(p, q):
    p = np.clip(p, 0.01, 0.99)
    q = np.clip(q, 0.01, 0.99)
    return p * np.log2(p/q) + (1-p) * np.log2((1-p)/(1-q))

# 4. Ordenar por edge y operar solo los top 5-10
edges = [(m, kl_divergence(estimate_probability(m), m['price']))
         for m in markets]
top_positions = sorted(edges, key=lambda x: x[1], reverse=True)[:10]

# 5. Ignorar el resto — el edge está en la selectividad
for market, edge_bits in top_positions:
    if edge_bits > 0.05:
        print(f"EDGE: {edge_bits:.3f} bits — OPERAR")

II · Fusión de Señales sin Overfitting

Tenés varias señales que se contradicen: noticias, tasa base histórica, order book, sentiment de Twitter, predicciones de otros modelos. ¿Cómo combinarlas?

Los enfoques naive fallan:

• Promediar — descarta información, pesa todas las señales por igual
• Ensambles de ML — necesitan muchos datos, overfitean en backtests, mueren en trading real
• Pesos manuales — subjetivos, colapsan en nuevos regímenes de mercado

    Cuando tenés información incompleta, la única distribución de probabilidad honesta es la de máxima entropía bajo las restricciones conocidas.

    No metas supuestos escondidos. Usá solo los hechos que realmente tenés. Dejá todo lo demás maximally uncertain.

La entropía máxima no overfitea. No puede — por construcción. No podés extraer más información de una distribución que las restricciones que le metiste. Jaynes lo probó en 1957. Los ensambles de ML todavía no llegaron.

⚠️ III · Detector de Insiders

Polymarket tiene insiders. Mercados políticos — la gente sabe decisiones antes del press release. Deportes — el staff sabe lesiones. Mercados de personas — los amigos saben los planes. ¿Podés detectarlos moviéndose?

Un mercado normal se mueve lentamente, reaccionando al flujo de noticias. Un insider se mueve diferente: sabe el resultado, abre una posición grande, el precio chasca en una dirección, y la entropía colapsa tajam.

dH/dt = tasa de cambio de entropía en el tiempo
σH = desvío estándar histórico de los cambios de entropía
k = umbral (típicamente 3 — regla de 3-sigma)

Alertar cuando |dH/dt| supera las 3 desviaciones estándar de la media histórica. Si no hay noticias públicas en ese momento — alguien sabe algo.

Octubre 2024 — Caso documentado

Mercado: "¿Trump ganará Pennsylvania?" Entre las 14:00 y las 14:15 EST, el precio se mueve de 0.52 a 0.68 con órdenes grandes de un solo wallet. La entropía cae de 0.998 a 0.905 bits en 15 minutos — un evento de 7-sigma. No hubo noticias públicas en ese momento.

Las siguientes noticias públicas llegaron 47 minutos después. Ese wallet ganó ~$340.000 durante esa hora.

La SEC usa técnicas similares para detectar insider trading en acciones — la literatura académica dates de principios de los 2000. Casi nadie la aplica a Polymarket, a pesar de los datos públicos y más insiders.

$0 → Edge medible
en 5 líneas de Python

Tres herramientas. Un framework. 77 años de edad.

• Edge en bits: KL-divergencia cuantifica tu alpha antes de operar. Si D_KL < 0.05, estás adivinando. Si D_KL > 0.10, estás operando. Si D_KL > 0.30, tu matemática está mal.

• Sin overfitting: Máxima entropía fusiona señales sin inventar información. Jaynes lo probó en 1957. Los ensembles de ML todavía no llegaron.

• Insiders, no noticias: La entropía colapsa minutos antes del press release. Mirá dH/dt o seguí sorprendido.

• El framework se capitaliza: Shannon: 28%/año por 30 años. Thorp: 19%/año por 20 años. Cero temporadas perdedoras. La misma matemática.

La barrera nunca fue la inteligencia. Fue el acceso. Esa barrera se fue.

Fuente: @Dipper_pol · Polymarket Researcher
Adaptado por ADMP

Teoría de la Información en Polymarket