Arquitectura del Sistema y Base de Investigación

Un sistema de trading sistemático de futuros construido sobre 14 artículos de investigación revisados por pares que abarcan microestructura de mercado, momentum en series de tiempo, pronóstico de volatilidad y validación estadística.

Section I

Axiomas Fundamentales

Cuatro principios innegociables que limitan toda decisión de diseño en el sistema.

Análisis Basado en la Realidad

El precio es la única verdad fundamental. Cuando cualquier resultado analítico contradice el comportamiento de precio observado, el análisis es erróneo. Informado por Bouchaud, Farmer y Lillo (2009): la mayoría de la información del mercado proviene de dinámicas de oferta y demanda, no de noticias externas.

La Supervivencia Precede el Beneficio

El objetivo principal es sobrevivir el tiempo suficiente para que la ventaja se capitalice. Toda estrategia debe pasar la prueba de Sharpe Deflactada (Bailey y López de Prado, 2014), que corrige el sesgo de selección bajo pruebas múltiples. El tamaño de posición usa una fracción conservadora del Criterio de Kelly, manteniendo un margen de seguridad contra la sobreestimación de ventaja.

Modularidad y Aislamiento

Todo componente es independientemente testeable y reemplazable. La interfaz de procesamiento permanece invariante ya sea consumiendo datos históricos o feeds de mercado en vivo. Validado mediante CPCV (López de Prado, 2018), que exige que el desempeño sea testeable en todas las divisiones de datos combinatorias.

Dejar Correr a los Ganadores

Una porción de cada posición toma una salida fija para rentabilidad de tasa base. El resto sigue con un stop más amplio, capturando la extensión completa de los movimientos de tendencia. Consistente con Moskowitz, Ooi y Pedersen (2012): el momentum en series de tiempo en futuros persiste por 1-12 meses. El trabajo del sistema es mantenerse en la operación el tiempo suficiente para capturar esa persistencia.

Section II

Arquitectura de Decisión

Toda operación pasa por un pipeline de múltiples capas. Ninguna señal única desencadena la ejecución, condiciones múltiples independientes deben converger antes de desplegar capital. La mayoría de señales candidatas se rechazan en la primera capa.

Filtro Direccional de Marco Temporal Superior

Múltiples marcos temporales superiores deben confirmar alineación direccional antes de que la capa de ejecución considere cualquier entrada. Este filtro se basa en investigación sobre persistencia de momentum en series de tiempo en mercados de futuros (Moskowitz, Ooi y Pedersen, 2012) y el hallazgo empírico de que el flujo de órdenes exhibe memoria larga entre marcos temporales (Bouchaud, Farmer y Lillo, 2009). El filtro es el más poderoso del sistema, la mayoría de señales candidatas nunca lo pasan.

Detección de Señal de Entrada

Una vez que se confirma la alineación direccional, el sistema evalúa patrones de acción de precio estructurales para la calidad de entrada. Cada trigger candidato se puntúa contra múltiples criterios. Solo los patrones que cumplen el umbral de calidad avanzan a evaluación de confluencia.

Puntuación de Confluencia

Señales múltiples independientes deben converger antes de desplegar capital. Cada señal contribuye a una evaluación ponderada de confluencia; el sistema requiere acuerdo suficiente antes de actuar. Este enfoque multifactor reduce la probabilidad de actuar sobre señales espurias (Gu, Kelly y Xiu, 2020).

Calibración de Riesgo

La colocación de stop-loss y el tamaño de posición se calibran a la volatilidad actual del mercado, no a parámetros fijos. El sistema usa cálculos basados en ATR que se adaptan dinámicamente, asegurando riesgo consistente por operación en términos de dólares independientemente de las condiciones del mercado (Corsi, 2009).

Section III

Análisis Multi-Temporal

El sistema analiza el precio a través de una jerarquía de marcos temporales, de tendencia macro hacia contexto de ejecución. Los marcos temporales superiores tienen más autoridad, la capa de ejecución solo actúa cuando la jerarquía más amplia confirma sesgo direccional.

El filtro detecta la huella observable del fraccionamiento de órdenes institucionales. Las órdenes padre grandes de participantes institucionales se dividen en miles de órdenes hijo ejecutadas a lo largo de períodos extendidos. Esto crea una propiedad de memoria larga en el flujo de órdenes (Bouchaud, Farmer y Lillo, 2009), lo que significa que el sesgo direccional en marcos temporales superiores tiene poder predictivo genuino para el marco temporal de ejecución. No por recurrencia de patrones, sino por desequilibrio persistente de oferta y demanda que toma tiempo en absorber completamente.

Esto es consistente con investigación que muestra que el momentum en series de tiempo persiste durante 1-12 meses a través de docenas de mercados de futuros (Moskowitz, Ooi y Pedersen, 2012). El sistema no intenta predecir cuándo terminará el momentum, participa mientras la jerarquía de marcos temporales superiores confirma que la tendencia está intacta, y sale cuando no lo está.

Section IV

Generación de Señales

Dentro del pipeline de decisión, tipos de señales específicas se evalúan en las capas de trigger y confluencia. Cada tipo de señal está fundamentado en investigación de microestructura de mercado.

Detección de Barrido de Liquidez

Los barridos de precio por encima de máximos conocidos o por debajo de mínimos conocidos desencadenan clusters de órdenes de stop en reposo, proporcionando liquidez de contrapartida para entradas institucionales. Estos eventos crean una dislocación temporal entre precio y flujo de órdenes subyacente. La mecánica es consistente con el modelo de Kyle (1985) de trading informado e impacto de precio, y con el marco Almgren-Chriss (2001) para descomposición de impacto temporal versus permanente. Cuando un barrido agota la liquidez disponible en un nivel, el movimiento de precio resultante lleva información sobre el verdadero balance de oferta y demanda.

Desequilibrio de Flujo de Órdenes

La relación lineal entre desequilibrio de flujo de órdenes y cambios de precio contemporáneos es una de las regularidades más fuertes en microestructura de mercado. Cont, Kukanov y Stoikov (2014), publicado en el Journal of Financial Econometrics, establecieron que el desequilibrio de flujo de órdenes domina el volumen crudo como predictor de precio a corto horizonte. El sistema aprovecha esta relación para evaluar la convicción direccional detrás de movimientos de precio observados.

Huellas Institucionales

Las órdenes padre grandes de participantes institucionales se dividen en miles de órdenes hijo, creando un patrón distintivo de flujo direccional persistente. Lillo y Farmer (2004) documentaron esta propiedad de memoria larga, y Bouchaud, Farmer y Lillo (2009) mostraron que los mercados "digieren lentamente" estos cambios de oferta y demanda durante períodos extendidos. El sistema identifica las firmas observables de este proceso de fraccionamiento institucional a través de múltiples marcos temporales.

Section V

Arquitectura de Salida Escalonada

Toda posición se divide en múltiples contratos con estrategias de salida distintas, equilibrando la tensión fundamental entre confiabilidad y magnitud.

El contrato de objetivo fijo reduce varianza asegurando ganancias en un nivel predefinido, ajustado por volatilidad. Esto establece la rentabilidad de tasa base del sistema, incluso si la porción trailing se detiene en breakeven, la salida fija ya ha capturado valor.

El contrato trailing runner captura la extensión completa de movimientos de tendencia. La investigación sobre momentum en series de tiempo (Moskowitz, Ooi y Pedersen, 2012) muestra que la persistencia de tendencia en mercados de futuros es tanto estadísticamente significativa como económicamente significativa a través de docenas de instrumentos durante décadas. El stop más amplio y adaptativo del runner está diseñado para mantenerse en la operación el tiempo suficiente para capturar esta persistencia, convierte ganancias ocasionales grandes en el principal impulsor de retornos de cartera.

Section VI

Arquitectura de Riesgo

La gestión de riesgo no es una característica de este sistema, es el sistema. Todo mecanismo generador de beneficio opera dentro de restricciones duras que no pueden ser anuladas por fortaleza de señal, convicción, o cualquier otro factor.

Tamaño Fraccionario de Kelly

El Criterio de Kelly (Kelly, 1956) define el tamaño de apuesta teóricamente óptimo para maximizar el crecimiento geométrico a largo plazo. Sin embargo, Thorp (2008) demostró que incluso la sobreestimación modesta de ventaja en Kelly completo produce drawdowns catastróficos. El sistema usa una fracción conservadora del tamaño óptimo de Kelly, sacrificando deliberadamente la tasa de crecimiento esperada a cambio de varianza materialmente más baja y probabilidad reducida de ruina. La fracción de Kelly se reestima periódicamente a partir de estadísticas comerciales realizadas.

Límites Drawdown Escalonados

Los límites drawdown por operación, diario y semanal forman capas de contención anidadas. Cada capa opera independientemente, un incumplimiento en cualquier nivel desencadena acción protectora automática independientemente de lo que otras capas indiquen. Cuando se golpea un límite diario, todas las posiciones se cierran. Cuando se golpea un límite semanal, el sistema entra en modo solo observación. No hay mecanismo de anulación y sin lógica de "una operación más".

Escalado Dinámico de Volatilidad

Las distancias de stop-loss y los tamaños de posición se adaptan a la volatilidad actual del mercado usando el modelo HAR-RV (Corsi, 2009). Este modelo captura persistencia de volatilidad a través de horizontes diarios, semanales y mensuales, produciendo pronósticos más precisos que enfoques de horizonte único (Andersen, Bollerslev, Diebold y Labys, 2003). En regímenes de alta volatilidad, las posiciones son más pequeñas y los stops son más amplios; en regímenes de baja volatilidad, lo opuesto se aplica. Esto asegura riesgo consistente por operación en términos de dólares.

Section VII

Detección de Volatilidad y Régimen

El comportamiento del mercado no es estacionario. El sistema clasifica las condiciones prevalecientes a lo largo de dos ejes, fortaleza de tendencia y nivel de volatilidad, y adapta sus parámetros en consecuencia.

El modelo HAR-RV (Corsi, 2009) descompone la volatilidad realizada en componentes diarios, semanales y mensuales, capturando la estructura de múltiples escalas de tiempo de la agrupación de volatilidad. Esto produce pronósticos superiores comparados con modelos de familia GARCH de horizonte único, particularmente durante transiciones de régimen. La investigación de Andersen, Bollerslev, Diebold y Labys (2003) estableció que la volatilidad realizada calculada a partir de datos de alta frecuencia proporciona una medida más precisa de la verdadera volatilidad latente que los estimadores de cierre diario.

El sistema adapta stops, tamaño y umbrales de entrada basados en qué cuadrante de régimen se detecta. En entornos tendenciales de baja volatilidad, se aplican parámetros estándar. En entornos laterales de alta volatilidad, el sistema se mantiene completamente aparte, el costo esperado de pérdidas por látigo excede el beneficio esperado de operaciones intentadas. La descomposición jump-diffusion (Andersen, Bollerslev y Diebold, 2007) separa además el componente de volatilidad continua (que impulsa la predictabilidad) del componente jump (que no lo hace).

Section VIII

Integridad del Backtest

Un backtest es tan confiable como los supuestos incrustados en él. El sesgo de anticipación es la fuente más común de desempeño histórico inflado, y la más difícil de detectar. El motor de reproducción causal del sistema está diseñado para eliminarlo estructuralmente.

El motor de reproducción causal construye barras de marco temporal superior incrementalmente desde datos brutos, una barra solo "se cierra" cuando todos sus datos constituyentes han sido procesados, exactamente como lo haría en tiempo real. En ningún punto el motor tiene acceso a una barra de marco temporal superior completada antes de que los datos subyacentes hayan llegado. Las señales generadas en la barra N producen entradas en la barra N+1; no hay ejecución en la misma barra.

Todos los rellenados asumen slippage en dirección adversa con una estructura de comisión realista. Esto significa que los resultados del backtest representan una estimación conservadora del desempeño lograble. Este enfoque produce métricas de desempeño más bajas en comparación con datos precalculados, que es el comportamiento esperado y correcto cuando se elimina la ventaja de información artificial.

Section IX

Estándares de Validación

La significancia estadística en backtesting es necesaria pero no suficiente. El sistema debe demostrar robustez a través de múltiples marcos de validación independientes antes de que capital en vivo sea desplegado.

252+ días de trading de papel — El trading de papel usa el motor idéntico y pipeline de datos que el backtest, ejecutando en tiempo real contra datos de mercado en vivo sin suposiciones de rellenado. Esta duración representa un año completo de mercado, capturando patrones estacionales y múltiples regímenes de volatilidad. Actualmente en progreso.
Sharpe Ratio Deflactado > 0 a p < 0,05 — El DSR (Bailey y López de Prado, 2014) corrige el Sharpe ratio observado por el número de estrategias probadas, no normalidad de retornos (asimetría y curtosis), y tamaño de muestra finito. Cuando muchas combinaciones de parámetros se evalúan, el mejor desempeño parecerá significativo por casualidad; el DSR da cuenta de este sesgo de selección.
Probabilidad de Sobreajuste de Backtest < 50% — Evaluada mediante Validación Cruzada Purificada Combinatoria (López de Prado, 2018; Bailey, Borwein, López de Prado y Zhu, 2017). CPCV prueba desempeño a través de todas las posibles divisiones de datos combinatorias entrenamiento/prueba, proporcionando una distribución del desempeño fuera de muestra en lugar de una estimación de punto único. Esto revela si la ventaja de la estrategia es robusta o dependiente de la trayectoria.
Replicación papel-a-backtest dentro de tolerancia estadística — Los resultados del trading de papel deben coincidir con expectativas del backtest dentro de intervalos de confianza definidos. La desviación sistemática en cualquier dirección desencadena una revisión completa de supuestos. Esta es la puerta final antes de despliegue en vivo.
Drawdown máximo dentro de límites definidos — Tanto el drawdown pico a valle como la duración del drawdown deben permanecer dentro de límites preestablecidos durante todo el período de trading de papel. Una violación única reinicia el reloj de validación.

Section X

Bibliografía de Investigación

Los siguientes artículos forman la base empírica de este sistema. Cada cita incluye su relevancia para la arquitectura descrita arriba.

Kyle, A.S. (1985). “Continuous Auctions and Insider Trading.” Econometrica, Vol. 53, No. 6, pp. 1315–1335.

Modelo de impacto de precio; lambda mide profundidad de mercado y detección de flujo informado.
Cont, R., Kukanov, A. & Stoikov, S. (2014). “The Price Impact of Order Book Events.” Journal of Financial Econometrics, Vol. 12, No. 1, pp. 47–88.

Linealidad OFI-precio; desequilibrio de flujo de órdenes domina volumen como predictor.
Moskowitz, T.J., Ooi, Y.H. & Pedersen, L.H. (2012). “Time Series Momentum.” Journal of Financial Economics, Vol. 104, No. 2, pp. 228–250.

Persistencia de tendencia 1-12 meses en 58 contratos de futuros; justifica filtrado multi-temporal.
Bouchaud, J.-P., Farmer, J.D. & Lillo, F. (2009). “How Markets Slowly Digest Changes in Supply and Demand.” Handbook of Financial Markets: Dynamics and Evolution, Elsevier.

Flujo de órdenes de memoria larga desde fraccionamiento institucional; persistencia de sesgo direccional.
Corsi, F. (2009). “A Simple Approximate Long-Memory Model of Realized Volatility.” Journal of Financial Econometrics, Vol. 147, No. 1, pp. 116–126.

Modelo HAR-RV; componentes de volatilidad diarios/semanales/mensuales para detección de régimen.
Andersen, T.G., Bollerslev, T., Diebold, F.X. & Labys, P. (2003). “Modeling and Forecasting Realized Volatility.” Econometrica, Vol. 71, No. 2, pp. 579–625.

Muestreo óptimo de 5 minutos; volatilidad realizada desde datos de alta frecuencia.
Andersen, T.G., Bollerslev, T. & Diebold, F.X. (2007). “Roughing It Up: Including Jump Components in the Measurement, Modeling, and Forecasting of Return Volatility.” Review of Economics and Statistics, Vol. 89, No. 4, pp. 701–720.

Descomposición jump-continua; componente continuo impulsa predictabilidad.
Baltussen, G., Da, Z., Lammers, S. & Martens, M. (2021). “Hedging Demand and Market Intraday Momentum.” Journal of Financial Economics, Vol. 142, Issue 1, pp. 377–403.

Retorno resto del día predice última media hora; Sharpe 0,87-1,73; mecanismo de cobertura gamma.
Lucca, D.O. & Moench, E. (2015). “The Pre-FOMC Announcement Drift.” Journal of Finance, Vol. 70, No. 1, pp. 329–371.

Retorno promedio pre-FOMC de 49 bps; 80% de prima de equity en ventana de 24 horas.
Gu, S., Kelly, B. & Xiu, D. (2020). “Empirical Asset Pricing via Machine Learning.” Review of Financial Studies, Vol. 33, No. 5, pp. 2223–2273.

Árboles y redes neuronales superan métodos lineales; momentum, liquidez, volatilidad dominan.
Bailey, D.H. & López de Prado, M. (2014). “The Deflated Sharpe Ratio: Correcting for Selection Bias, Backtest Overfitting, and Non-Normality.” Journal of Portfolio Management, Vol. 40, No. 5, pp. 94–107.

Corrige Sharpe observada para pruebas múltiples, no normalidad, tamaño de muestra.
López de Prado, M. (2018). Advances in Financial Machine Learning. Wiley.

Validación CPCV; métrica PBO; estándar de oro para detección de sobreajuste de backtest.
Kelly, J.L. (1956). “A New Interpretation of Information Rate.” Bell System Technical Journal, Vol. 35, No. 4, pp. 917–926.

Tamaño óptimo de apuesta para maximización de tasa de crecimiento geométrico.
Almgren, R. & Chriss, N. (2001). “Optimal Execution of Portfolio Transactions.” Journal of Risk, Vol. 3, No. 2, pp. 5–39.

Descomposición de impacto permanente vs. temporal; optimización de trayectoria comercial.
Kirilenko, A., Kyle, A.S., Samadi, M. & Tuzun, T. (2017). “The Flash Crash: High-Frequency Trading in an Electronic Market.” Journal of Finance, Vol. 72, No. 3, pp. 967–998.

Comportamiento HFT bajo estrés; cascadas de evaporación de liquidez en futuros de índices.

Section VI

Prueba del Backtest

Toda afirmación en este sitio está respaldada por datos auditables. Cada algoritmo se valida de forma independiente en su propio marco temporal con cero sesgo de anticipación, las métricas principales se atribuyen por producto a continuación, con los estándares de validación del sitio más abajo.

ULTRA SCALPER

ejecución 2m

2,800

Operaciones

2.62

Factor de Beneficio

53%

Tasa de Éxito

2.29%

Drawdown Máximo

SCALPER

ejecución 15m

1,940

Operaciones

3.36

Factor de Beneficio

53.7%

Tasa de Éxito

2.2%

Drawdown Máximo

Estándares de Validación

Validación Cruzada Purificada Combinatoria (CPCV): Resultados del backtest probados a través de divisiones de datos combinatorias para detectar sobreajuste. El estándar de oro de López de Prado (2018).

Sharpe Ratio Deflactado: Corrige Sharpe observada por sesgo de selección, no normalidad, y pruebas múltiples (Bailey y López de Prado, 2014). Nuestros resultados sobreviven a esta corrección.

Cero Sesgo de Anticipación: El motor causal procesa barras en orden cronológico estricto. No hay datos futuros accesibles en ningún punto de decisión. Toda señal se evalúa usando solo información disponible en ese momento.

Slippage y Comisiones Calibradas: Todos los resultados del backtest incluyen costos de ejecución realistas: $1,29 por contrato por lado (MNQ) y slippage de 0,5-2 ticks modelado desde datos de rellenado empíricos.

Hoja de Ruta de Implementación

Fase 1

Trading de Papel

Valida señales contra datos de mercado en vivo con rellenados simulados. Construye familiaridad operacional.

Fase 2

Validación

Compara resultados de papel contra línea de base de backtest. Mínimo 50 operaciones y 4 semanas antes de proceder.

Fase 3

Trading en Vivo

Cuenta pequeña con tamaño conservador (0,8% riesgo por operación). Tres meses consecutivos rentables antes de escalar.

Fase 4

Escalar

Aumenta tamaño de cuenta por 25-50% después de probar consistencia. O persigue financiación de firma prop vía Módulo 8.

Herramientas avanzadas: Analizador Forense de Operaciones → Panel de Análisis Semanal →

Impulsado por 14 artículos revisados por pares Toda decisión registrada Desempeño verificado en vivo Cero sesgo de anticipación