- Сообщения
- 29
- Реакции
- 0
- Баллы
- 1
Data Mining — Quant-система аналитики на передовых ИИ
Использует математические модели и финансовые формулы как хедж-фонд.
- 5 ML-моделей, обученных на 40 000 матчей с ELO, Pi-рейтингами и до 116 признаков формы
- Самообучается каждую неделю через walk-forward валидацию
- Находит value через матожидание и калибровку вероятностей — и даёт сигнал
40 000+ | 5 | 116 | 24/7 |
|---|---|---|---|
матчей проанализировано | ML-моделей | признаков | обучение |
Walk-forward валидация
Система обучена на исторических данных каждой лиги и проверена на событиях, к результатам которых у неё не было доступа.
- 3 временных среза от 6 месяцев до 2 лет
- 120+ параметров
- 12 конфигураций
⚠ Важно: Тестирование ≠ 100% гарантии. Реальные результаты могут отличаться — как в худшую, так и в лучшую сторону. Система совершенствуется каждый день.
Результаты ML-бэктестов по лигам
Ключевые особенности
- Прогнозы в лигах отличаются по рынкам и по стратегии Kelly
- Отдельные модели тестировались на расширенной выборке в 29 000 и 40 000 матчей
- xG-модель (115 параметров) определяет количество голов с учётом качества моментов, а не только факта гола
- CatBoost — алгоритм, который последовательно строит несколько моделей, где каждая корректирует ошибки предыдущей. Итоговый прогноз — взвешенная сумма предсказаний всех моделей ансамбля
Не 1 система на все события — а сотни вариаций под каждый рынок и лигу
Реальные ставки за последний месяц
Общий итог
74 ставки · 38 побед / 36 поражений ·
19 нерассчитанных
ROI: +21.4% · WR: 51%
бaнк: 141 018 ₽ (+41.0%)
По лигам
| Лига | W / L | ROI | Профит |
|---|---|---|---|
10 / 7 | +60.4% | +35 225 ₽ | |
7 / 2 | +46.6% | +13 052 ₽ | |
7 / 5 | +33.7% | +6 735 ₽ | |
2 / 1 | +64.0% | +5 852 ₽ | |
1 / 0 | +125% | +1 321 ₽ | |
6 / 6 | +2.4% | +692 ₽ | |
0 / 1 | −100% | −1 131 ₽ | |
3 / 5 | −14.3% | −2 075 ₽ | |
0 / 1 | −100% | −2 390 ₽ | |
2 / 8 | −56.0% | −16 265 ₽ |
По рынкам
| Рынок | W / L | ROI | Профит |
|---|---|---|---|
11 / 7 | +62.9% | +38 787 ₽ | |
20 / 17 | +17.5% | +14 734 ₽ | |
3 / 1 | +43.5% | +5 940 ₽ | |
2 / 2 | −1.6% | −92 ₽ | |
1 / 3 | −26.3% | −1 843 ₽ | |
| 🛡 Фора 0 (DNB) | 0 / 1 | −100% | −2 390 ₽ |
1 / 5 | −81.6% | −14 118 ₽ |
LIVE · отдельная модель
5 ставок · 4 победы / 1 поражение · WR 80%
ROI: +10.6%
бaнк: 101 836 ₽ (+1.8%)
Основной стек системы · 7 компонентов
01 / 07 — 5 AI-моделей в ансамбле
Нейросети (LSTM), градиентный бустинг (XGBoost, CatBoost), логистическая регрессия (baseline), случайный лес. Голосуют вместе — слабая модель не тянет вниз, система автоматически снижает её значимость в общем пуле.
02 / 07 — 300+ аналитических параметров
Форма, ELO и Pi-Rating, xG, тактика, усталость, мотивация, судейские паттерны, движение букмекерских линий. От «эффекта нового тренера» (+12% winrate в первые 5 игр) до судейского bias. Многое — из академических исследований, которые букмекеры ещё не внедрили.
05 / 07 — Калибровка вероятностей
Наши 70% действительно выигрывают в 70% случаев (не 62%, как у обычных ML-моделей). Isotonic Regression поверх ансамбля. Это позволяет использовать Kelly Criterion без слива банкролла — важнейшее свойство модели.
03 / 07 — 15+ рынков одновременно
От классики до нишевых: точный счёт, развороты по таймам, Asian Handicap, BTTS, комбинированные ставки. Система видит value там, где букмекер не тратит ресурсы на глубокий анализ. Приоритет AH — маржа 2–3% вместо 5–7% на 1X2.
04 / 07 — Мульти-букмекерный анализ
Автоматический выбор лучшего коэффициента из 15+ букмекеров. Оптимизация тайминга: система рекомендует когда ставить, а не только что. CLV/UDI трекинг — отслеживает реальный edge после закрытия линий.
06 / 07 — Академический стек
Dixon-Coles коррекция для низких счетов, Skellam distribution для Asian Handicap, Generalized Kelly для портфельной оптимизации, CDaR (хвостовой риск), Calmar и Sharpe ratios — то, что используют синдикаты в Лондоне и хедж-фонды.
07 / 07 — Self-Improving Pipeline 24/7
6-уровневая валидация: Monte Carlo (10K сим.), Bootstrap (1K resample), Walk-Forward (3 горизонта), Perturbation, Stress Test (COVID, Лестер 2016). Жизненный цикл стратегий: TESTING → PROBATION → ACTIVE → SUSPENDED → DEAD.
От классики до нишевых: точный счёт, развороты по таймам, Asian Handicap, BTTS, комбинированные ставки. Система видит value там, где букмекер не тратит ресурсы на глубокий анализ. Приоритет AH — маржа 2–3% вместо 5–7% на 1X2.
04 / 07 — Мульти-букмекерный анализ
Автоматический выбор лучшего коэффициента из 15+ букмекеров. Оптимизация тайминга: система рекомендует когда ставить, а не только что. CLV/UDI трекинг — отслеживает реальный edge после закрытия линий.
06 / 07 — Академический стек
Dixon-Coles коррекция для низких счетов, Skellam distribution для Asian Handicap, Generalized Kelly для портфельной оптимизации, CDaR (хвостовой риск), Calmar и Sharpe ratios — то, что используют синдикаты в Лондоне и хедж-фонды.
07 / 07 — Self-Improving Pipeline 24/7
6-уровневая валидация: Monte Carlo (10K сим.), Bootstrap (1K resample), Walk-Forward (3 горизонта), Perturbation, Stress Test (COVID, Лестер 2016). Жизненный цикл стратегий: TESTING → PROBATION → ACTIVE → SUSPENDED → DEAD.
Стек уровня ML Engineer / Data Scientist (Senior)
+ Backend / Data Engineer (Middle+)
+ Quant / Sports Analyst
200+ часов разработки · >1500$ только на инфраструктуру
(API, векторная память, собственные скраперы)
Сотни тысяч строк кода · более 5 000 файлов проекта на сервере
AI Football Predictions · 2026
Вложения
Последнее редактирование:





