&RocketCapital
Очень интересная и концептуально зрелая идея
&RocketCapital — формализовать инвестиционные гипотезы в виде обучающейся модели. К сожалению, до настоящего времени стратегия не дала положительного результата.
Но я понимаю, почему проект сейчас не даёт положительной доходности: архитектура в целом сильная, но стратегия пока методологически “сырая”, особенно в части валидации и адаптации к рыночной реальности. Ниже я написал системный разбор и позволил себе предложить автору некоторые рекомендации по усилению.
1. Ключевые слабые места стратегии
1.1. Недостаточная проверка гипотез (backtesting и out-of-sample тесты)
Автор декларирует проверку на исторических данных, но не ясно:
проводилось ли разделение на train/test/validation;
использовались ли скользящие окна (rolling windows);
учтён ли эффект «look-ahead bias» (заглядывание в будущее).
Без этого модель может идеально подгоняться под прошлые данные и полностью «плыть» на новых.
Решение:
использовать walk-forward optimization (пошаговую проверку на скользящих периодах);
оценивать стабильность факторов на разных временных окнах (год, квартал, кризисные периоды);
применять метрики Sharpe, Sortino, Max Drawdown, Information Ratio, а не просто доходность.
1.2. Неопределённость в структуре модели
Автор говорит о «гибкой архитектуре», но не указывает, какие именно алгоритмы применяются:
линейные модели (высокая интерпретируемость, слабая нелинейность),
деревья/ансамбли (XGBoost, CatBoost — хорошо работают для табличных данных),
нейросети (сильные, но плохо объяснимые).
!!! Без чёткой гипотезы о форме зависимости (линейная/нелинейная) невозможно построить устойчивую систему.
Решение:
начать с ансамблей деревьев (CatBoost, LightGBM) с интерпретацией через SHAP или Permutation Importance;
выделить несколько «сегментов рынка» (капитализация, сектор, регион) и строить модели внутри сегментов, а не общую.
1.3. Отсутствие фактора времени и адаптации
Даже идеальная модель без «временной памяти» быстро деградирует.
Финансовые рынки обладают эффектом regime shift — корреляции и причинно-следственные связи постоянно меняются.
Решение:
добавить онлайн-переобучение или периодическую перекалибровку (например, каждые 30–60 дней);
внедрить мониторинг метрик (drift detection): PSI, KS, population stability index;
реализовать систему триггеров «модель устарела → переобучить».
1.4. Недооценка поведенческих и внешних факторов
Только финансовые метрики не объясняют всё: политика ЦБ, новости, санкции, инсайдерская активность и т.д.
Решение:
добавить альтернативные данные (новостные индексы, поисковые тренды, индексы страха, ESG-оценки);
использовать embedding-модели для новостных потоков (FinBERT, GPT-финансовый fine-tune).
2. Концептуальные улучшения для устойчивой доходности
2.1. Многофакторная модель влияния (вариант: Bayesian Structural Time Series)
Позволяет оценить вклад каждого показателя (маржа, долг, капзатраты) в прогноз капитализации.
2.2. Ensemble of Models:
Комбинация:
- фундаментальная модель (долгосрочный потенциал),
- техническая модель (вход/выход),
- риск-менеджмент (stop-loss/volatility filter).
2.3. Meta-Learner (Stacking):
Обучить метамодель, которая на основе результатов отдельных моделей выбирает оптимальную комбинацию сигналов.
2.4. Explainability Layer:
Добавить визуализацию вклада факторов (через SHAP/Feature importance), чтобы повышать доверие и корректировать гипотезы.
3. Итог
Идея абсолютно правильная — переход от интуиции к алгоритму.
Но пока это не стратегия, а научно-исследовательский прототип. Он даёт сигналы, но не управляет капиталом.
Для выхода «в плюс» нужно:
1. Ввести строгую процедуру тестирования и адаптации (rolling backtest + drift detection).
2. Обеспечить интерпретируемость факторов (SHAP/Permutation).
3. Добавить риск-менеджмент и фильтры волатильности.
4. Перейти к pipeline-архитектуре MLOps, как на схеме в вашем примере.
#ии_анализ
#прояви_себя_в_пульсе
#пульс