Математика управления капиталом: Методы анализа риска для трейдеров и портфельных менеджеров - Ральф Винс
Шрифт:
Интервал:
Закладка:
Цель серийного теста – найти счет Z для периодов выигрышей и проигрышей в системной торговле. Счет Z означает, на сколько стандартных отклонений вы удалены от среднего значения распределения. Таким образом, счет Z = 2,00 означает, что вы на 2 стандартных отклонения удалились от среднего значения (ожидание случайного распределения периодов выигрышей и проигрышей).
Счет Z – это просто число стандартных отклонений, на которое данные отстоят от среднего значения нормального распределения вероятности. Например, счет Z = 1,00 означает, что данные, которые вы тестируете, отклонены на 1 стандартное отклонение от среднего значения.
Счет Z затем переводится в доверительную границу, которая иногда также называется степенью достоверности. Площадь под кривой нормального распределения вероятности шириной в 1 стандартное отклонение с каждой стороны от среднего значения равна 68 % всей площади под этой кривой. Преобразуем счет Z в доверительную границу. Связь счета Z и доверительной границы следующая: счет Z является числом стандартных отклонений от среднего значения, а доверительная граница – долей площади под кривой, заполненной при таком числе стандартных отклонений.
При минимальном количестве 30 закрытых сделок мы можем рассчитать счет Z. Попытаемся узнать, сколько периодов выигрышей (проигрышей) можно ожидать от данной системы? Соответствуют ли периоды выигрыша (проигрыша) тестируемой системы ожидаемым? Если нет, существует ли достаточно высокая доверительная граница, чтобы допустить, что между сделками существует зависимость, т. е. зависит ли результат текущей сделки от результата предыдущих сделок?
Ниже приведено уравнение серийного теста. Счет Z для торговой системы равен:
Z = (N * (R – 0,5) – X) / ((X * (X – N)) / (N – 1)) ^ (1/2), (1.1)
где N – общее число сделок в последовательности;
R – общее число серий выигрышных или проигрышных сделок;
X = 2 * W * L;
W – общее число выигрышных сделок в последовательности;
L – общее число проигрышных сделок в последовательности.
Этот расчет можно провести следующим образом.
1. Возьмите данные по вашим сделкам.
а) Общее число сделок, т. е. N.
б) Общее число выигрышных сделок и общее число проигрышных сделок.
Теперь рассчитайте Х:
Х = 2 * (Общее число выигрышей) * (Общее число проигрышей).
в) Общее число серий в последовательности, т. е. R.
2. Предположим, что произошли следующие сделки:
– 3, +2, +7, –4, +1, –1, +1, +6, –1, 0, –2, +1.
Чистая прибыль составляет +7. Общее число сделок 12, поэтому N = 12. Теперь нас интересует не то, насколько велики выигрыши и проигрыши, а то, сколько было выигрышей и проигрышей, а также серий. Поэтому мы можем перевести наш ряд сделок в простую последовательность плюсов и минусов. Отметьте, что сделка с нулевой прибылью считается проигрышем. Таким образом:
Как видим, последовательность состоит из 6 прибылей и 6 убытков, поэтому Х = 2 * 6 * 6 = 72. В последовательности есть 8 серий, поэтому R = 8. Мы называем серией каждое изменение символа, которое встречается при чтении последовательности слева направо (т. е. хронологически).
1. Последовательность будет выглядеть следующим образом:
2. Вычислите значение выражения:
N * (R – 0,5) – X.
Для нашего примера:
= 12 * (8–0,5) – 72 = 12 * 7,5 – 72 = 90–72 = 18.
3. Вычислите значение выражения:
(X * (X – N)) / (N – 1).
Для нашего примера:
= (72 * (72–12)) / (12 – 1) = (72 * 60) / 11 = 4320 / 11 = 392,727272.
4. Возьмите квадратный корень числа, полученного в п. 3. В нашем примере:
392,727272 ^ (1/2) = 19,81734777.
5. Разделите ответ из п. 2 на ответ из п. 4. Это и есть счет Z. В нашем примере:
18 / 19,81734777 = 0,9082951063.
6. Теперь преобразуйте счет Z в доверительную границу. Распределение периодов является биномиальным. Однако, когда рассматриваются 30 или больше сделок, мы можем использовать нормальное распределение как близкое к биномиальному. Таким образом, если вы используете 30 или более сделок, вы просто можете преобразовать ваш счет Z в доверительную границу, основываясь на уравнении (3.22) для нормального распределения.
Серийный тест подскажет вам, содержит ли ваша последовательность выигрышей и проигрышей больше или меньше полос (серий выигрышей или проигрышей), чем можно было бы ожидать от действительно случайной последовательности, в которой нет зависимости между испытаниями. Так как в нашем случае мы находимся на уровне относительно низкой доверительной границы, то можно допустить, что между сделками в этой последовательности нет зависимости.
Если счет Z имеет отрицательное значение, то при расчете доверительной границы просто возьмите его абсолютное значение. Отрицательный счет Z говорит о положительной зависимости, т. е. полос меньше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают выигрыши, а проигрыши порождают проигрыши. Положительный счет Z говорит об отрицательной зависимости, т. е. полос больше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают проигрыши, а проигрыши порождают выигрыши.
Какой уровень доверительной границы считать приемлемым? Статистики, как правило, рекомендуют доверительную границу не менее 90 %. Некоторые рекомендуют доверительную границу свыше 99 %, чтобы быть уверенным, что зависимость существует, другие рекомендуют менее строгий минимум 95,45 % (2 стандартных отклонения).
Очень редко система демонстрирует доверительную границу выше 95,45 %, чаще всего она менее 90 %. Даже если вы найдете систему с доверительной границей от 90 до 95,45, это не будет золотым самородком. Чтобы убедиться в зависимости, на которой можно хорошо заработать, вам нужно как минимум 95,45 %.
Пока зависимость находится на приемлемой доверительной границе, вы можете изменить систему, чтобы улучшить торговые решения, даже если не понимаете основной причины зависимости. Если вы узнаете причину, то сможете оценить, когда зависимость действовала, а когда нет и когда можно ожидать изменения степени зависимости.
До настоящего момента мы смотрели на зависимость только с точки зрения того, была ли последняя сделка выигрышем или проигрышем. Теперь мы попытаемся определить, есть ли в последовательности выигрышей и проигрышей зависимость или нет. Серийный тест на наличие зависимости автоматически принимает в расчет процент выигрышей и проигрышей. Однако серийный тест по периодам выигрышей и проигрышей учитывает последовательность выигрышей и проигрышей, но не их размер. Для того чтобы получить истинную независимость, не только сама последовательность выигрышей и проигрышей должна быть независимой, но и размеры выигрышей и проигрышей в последовательности также должны быть независимыми. Выигрыши и проигрыши могут быть независимыми, однако их размеры могут зависеть от результатов предыдущей сделки (или наоборот). Возможным решением является проведение серийного теста только с выигрышными сделками. При этом полосы выигрышей следует разделить на длинные (по сравнению со средним значением распределения вероятности) и менее длинные, и только затем искать зависимость между размером выигрышных сделок. Потом необходимо провести ту же процедуру с проигрышными сделками.
Корреляция
Есть другой и, может быть, лучший способ определения зависимости между размерами выигрышей и проигрышей. Этот метод позволяет рассмотреть размеры выигрышей и проигрышей с совершенно другой стороны, и, когда он используется вместе с серийным тестом, взаимосвязь сделок измеряется с большей глубиной. Для количественной оценки зависимости или независимости данный метод использует коэффициент линейной корреляции r, который иногда называют пирсоновским r.
Посмотрите на рис. 1.2. На нем изображены две абсолютно коррелированные последовательности. Мы называем это положительной корреляцией.
Рис. 1.2. Положительная корреляция (r = +1,00)
Рис. 1.3. Отрицательная корреляция (r = –1,00)
Теперь посмотрите на рис. 1.3. Он показывает две последовательности, которые находятся точно в противофазе. Когда одна линия идет вверх, другая следует вниз (и наоборот). Мы называем это отрицательной корреляцией.
Формула для коэффициента линейной корреляции r двух последовательностей Х и Y такова (черта над переменной обозначает среднее арифметическое значение):
Расчет следует производить следующим образом.
1. Вычислите среднее Х и Y (т. е. и ).
2. Для каждого периода найдите разность между Х и , а также Y и .