Kointegracja na Rynku Forex: Twój Sekretny Klucz do Statystycznego Arbitrażu

Dupoin
Kointegracja na Rynku Forex: Twój Sekretny Klucz do Statystycznego Arbitrażu
Modelowanie Kointegracji Forex: Jak Wykorzystać Kointegrację w Strategiach FX Stat Arb?

Wstęp: Czym Jest Kointegracja i Dlaczego Forex Ją Kocha?

Wyobraź sobie, że jesteś na spacerze z psem. Ty idziesz swoją stałą, dość przewidywalną ścieżką (powiedzmy, że to twój długoterminowy trend), a twój pies, uwiązany na smyczy, biega jak szalony – raz do przodu, raz do tyłu, goniąc gołębie lub własny ogon (to te krótkoterminowe, pozornie chaotyczne ruchy cen). Kluczową rzeczą jest ta smycz. Nie ważne jak bardzo pies szaleje, w pewnym momencie musi wrócić do ciebie. Nie może oddalić się na zawsze. Kointegracja w handlu parami walutowych jest właśnie taką smyczą. To statystyczna smycz, która łączy dwie (lub więcej) pary walutowe, które same w sobie mogą być bardzo niestabilne, ale które w dłuższym okresie utrzymują się względem siebie w pewnej stabilnej, długoterminowej równowadze. To nie magia, to matematyka, ale naprawdę przydatna.

Dlaczego to takie ważne? Bo tradycyjne modele oparte na samej korelacji często zawodzą na rynku Forex, i to w spektakularny sposób. Korelacja mierzy, czy dwa aktywa poruszają się w tym samym kierunku w danym momencie. Jeśli EUR/USD rośnie, a GBP/USD też rośnie, są skorelowane dodatnio. Problem w tym, że korelacja może być bardzo chwiejna; pojawia się i znika. Dwie pary mogą być dziś silnie skorelowane, a jutro, z powodu jakiejś niespodziewanej wiadomości gospodarczej z Wielkiej Brytanii, ich ścieżki mogą się radykalnie rozjechać i już nigdy nie wrócić do poprzedniego stanu. To jak spacer z psem bez smyczy – pobiegł za kotem i już go nie ma. Kointegracja jest głębsza. Mówi: "Tak, te pary mogą się na chwilę rozjechać, ale istnieje fundamentalna, ekonomiczna siła (ta smycz), która w końcu je do siebie przyciągnie z powrotem". To właśnie ta przewidywalna "siła przyciągania" jest sercem modelowania kointegracji forex dla strategii statystycznego arbitrażu (stat arb).

Właśnie to rozróżnienie jest kluczowe. Korelacja to: "Kiedy A rośnie, B też zwykle rośnie". Kointegracja to: "A i B mogą dryfować osobno, ale odległość między nimi nie może stać się zbyt duża; w końcu spotkają się z powrotem". To drugie jest o wiele potężniejsze dla tradera, ponieważ bezpośrednio wskazuje na moment, gdy rynek jest "wyrwany" ze swojej długoterminowej równowagi, co tworzy okazję do zarobku. Kiedy nasz pies na smyczy oddali się od nas na maksymalną długość, wiemy, że prawdopodobnie zaraz zawróci. Podobnie, gdy dwie skointegrowane pary walutowe nadmiernie się rozchodzą, tworząc duży spread, modelowanie kointegracji forex sygnalizuje wysokie prawdopodobieństwo, że spread ten się zmniejszy – czyli pary wrócą do siebie. I na tym właśnie polega cały urok – na handlu tym powrotem do średniej, do tej długoterminowej równowagi.

W kontekście Forex, pary walutowe są idealnymi kandydatami do tego typu analizy. Często są ze sobą powiązane fundamentalnie – think EUR/USD i GBP/USD (powiązane przez bliskie relacje gospodarcze USA, strefy euro i UK), lub AUD/USD i NZD/USD (obie są "walutami surowcowymi" regionu Azji i Pacyfiku). Te gospodarki podlegają podobnym cyklom, a ich waluty mogą wykazywać właśnie tę pożądaną, długoterminową relację. Odkrycie takich par i precyzyjne zmierzenie siły ich wzajemnego przyciągania to sedno zaawansowanego modelowania kointegracji forex. To nie jest sucha teoria akademicka; to praktyczne narzędzie, które, odpowiednio zastosowane, może pomóc w identyfikacji bardzo konkretnych okazji handlowych o stosunkowo wysokim prawdopodobieństwie sukcesu. W kolejnych rozdziałach zajmiemy się właśnie tym, jak krok po kroku znaleźć takie "psa na smyczy" na rynku walutowym, używając odpowiednich testów statystycznych i analiz.

Aby zilustrować, jak różne pary walutowe mogą zachowywać się w kontekście korelacji i kointegracji, przyjrzyjmy się uproszczonemu zestawieniu. Pamiętaj, że to mocno uproszczony model, ale pomaga zobaczyć różnicę. Prawdziwe modelowanie kointegracji forex opiera się na dużo bardziej złożonych obliczeniach, ale ta tabela dobrze oddaje sedno koncepcji.

Porównanie zachowania par walutowych pod kątem korelacji i kointegracji
EUR/USD GBP/USD Potencjalnie Skointegrowana Często tak, ale nie zawsze TAK (istnieje "smycz" ekonomiczna) Pies na smyczy z właścicielem
EUR/USD USD/CHF Silnie Skorelowana (ujemnie) TAK (często w przeciwnych kierunkach) NIE (mogą dryfować w przeciwnych kierunkach bez powrotu) Dwa osobne psy biegające w przeciwnych kierunkach bez smyczy
AUD/USD NZD/USD Potencjalnie Skointegrowana Bardzo często tak TAK (powiązane surowcami i geografią) Dwa psy na smyczy idące razem na spacerze
EUR/USD USD/JPY Słaba/Zmienna Relacja Rzadko lub bez wyraźnego wzorca NIE (brak mechanizmu przyciągania) Dwa zupełnie obce sobie psy w parku

I to właśnie jest piękno całego tego podejścia. Zamiast zgadywać, która para pójdzie w górę lub w dół, skupiamy się na relacji *między* nimi. Naszym celem nie jest przewidzenie absolutnego kierunku ruchu EUR/USD, ale przewidzenie, że spread między EUR/USD a GBP/USD, który jest teraz nieprawdopodobnie szeroki, w końcu się zamknie. Możemy to zrobić, sprzedając tę parę, która jest relatywnie droga (zbyt daleko od właściciela) i kupując tę, która jest relatywnie tania (zbyt blisko właściciela), licząc na ich wzajemny powrót do średniej. To jest esencja statystycznego arbitrażu opartego na kointegracji. To strategia, która thrives na tym krótkoterminowym bałaganie, wykorzystując go, ponieważ ma po swojej stronie potężną, długoterminową siłę – równowagę. Więc następnym razem, gdy zobaczysz dwie pary walutowe, które wydają się być w kłótni, oddalając się od siebie, pamiętaj o psie na smyczy. Być może właśnie patrzysz na doskonałą okazję, a zaawansowane modelowanie kointegracji forex jest narzędziem, które może pomóc ci ją zmierzyć i wykorzystać.

Od Teorii do Praktyki: Jak Znaleźć Skointegrowane Pary Walutowe

No dobrze, skoro już mniej więcej łapiemy, o co chodzi z tym całym związkiem między parami walut (że niby są jak pies i jego właściciel na spacerze), to pora przejść do konkretów. Pora zamienić tę fajną, teoretyczną koncepcję na realny, praktyczny plan działania. Innymi słowy, czas na prawdziwe modelowanie kointegracji forex. Brzmi poważnie? Spokojnie, rozłożymy to na części pierwsze, krok po kroku, tak żeby nie było miejsca na niepotrzebne błędy. Pamiętaj, w statystycznym arbitrażu chodzi o precyzję, a nie zgadywankę.

Zacznijmy od absolutnych podstaw, czyli od danych. Gdzie w ogóle szukać tych wszystkich historycznych notowań walut? Na szczęście żyjemy w czasach, gdzie dostęp do informacji jest niezwykle prosty. Dobrej jakości, darmowe dane historyczne znajdziesz na stronach brokerów forex (często w sekcjach edukacyjnych lub do pobrania), platformach takich jak MetaTrader czy TradingView (chociaż tutaj zakres historyczny bywa czasem limitowany w darmowych wersjach), albo bezpośrednio u dostawców danych jak Dukascopy, OANDA czy TrueFX. Kluczowe jest, żebyś pobrał dane dla obu instrumentów, które chcesz testować, w tej samej temporalności (np. ceny zamknięcia dzienne) i za możliwie długi okres. Im dłuższa historia, tym Twoje modelowanie kointegracji forex będzie miało solidniejsze fundamenty. Pobierasz więc plik CSV lub Excela i… no właśnie, i co dalej? Czas na testy!

Prawdziwe serce całego procesu identyfikacji par stanowią testy statystyczne. Nie przymykaj oczu! Obiecuję, że wytłumaczę to najprościej jak się da. Dwa najpopularniejsze narzędzia to test Engle’a-Grangera oraz test Johansena. Wyobraź sobie, że szukasz tej magicznej, niewidzialnej linki łączącej dwa aktywa.

Test Engle’a-Grangera to jakby podejście „zrób to sam” w dwóch krokach. Najpierw dopasowujesz model regresji liniowej pomiędzy kursami twoich dwóch walut (np. EUR/USD i GBP/USD). To daje Ci tzw. reszty – czyli różnice między tym, co model przewidział, a tym, co się faktycznie stało na rynku. Następnie, w drugim kroku, badasz te reszty testem ADF (Augmented Dickey-Fuller), sprawdzając, czy są stacjonarne. Jeśli tak – bingo! Znalazłeś dowód na kointegrację. To podejście jest proste i intuicyjne, idealne na początek przygody z modelowanie kointegracji forex, ale ma pewną wadę: zakłada, że jedna para jest „podporządkowana” drugiej (tzw. zmienna zależna i objaśniająca), co nie zawsze jest prawdą.

Dlatego dla bardziej zaawansowanego modelowanie kointegracji forex używa się testu Johansena. To już jest bardziej zaawansowany „skaner”, który nie zakłada z góry, która waluta jest liderem, a która naśladowcą. Test Johansena bada cały system równań i potrafi wykryć nie jedną, ale nawet kilka relacji kointegrujących pomiędzy większą liczbą instrumentów na raz (np. pomiędzy trzema lub czterema walutami). Daje on dwie kluczowe statystyki: śladu i wartości własnej. Twoim zadaniem jest porównanie tych statystyk z ich wartościami krytycznymi (wszystko oblicza to za Ciebie software, np. Python z biblioteką `statsmodels` lub R). Jeśli obliczona statystyka jest wyższa niż wartość krytyczna, odrzucasz hipotezę zerową o braku kointegracji. Im wyższa jest ta wartość, tym silniejsza jest relacja. To trochę jak badanie siły tego sznurka między psem a panem – Johansen powie Ci nie tylko, czy sznurek istnieje, ale też jak bardzo jest wytrzymały.

Interpretacja wyników to moment prawdy. Przy testach dostajesz zwykle p-value (wartość p). Ogólna, uproszczona zasada jest taka: jeśli p-value jest mniejsze niż Twój przyjęty poziom istotności (zazwyczaj 0.05 lub 5%), możesz odrzucić hipotezę zerową mówiącą „brak kointegracji”. Czyli p-value modelowanie kointegracji forex zaczyna przynosić pierwsze owoce – lista potencjalnych kandydatów do handlu.

Ale nie wszystkie pary, które są skointegrowane, nadają się do tradingu. Musisz nałożyć dodatkowe filtry. To kryteria wyboru, które oddzielą perełki od zwykłych kamieni. Po pierwsze, silna relacja. Szukaj par, które mają bardzo niskie p-value (np. częstotliwość powrotu do średniej. Chcesz, żeby spread (o którym więcej w następnym rozdziale) wracał do swojej historycznej średniej względnie często. Przeanalizuj historię i sprawdź, ile razy spread znacząco odbiegał i jak szybko wracał. Im więcej takich cykli, tym lepiej. Po trzecie, stabilność parametrów. Współczynniki hedgu (wagi dla każdej waluty w parze) nie powinny drastycznie zmieniać się w czasie. Jeśli musisz co tydzień na nowo kalibrować model, to znak, że relacja jest zbyt niestabilna, by na niej polegać. I po czwarte, ekonomiczny sens. Czy pomiędzy tymi walutami (lub gospodarkami, które reprezentują) istnieje jakiś fundamentalny związek? Na przykład EUR/PLN i EUR/HUF? To zrozumiałe, bo obie są powiązane z euro. To nie jest must have, ale dodaje pewności do całego modelowanie kointegracji forex.

Poniżej znajdziesz tabelę, która podsumowuje kluczowe różnice między dwoma omawianymi testami, abyś mógł szybko porównać i wybrać narzędzie odpowiednie dla swoich potrzeb. Pamiętaj, że to tylko punkt wyjścia do głębszej analizy.

Porównanie testów kointegracji: Engle-Granger vs. Johansen
Liczba badanych instrumentów Tylko 2 2 lub więcej (system)
Złożoność Niska (prostszy w implementacji) Wysoka (bardziej złożony obliczeniowo)
Elastyczność Niska (narzuca rolę zmiennej zależnej) Wysoka (brak narzucania ról)
Główna zaleta Prostota i intuicyjność Kompleksowość i dokładność dla wielu aktywów
Główna wada Może nie wykryć wszystkich relacji w systemie Wymaga większej mocy obliczeniowej i wiedzy
Polecany dla Początkujących, testów na standardowych parach Zaawansowanych traderów, portfeli wielu walut

Podsumowując ten etap: identyfikacja par to proces, który łączy w sobie moc obliczeniową komputera z Twoim zdrowym rozsądkiem. Nie ślepo ufaj statystykom. Przefiltruj wyniki testów przez sito praktycznych kryteriów. Pamiętaj, że rynek forex jest dynamiczny i relacje się zmieniają, więc to modelowanie kointegracji forex nie jest czynnością jednorazową, a cyklicznym rytuałem, który musisz powtarzać, aby twoja strategia pozostawała aktualna. To inwestycja czasu, która – jeśli wykonana starannie – może otworzyć drzwi do bardzo interesujących możliwości handlowych. A kiedy już masz swoją wymarzoną, skointegrowaną parę, przychodzi czas na najciekawszą część: budowę modelu i generowanie sygnałów. Ale o tym opowiemy sobie już w następnym kroku.

Budowa Modelu: Estymacja Relacji i Wyznaczanie Sygnałów

No więc, mamy już nasze potencjalne pary walutowe, które przeszły pomyślnie testy kointegracji. Świetnie! Ale to dopiero początek zabawy. Teraz czas na prawdziwe mięso, czyli modelowanie kointegracji forex. Brzmi groźnie? Spokojnie, to tylko trochę matematyki, którą możemy rozgryźć krok po kroku. Wyobraźmy to sobie jak budowanie własnego, super precyzyjnego kompasu, który będzie nam wskazywał, kiedy wejść w transakcję, a kiedy się trzymać z daleka. Cały sekret tkwi w tym, żeby zamienić tę statystyczną teorię na konkretne, działające sygnały handlowe. I właśnie tym się teraz zajmiemy.

Pierwszym, absolutnie kluczowym krokiem w procesie modelowania kointegracji forex jest obliczenie tak zwanego współczynnika hedgu, czasem nazywanego też współczynnikiem beta. To on jest sercem całej naszej strategii. Mówiąc najprościej, chcemy ustalić, w jakiej dokładnie proporcji powinniśmy trzymać nasze dwie waluty, żeby ich kombinacja była stabilna. Załóżmy, że badamy parę EUR/USD i GBP/USD. Model kointegrujący może mieć postać: EUR/USD = β * GBP/USD + stała + błąd. Naszym zadaniem jest oszacowanie tego parametru β. Robi się to najczęściej za pomocą metody najmniejszych kwadratów (OLS) na historycznych danych. To trochę jak dopasowanie najlepszej możliwej linii przez chmurę punktów na wykresie – ta linia reprezentuje długoterminową, stabilną relację między tymi dwoma instrumentami. Otrzymany współczynnik β powie nam nam, na przykład, że dla każdego 1 lota na EUR/USD, powinniśmy zająć pozycję 0.85 lota na GBP/USD, aby zneutralizować wspólny ryzyk i wyizolować ten magiczny spread.

Kiedy już mamy nasz pięknie oszacowany współczynnik β, przychodzi czas na konstrukcję głównego aktora naszego przedstawienia: spreadu kointegrującego. To jest właśnie ten moment, w którym teoria zamienia się w coś namacalnego. Spread obliczamy według prostego, ale genialnego wzoru: Spread = cena_waluty_A - (β * cena_waluty_B). Wracając do naszego przykładu: jeśli β wynosi 0.85, to nasz spread będzie równy: EUR/USD - (0.85 * GBP/USD). To właśnie tę obliczaną na bieżąco wartość będziemy teraz bacznie obserwować na wykresie. Dla oczu tradera, spread kointegrujący to po prostu nowy instrument, nowy wykres, który zamiast przedstawiać cenę pojedynczej pary, pokazuje "relację" między naszymi dwiema wybranymi walutami. I najważniejsze: ten spread, w przeciwieństwie do samych cen, jest stacjonarny – waha się wokół stałej średniej. To właśnie te wahania są źródłem naszych okazji handlowych.

Teraz potrzebujemy zrozumieć "normalny" zakres wahań naszego spreadu. W tym celu wyznaczamy jego historyczną średnią oraz odchylenie standardowe. Średnia to po prostu poziom równowagi, wokół którego spread powinien oscylować. Odchylenie standardowe to miara jego typowej "rozrzutności" – mówi nam, jak bardzo spread zwykle odbiega od swojej średniej. Te dwie wartości są niezbędne do zdefiniowania naszych progów wejścia. Standardową praktyką jest tworzenie swoistego "korytarza" wokół średniej, wyznaczonego właśnie przez wielokrotności odchylenia standardowego. Na przykład, często używa się pasma jednego i dwóch odchyleń standardowych w obie strony. Im dalej spread odbiega od średniej, tym silniejsze jest statystyczne prawdopodobieństwo, że wróci do punktu równowagi. I to jest właśnie motor napędowy arbitrażu statystycznego.

Okej, mamy spread, znamy jego średnią i wiemy, jak bardzo się typowo waha. Pora na najprzyjemniejszą część: definiowanie konkretnych reguł tradingowych! To moment, w którym nasz model zaczyna zarabiać (mamy nadzieję!) pieniądze. Zasady są zaskakująco proste i intuicyjne, co jest pięknem dobrego modelowania kointegracyjnego forex. Główna idea brzmi: kupuj tanie, sprzedawaj drogie. A w naszym języku:

  • Sygnał kupna (Long the spread): Generowany, gdy spread spadnie znacząco *poniżej* swojej historycznej średniej – na przykład o dwa odchylenia standardowe. To sugeruje, że pierwsza waluta (w naszym wzorze) jest relatywnie *zbyt tania* wobec drugiej. Więc nasza transakcja to: KUPUJEMY parę A i SPRZEDAJEMY parę B (w obliczonych wcześniej proporcjach hedgu). Czekamy, aż spread wróci do średniej, zamykając zysk.
  • Sygnał sprzedaży (Short the spread): Generowany, gdy spread wzrośnie znacząco *powyżej* swojej historycznej średniej – znów, powiedzmy, o dwa odchylenia. To oznacza, że pierwsza waluta jest relatywnie *zbyt droga*. W odpowiedzi: SPRZEDAJEMY parę A i KUPUJEMY parę B. again, czekamy na powrót do średniej.

Próg wejścia, czyli to "o ile odchyleń" od średniej, to jeden z kluczowych parametrów, który później będziemy optymalizować. Zbyt agresywne progi (np. 1 odchylenie) dadzą więcej sygnałów, ale wiele z nich może być fałszywych i prowadzić do strat, jeśli spread postanowi iść dalej w tym samym kierunku (coś, co nazywamy ryzykiem "niekointgracji" lub rozpadu relacji). Zbyt konserwatywne progi (np. 3 odchylenia) dadzą mniej sygnałów, ale za to o znacznie wyższym prawdopodobieństwie sukcesu. Znalezienie tego "złotego środka" to sedno budowania odpornego systemu.

Aby to wszystko lepiej zobrazować i usystematyzować, spójrzmy na poniższą tabelę, która podsumowuje kluczowe kroki i decyzje w procesie budowy modelu i generowania sygnałów.

Proces budowy modelu kointegrującego i generowania sygnałów handlowych
1. Obliczenie współczynnika hedgu (β) Estymacja parametru określającego optymalną proporcję handlu między parami. Dla pary EUR/USD (A) i GBP/USD (B) Metoda najmniejszych kwadratów (OLS). Wynik: β = 0.85
2. Konstrukcja spreadu Utworzenie nowej stacjonarnej serii czasowej na podstawie cen i współczynnika β. Spread = EUR/USD - (0.85 * GBP/USD) Obliczanie w czasie rzeczywistym dla każdej nowej świecy.
3. Obliczenie średniej spreadu (μ) Wyznaczenie historycznego poziomu równowagi dla spreadu. Średnia arytmetyczna z ostatnich 252 dni (rok handlowy). μ = 0.0012
4. Obliczenie odch. standard. spreadu (σ) Określenie typowego zakresu wahań spreadu wokół średniej. Odchylenie standardowe z ostatnich 252 dni. σ = 0.0050
5. Definicja sygnału KUPNA Warunek wejścia w długą pozycję na spreadzie (kupno A, sprzedaż B). Jeśli Spread Kupuj, gdy Spread
6. Definicja sygnału SPRZEDAŻY Warunek wejścia w krótką pozycję na spreadzie (sprzedaż A, kupno B). Jeśli Spread > (μ + 2σ) Sprzedawaj, gdy Spread > (0.0012 + 2*0.0050) = 0.0112
7. Definicja sygnału WYJŚCIA Warunek zamknięcia pozycji (realizacji zysku/straty). Gdy Spread powróci do wartości średniej μ. Zamknij pozycję, gdy Spread ≈ 0.0012

Pamiętaj, że całe to modelowanie kointegracyjne forex nie jest raz na zawsze ustalonym dogmatem. Relacje między walutami żyją, oddychają i ewoluują. To, co działało idealnie przez ostatnie pół roku, jutro może przestać działać. Beta, którą oszacowaliśmy, może stać się nieaktualna. Średnia spreadu może się przesunąć. Dlatego kluczowym elementem utrzymania strategii przy życiu jest jej regularne ponowne kalibrowanie, czyli ponowne szacowanie wszystkich parametrów (β, μ, σ) na nowym, świeżym zbiorze danych. Nie róbmy tego zbyt często, bo wpadniemy w pułapkę overfittingu, ale też nie trzymajmy się kurczowo przestarzałych liczb. Rozsądnym podejściem jest ustalenie stałego harmonogramu, np. ponowna kalibracja co kwartał lub co pół roku, na danych z poprzedzającego okresu. To prowadzi nas do sedna sprawy: jak przetestować, czy nasz pięk

Backtesting i Optymalizacja Twojej Strategii Kointegracji

Teraz, gdy już mamy nasz piękny, lśniący model, który generuje sygnały, przychodzi moment prawdy. To trochę jak z gotowaniem nowego przepisu – możesz być pewny, że smakuje wyśmienicie, ale dopóki nie poczęstujesz nim kilku przyjaciół (a najlepiej teściowej), tak naprawdę nie wiesz, czy to hit, czy kulinarna katastrofa. W świecie tradingu tymi „przyjaciółmi” są dane historyczne, a proces ich częstowania nazywa się backtest strategii forex. To absolutnie kluczowy krok, który oddziela teoretyczne modelowanie kointegracji forex od prawdziwego, twardego zarobku (lub twardej straty, o ile nie będziemy ostrożni). Bez solidnego backtestu, nasza strategia to tylko zbiór pięknych równań i nadziei, a na rynku forex nadzieja nie jest strategią.

Zacznijmy od tego, jak przeprowadzić taki test, żeby nie był on zwykłą „zabawą w gdybanie”. Rzetelny backtest musi uwzględniać wszystkie brzydkie, realne koszty transakcyjne, które potrafią zjeść zyski z nawet najbardziej eleganckiego modelowania kointegracji forex. Chodzi o spready i slippage. Zakładanie, że kupimy i sprzedamy po idealnych cenach z wykresu to marzenie ściętej głowy. W rzeczywistości broker każe sobie zapłacić, a rynek się porusza. Dlatego w naszym teście musimy odjąć od każdej transakcji realny spread dla danej pary walutowej w danym momencie dnia (London open? Spread się poszerza!). Slippage, czyli nieoczekiwane przesunięcie ceny w momencie wykonania zlecenia, też trzeba symulować, dodając sobie (a raczej odejmując od zysków) kilka pipsów „na głupotę rynku”. Jeśli tego nie zrobimy, nasz backtest będzie przedstawiał nierealistycznie różowy obraz, a na live koncie czeka nas bolesne rozczarowanie. Prawdziwe modelowanie kointegracji forex nie kończy się na samym spreadzie kointegrującym; kończy się na sprawdzeniu, czy po odliczeniu wszystkich opłat i kosztów, ten spread nadal daje nam przewagę.

Kolejny potwór, na którego trzeba bardzo uważać, to overfitting, czyli dopasowanie strategii do szumów w danych historycznych. Wyobraź to sobie tak: masz garść danych, a ty za pomocą super-skomplikowanego modelowania kointegracji forex tworzysz model, który idealnie „trafia” w każdy przeszły zawirowanie. Wygląda genialnie na wykresie, prawda? Problem w tym, że ten model nie nauczył się ogólnej zasady mean-reversion; nauczył się na pamięć konkretnej sekwencji liczb z przeszłości. Gdy trafi na nowe dane, zupełnie nie wie, co ma robić, i zawodzi. Jak tego uniknąć? Kluczem jest prostota. Proste strategie często są lepsze niż te skomplikowane. Zamiast szukać magicznej, piątej po przecinku wartości dla progu wejścia, trzymaj się round numbers. Zamiast modelu z 10 parametrami, użyj takiego z 2. Im mniej „pokręteł” do regulowania, tym mniejsza szansa, że nieświadomie dopasujesz model do szumu. Pamiętaj, celem modelowania kointegracji forex jest znalezienie trwałej, statystycznej relacji, a nie napisanie poezji haiku z danych historycznych.

I tu dochodzimy do świętego Graala weryfikacji: testowania out-of-sample. To jest właśnie ten moment, gdy częstujesz teściową, ale daniem, którego sama nie gotowałaś. W praktyce wygląda to tak: całe dostępne dane historyczne dzielisz na dwa zbiory. Na jednym (in-sample) budujesz swój model – szacujesz współczynniki hedgu, wyznaczasz średnią i odchylenie spreadu, definiujesz progi. Następnie ten gotowy, niezmieniony model uruchamiasz na zupełnie nowym, świeżym zbiorze danych (out-of-sample), którego twój model nigdy wcześniej „nie widział”. Jeśli wyniki na tym drugim zbiorze są nadal dobre, masz powód do ostrożnego optymizmu. Jeśli strategia zawodzi, oznacza to, że prawdopodobnie popełniłeś jeden z powyższych grzechów (overfitting, nierealistyczne założenia). Prawdziwie odporne systemy handlowe przechodzą ten test z wysokimi notami. To ostateczny sprawdzian dla Twojego modelowania kointegracji forex.

No dobrze, testujemy, ale po czym tak naprawdę poznajemy, że strategia jest dobra? Patrzymy na kluczowe metryki wydajności. Sam procentowy zysk to za mało; ważne jest, jakim kosztem ten zysk został osiągnięty.

  • Sharpe Ratio : To prawdopodobnie najważniejsza metryka. Mówi ci, jaki zwrot dostajesz za jednostkę podjętego ryzyka (zmienności). Im wyższy, tym lepiej. Strategia z Sharpe Ratio 1.5 jest generalnie uznawana za bardzo dobrą, a powyżej 2 – za znakomitą. Jeśli Twoje modelowanie kointegracji forex daje wynik 0.5, to… cóż, może jest lepsze niż lokata, ale ryzyko jest wciąż wysokie.
  • Maksymalne drawdown (MDD) : To jest najgorsze, najgłębsze „dno” na Twojej krzywej kapitału. Pokazuje, ile maksymalnie straciłbyś od szczytu, zanim strategia wróciła do nowych szczytów. Jest to niezwykle ważne z psychologicznego punktu widzenia. Możesz mieć świetne Sharpe Ratio, ale jeśli MDD wynosi -40%, to jest ogromna szansa, że wyrzucisz ręce w górę i porzucisz strategię właśnie na samym dnie, zanim zdąży się odbić. Praca nad odzyskiem od drawdown jest mentalnie bardzo trudna.
  • Inne przydatne metryki to Profit Factor (zyski / straty), Expectancy (średni zysk na trade’u) i częstotliwość transakcji.
Te liczby mówią prawdziwą historię o żywotności Twojej strategii.

Ostatecznie, cały proces backtestu strategii forex i optymalizacji parametrów (pamiętaj, optymalizuj ostrożnie, aby uniknąć overfittingu!) służy jednemu celowi: zbudowaniu zaufania. Zaufania do tego, że Twoje modelowanie kointegracji forex złapało coś realnego, a nie jest tylko statystycznym widmem. To zaufanie będzie Ci później potrzebne, gdy strategia wejdzie w nieunikniony okres drawdownu. Będziesz mógł wtedy zajrzeć do swoich notatek z backtestu, zobaczyć, że takie okresy już się zdarzały i że system finalnie się z nich podniósł, i spokojnie przeczekać gorsze chwile. Bez tego, emocje przejmą ster, a to zawsze kończy się źle.

Przykładowe wyniki backtestu strategii opartej na kointegracji dla pary EUR/PLN i USD/PLN (dane dzienne, okres: 2019-2023)
Całkowity Zwrot 48.7% Zysk netto po uwzględnieniu spreadów i slippage'u.
Sharpe Ratio 1.62 Dobry stosunek zwrotu do ryzyka.
Maks. Drawdown (MDD) -15.3% Do zaakceptowania dla wielu inwestorów.
Profit Factor 1.85 Zyski są prawie 2x wyższe od strat.
Expectancy 0.0024 Średni zysk na trade to 24 pipsy.
Ilość transakcji 127 Około 2-3 transakcje tygodniowo.

Podsumowując ten etap, myśl o backteście nie jako o nudnym, technicznym obowiązku, ale jako o swoim najtańszym i najskuteczniejszym trenerze tradingowym. To on pokaże Ci słabe punkty Twojej strategii, zanim zrobisz to za pomocą prawdziwych pieniędzy. Solidny backtest, z uwzględnieniem kosztów, z świadomym unikaniem overfittingu i z testem na danych out-of-sample, jest tym, co przekształca teoretyczne modelowanie kointegracji forex w realny plan działania. To fundament, na którym buduje się prawdziwy, długoterminowy sukces na rynku Forex. Inwestycja czasu w ten etap zwróci Ci się wielokrotnie, oszczędzając fortunę na unikniętych błędach.

Zarządzanie Ryzykiem i Psychologia Handlu Statystycznym Arbitrażem

No dobrze, skoro już mamy nasz piękny, przetestowany wstecznie model oparty na modelowaniu kointegracji forex, to czas na zimny prysznic rzeczywistości. Pamiętaj, że samo znalezienie skointegrowanej pary walutowej to dopiero początek drogi. Najwspanialszy nawet model matematyczny nie sprawi, że ryzyko magicznie wyparuje. Tutaj wkraczają dwa najważniejsze, a często pomijane filary sukcesu: solidne zarządzanie ryzykiem i żelazna dyscyplina psychologiczna. Możesz mieć najlepszy system na świecie, ale jeśli zaryzykujesz cały kapitał na jednym trade'cie lub wpadniesz w panikę podczas nieuniknionych drawdownów, wszystko pójdzie na marne. W świecie stat arb, a szczególnie w oparciu o modelowanie kointegracji forex, cierpliwość nie jest jedynie cnotą – jest absolutną koniecznością.

Zacznijmy od absolutnych podstaw, czyli od wielkości pozycji. To chyba najnudniejszy, ale jednocześnie najważniejszy element całej układanki. Zasada jest prosta: nigdy, przenigdy nie ryzykuj znaczącej części swojego kapitału na pojedynczą transakcję czy jedną strategię. Najprostszą i bardzo skuteczną metodą jest stosowanie stałego procentu kapitału. Na przykład, decydujesz, że na każdą transakcję przeznaczasz 1% lub 2% swojego depozytu. Dlaczego to takie ważne? Wyobraź sobie, że twój modelowanie kointegracji forex wskazał silną sygnał wejścia, ale… coś poszło nie tak. Relacja kointegrująca, zamiast się zbiec, gwałtownie się rozszerza. Jeśli ryzykowałeś 10% kapitału, jedna taka seria nieudanych transakcji może wyłączyć cię z gry. Przy 1% masz zapas na gorszy okres i możliwość handlowania dalej. To nie jest spektakularne, ale pozwala przetrwać. Prawdziwe zarządzanie ryzykiem forex to nie szukanie mocnych wrażeń, a systematyczne i nudne pilnowanie, byśmy zawsze mogli zagrać następnego dnia.

Kolejnym kluczowym elementem jest ustalenie poziomów Stop-Loss i Take-Profit. W strategiach mean-reversion, do których zalicza się handel oparty na modelowaniu kointegracji forex, może to być nieco bardziej subtelne niż w przypadku trend followingu. Stop-Loss nie zawsze jest ustalony na stałym poziomie cenowym, często opiera się na statystycznej miarze, jak np. odchylenie standardowe od średniej wartości spreadu. Chodzi o to, by zdefiniować punkt, w którym nasza oryginalna hipoteza (że spread jest stabilny i wróci do średniej) zostaje wyraźnie obalona przez rynek. Gdy spread przekroczy ten statystycznie wyznaczony próg, uznajemy, że relacja kointegrująca mogła się tymczasowo załamać i należy się wycofać, ograniczając stratę. Z Take-Profitem bywa podobnie – często przyjmuje się poziom, który historycznie oznaczał powrót do średniej, a nawet jej lekkie przekroczenie. To nie jest dokładna nauka, ale sztuka oparta na probabilistyce. Pamiętaj, że celem jest nie tyle trafienie w idealny moment wyjścia, co systematyczne zbieranie zysków, gdy rynek daje nam taką okazję.

A co robić, gdy nastąpi ten najgorszy możliwy scenariusz i spread po prostu przestaje się mean-revertować? To jest moment, w którym wielu traderów łamie swoją dyscyplinę handlową. Wpadają w pułapkę myślenia: „Przecież model działał przez ostatnie pół roku, to musi w końcu wrócić!”, i dośredniają swoją przegrywającą pozycję, pogłębiając tylko stratę. Prawda jest taka, że relacje kointegrujące nie trwają wiecznie. Mogą się rozpaść z powodu fundamentalnych zmian w gospodarkach krajów lub po prostu zmienności rynkowej. Twoim zadaniem nie jest mieć zawsze rację. Twoim zadaniem jest przetrwać. Dlatego właśnie ustaliłeś sobie sztywne Stop-Lossy oparte na modelowaniu kointegracji forex. Kiedy stop zostaje trafiony, po prostu wychodzisz z pozycji. Koniec kropka. Nie analizujesz, nie negocjujesz z rynkiem. Akceptujesz stratę, wyciągasz wnioski (czy coś się zmieniło fundamentalnie? może okres testowy był za krótki?) i czekasz na następny, wysokiej jakości sygnał od twojego systemu. To brutalnie trudne, ale konieczne.

I tu dochodzimy do sedna, czyli psychologii tradingu. Handlowanie strategiami statystycznego arbitrażu to często długie okresy nudy, przerywane momentami nagłej paniki lub chciwości. Twój model może przez tygodnie nie generować żadnych sygnałów, a ty musisz zachować cierpliwość i nie wymyślać na siłę transakcji, „bo już dawno nic nie handlowałem”. Z drugiej strony, gdy już wejdziesz w pozycję, a spread będzie się uparcie rozszerzał przeciwko tobie, twoim najgorszym wrogiem stanie się emocja i chęć „grania przeciwko modelowi”. Dyscyplina handlowa polega na ścisłym trzymaniu się z góry ustalonych zasad zarządzania ryzykiem forex, nawet (a właściwie zwłaszcza) wtedy, gdy wszystkie emocje krzyczą, żeby zrobić coś zupełnie innego. To jak bycie maszyną – nudną, przewidywalną, ale niezwykle skuteczną w dłuższym okresie. Prawdziwy sukces w modelowaniu kointegracji forex nie leży w skomplikowanych równaniach, ale w twojej głowie i zdolności do kontrolowania własnych odruchów.

Poniższa tabela podsumowuje kluczowe praktyki zarządzania ryzykiem, które powinny być nierozerwalnie związane z każdą strategią opartą na kointegracji, pomagając przekształcić teoretyczny model w odporne narzędzie handlowe.

Praktyki zarządzania ryzykiem w strategiach kointegrujących
Wielkość pozycji Stały procent kapitału na transakcję Ochrona kapitału przed serią strat; przetrwanie 0.5% - 2% kapitału
Stop-Loss (Statystyczny) Wyjście przy X odchyleniach standardowych od średniej spreadu Ograniczenie strat przy czasowym załamaniu się relacji 2.0 - 2.5 σ (historyczne)
Take-Profit Częściowe lub pełne zamknięcie przy powrocie do średniej lub jej lekkim przekroczeniu Systematyczne realizowanie zysków; unikanie chciwości 0.5 σ powyżej/poniżej średniej dla częściowej realizacji
Dywersyfikacja systemów Używanie wielu niepowiązanych par/ram czasowych Redukcja ryzyka związanego z załamaniem się pojedynczej relacji 3-5 niezależnych systemów na różnych parach
Częstotliwość handlu Handel tylko przy wysokiej jakości sygnałach Unikanie nadmiernej ekspozycji i "pchania" transakcji Oczekiwanie na np. Z-Score > 2.0 dla wejścia

Podsumowując, samo modelowanie kointegracji forex to tylko połowa sukcesu. Druga, być może ważniejsza połowa, to twoja zdolność do zarządzania tym, co niewidoczne: kapitałem i emocjami. Ustalenie sztywnych zasad dotyczących wielkości pozycji, poziomów Stop-Loss i dyscypliny w ich przestrzeganiu to niezbędny bufor bezpieczeństwa między tobą a nieprzewidywalnością rynku. Pamiętaj, że rynek nie obchodzi, jak bardzo jesteś pewny swojego modelu. Jego pracą jest testowanie twojej dyscypliny każdego dnia. Twoją pracą jest być na to przygotowanym. Bez tego, nawet najbardziej eleganckie modelowanie kointegracji forex stanie się jedynie drogim i frustrującym hobby, a nie narzędziem do generowania zysków.

Podsumowanie: Czy Kointegracja to Święty Graal Forexu?

No dobra, po tym wszystkim, co przeszliśmy – od szukania tych magicznie powiązanych par walutowych, przez testy Engle'a-Grangera, aż po zarządzanie kapitałem i walkę z własnymi emocjami – czas na małe podsumowanie. Bo jak to w życiu bywa, każde podejście ma swoje blaski i cienie, a modelowanie kointegracji forex nie jest tu żadnym wyjątkiem. To nie jest magiczna różdżka, która zamieni cię w króla rynku, ale potężne narzędzie, które, używane z głową, może naprawdę pomóc. Pamiętaj, chodzi o to, żeby być realistą, a nie naiwnym optymistą z różowymi okularami.

Zacznijmy od plusów, bo te są naprawdę kuszące. Chyba największą zaletą, o której ciągle mówię, jest teoretyczna neutralność wobec kierunku rynku. Nie musisz być geniuszem, który zgadnie, czy euro pójdzie w górę, czy dół. Twoim celem jest tylko (i aż!) złapanie momentu, kiedy para, która zwykle trzyma się razem, nagle się pokłóciła i oddaliła od siebie. To jest właśnie sedno modelowania kointegracji forex – handlujesz na powrocie do średniej, na powrót do tej „normalnej” relacji. To trochę jak być terapeutą dla walut: czekasz na awanturę, a potem pomagasz im się pogodzić i na tym zarabiasz. Kolejny plus to to, że strategie statystycznego arbitrażu oparte na kointegracji często mają atrakcyjne profile zysku i strat, przynajmniej na papierze. Dobre sygnały wejścia i wyjścia mogą prowadzić do bardzo przyzwoitych stosunków zysku do ryzyka. I nie oszukujmy się, samo modelowanie kointegracji forex i budowanie systemu to jest też fantastyczna intelektualna przygoda. Uczysz się ekonometrii, programowania, analizy danych – umiejętności, które są cenne same w sobie.

Ale… zawsze jest jakieś „ale”. Główne wyzwania? Jest ich kilka, i to całkiem poważnych. Po pierwsze, i najgroźniejsze: ryzyko rozpadu relacji kointegrującej. To jest ten moment, kiedy twój piękny model matematyczny leży w gruzach, a ty tracisz pieniądze. Pamiętasz te pary, które przez lata chodziły jak para zakochanych? Nagle może dojść do jakiegoś fundamentalnego szoku gospodarczego, zmiany polityki banku centralnego czy jakiegoś nieprzewidzianego zdarzenia geopolitycznego, które rozdzieli je na zawsze. I już nie ma powrotu do mean-reversion. Twoje historyczne dane, na których budowałeś cały model, stają się bezużyteczne. To jest największe ryzyko w modelowaniu kointegracji forex. Po drugie, zmienność rynkowa. Nawet jeśli relacja wciąż istnieje, gwałtowne rynkowe szaleństwa mogą zepchnąć twój spread tak daleko, że dotknie (albo i przekroczy) twój stop-loss, zanim zdąży się odwrócić. To boli podwójnie, bo zaraz potem spread często wraca na swoje miejsce, a ty już nie masz pozycji. Po trzecie, koszty transakcyjne. To zabójca wielu teoretycznie dobrych strategii arbitrażowych. Spread bid-ask, prowizje – to wszystko gryzie twoje zyski, a w tego typu precyzyjnych strategiach każdy pip ma ogromne znaczenie. Ostatnie wyzwanie to kwestia optymalizacji i przeuczenia modelu. Łatwo jest tak dostroić parametry na historycznych danych, że model będzie wyglądał genialnie na przeszłości, ale kompletnie zawiedzie na przyszłych, nieznanych danych. Prawdziwa sztuka modelowania kointegracji forex polega na znalezieniu tego złotego środka.

Dlatego muszę to powiedzieć jasno: to nie jest "magiczna kula". To nie jest tak, że napiszesz jeden skrypt, włączysz go i poleżysz na hamaku, a pieniądze same będą wpływać na konto. Modelowanie kointegracji forex to ciągła praca. To nieustanne monitorowanie otwartych pozycji, śledzenie kalendarza ekonomicznego pod kątem wydarzeń, które mogą zaburzyć twoje pary, oraz regularne ponowne testowanie i weryfikacja twoich modeli, aby upewnić się, że relacja kointegrująca wciąż jest żywa i ma się dobrze. To jest jak pielęgnacja ogrodu – nie możesz raz posadzić rośliny i mieć nadzieję, że będzie rosła sama. Trzeba ją podlewać, plewić i nawozić. Tutaj podlewaniem jest stałe doskonalenie swojego systemu.

W związku z tym wszystkim, moja największa rada to: ucz się ciągle. Świat forexu i handlu algorytmicznego nie stoi w miejscu. Pojawiają się nowe metody, nowe narzędzia analityczne, nowe badania. To, co działało wczoraj, jutro może już nie działać. Dlatego zachęcam cię gorąco, abyś dalej zgłębiał ten temat. Czytaj artykuły naukowe, eksperymentuj z różnymi metodami modelowania kointegracji forex (np. modelem VECM zamiast podstawowego Engle'a-Grangera), testuj swoje pomysły na rachunkach demo. Tylko tyle i aż tyle. Rachunek demo to twój najlepszy przyjaciel. Pozwala ci przetestować strategię w warunkach niemal rzeczywistych, ale bez ryzyka utraty prawdziwych pieniędzy. To jest twój poligon doświadczalny. Spędź na nim tyle czasu, ile potrzeba, aż będziesz pewny swojego systemu i swojego zrozumienia dla modelowania kointegracji forex. I pamiętaj – ostrożności nigdy dość. Zawsze startuj z małym kapitałem, którym jesteś w stanie stracić bez bólu serca. To ma być strategia na lata, a nie bilet na szybką wygraną.

Podsumowanie kluczowych zalet i wyzwań modelowania kointegracji w forex stat arb
Neutralność rynkowa Mniejsza zależność od ogólnego kierunku rynku; zyski z mean-reversion. Wymaga identyfikacji stabilnych, długoterminowych relacji. Szukaj par o silnych powiązaniach fundamentalnych (np. AUD/NZD).
Profil ryzyka Potencjalnie atrakcyjny stosunek zysku do ryzyka przy dobrym timingu. Ryzyko rozpadu relacji (structural break) prowadzące do dużych strat. Zawsze używaj stop-lossów i regularnie weryfikuj istnienie relacji.
Koszty - Koszty transakcyjne (spready, prowizje) mogą znacząco erodować zyski. Wybieraj pary z wąskimi spreadami i brokerów o niskich prowizjach.
Złożoność Głębokie zrozumienie rynków i ekonometrii. Ryzyko przeuczenia modelu (overfitting) na danych historycznych. Testuj na danych out-of-sample i używaj walidacji krzyżowej.
Czas i zaangażowanie Możliwość automatyzacji handlu. Wymaga ciągłego monitorowania i dostosowywania strategii. Traktuj to jako biznes, a nie hobby. Bądź zdyscyplinowany.

Podsumowując, modelowanie kointegracji forex to potężna technika, która otwiera drzwi do względnie zaawansowanych strategii handlowych. Jego zalety, takie jak neutralność rynkowa, są nie do przecenienia. Jednakże, jak każde narzędzie, nie jest pozbawione wad i poważnych ryzyk, z których najpoważniejszym jest trwały rozpad historycznej relacji między parami walutowymi. Sukces nie polega na znalezieniu idealnego, nieomylnego modelu, bo taki nie istnieje. Sukces polega na zrozumieniu tych mocnych i słabych stron, połączeniu solidnego modelowania kointegracji forex z żelazną dyscypliną zarządzania ryzykiem i niezachwianą cierpliwością. To po prostu kolejna, bardzo ciekawa ścieżka na tej niekończącej się drodze, jaką jest trading. So, keep learning, keep testing, and trade safe!

Czym dokładnie jest kointegracja w kontekście tradingu forex?

To tak, jakbyś miał dwa psy na smyczy. Każdy z nich może biegać tam i z powrotem (być niestacjonarnym), ale ponieważ są związani tą samą smyczą, nie mogą oddalić się od siebie zbyt daleko. W forexie, nawet jeśli dwie różne pary walutowe (np. EUR/USD i GBP/USD) same w sobie są bardzo zmienne, to mogą mieć między sobą długoterminową, stabilną relację. Modelowanie kointegracji forex polega na znalezieniu takich par i handlowaniu momentami, gdy ta smycz się na chwilę poluzuje, a ceny rozjadą, spodziewając się, że wrócą do swojej historycznej bliskości.

Czy potrzebuję zaawansowanego oprogramowania do modelowania kointegracji?

Nie koniecznie. Podstawowe testy, jak test Engle'a-Grangera, możesz przeprowadzić w popularnych środowiskach takich jak:

  • Python z bibliotekami jak statsmodels, pandas.
  • R, który jest bardzo silny w statystyce.
  • Nawet Excel z dodatkami może wystarczyć do prostych analiz.
Kluczowe nie jest najdroższe oprogramowanie, ale zrozumienie, co robisz i jak interpretować wyniki. Start jest łatwiejszy, niż myślisz!
Jakie jest największe ryzyko w strategiach opartych na kointegracji?

Największym ryzykiem jest rozpad relacji kointegrującej. To moment, gdy nasza "smycz" pomiędzy parami walutowymi pęka. Przyczyny mogą być fundamentalne, np. zmiana polityki monetarnej w jednym z krajów, nieprzewidziany szok geopolityczny czy zmiana sentymentu inwestorów wobec jednej waluty. Gdy to nastąpi, ceny mogą przestać wracać do swojej historycznej średniej i iść w przeciwnych kierunkach, generując straty. Dlatego solidne zarządzanie ryzykiem (stop-loss!) jest absolutnie kluczowe. To nie jest strategia "wsadź i zapomnij".

Czy mogę używać kointegracji do handlu innymi instrumentami niż pary walutowe?

Jak najbardziej! Chociaż skupiliśmy się na forex, to modelowanie kointegracji jest niezwykle potężnym narzędziem w całym arsenale statystycznego arbitrażu. Świetnie sprawdza się przy handlu:

  1. Akcyjnymi instrumentami pochodnymi (np. kontrakty futures na indeksy a ETF na ten sam indeks).
  2. Spółkami z tego samego sektora (np. Coca-Cola vs. Pepsi).
  3. Surowcami powiązanymi produkcyjnie (np. ropa naftowa i benzyna).
Zasada jest zawsze ta sama: szukaj aktywów, które są ze sobą fundamentalnie powiązane i handluj ich wzajemnym "rozjeżdżaniem się".
Ile historycznych danych potrzebuję, aby przetestować strategię?

To zależy od celu. Aby sam model kointegracji był wiarygodny, potrzebujesz wystarczająco dużo danych, aby uchwycić długoterminową relację. Zazwyczaj rekomenduje się co najmniej 2-3 lata danych dziennych. Jednakże:

Ale uwaga: upewnij się, że dane są czyste i uwzględniają splitów czy zmian notowań. Lepsza jest mniejsza, ale dobrej jakości próbka niż duża, ale pełna błędów.