Najdłuższy podciąg rosnący

25.11.2009 - Karol Konaszyński

Wielowymiarowy LAS

(Uwaga! Teraz nastąpi bardzo ważne spostrzeżenie!) Zauważmy, że ciąg $a_{1}, a_{2}, \ldots, a_{n}$ możemy reprezentować jako zbiór par $(1,a_{1}), (2,a_{2}), \ldots, (n,a_{n})$ . Wtedy nie musimy bać się o kolejność i zadanie staje się następujące: Znaleźć największy podzbiór tego zbioru par o takiej własności, że z każdych dwóch elementów jeden jest "silnie większy" od drugiego, czyli ma obie współrzędne większe. Dlatego ten problem można nazwać 2-wymiarowym najdłuższym łańcuchem (2-dimensional Longest Chain - 2-DimLC).

Jak może wyglądać 3-DimLC czyli 2-dimLAS? Dany jest zbiór trójek, czyli uporządkowany ciąg par $\left(a_{1},b_{1}\right), \left(a_{2},b_{2}\right), \ldots, \left(a_{n},b_{n}\right)$ i chcemy w nim znaleźć najdłuższy podciąg silnie rosnący. Spójrzmy teraz na rysunek. Tutaj najdłuższy podciąg rosnący zaznaczony jest na czerwono: na obu współrzędnych jest ściśle rosnący. Jak się tego szuka? Jeden z algorytmów (ten, który ja znam...) działa podobnie jak w przypadku niżejwymiarowym, w szczególności warstwy są zdefiniowane tak samo (tzn. w $k$ -tej znajdują się elementy kończące pewien podciąg o długości $k$ ). Problemem jest tylko to, że nie możemy za każdym razem wrzucać na listę elementu najmniejszego (bo nie można par uporządkować w ten sposób!). Nie możemy więc, w binary searchu, patrzeć na ostatni element listy.
Musimy więc niejako przeglądać całą warstwę. Gdy jednak zagwarantujemy, że jest ona posortowana np. rosnąco po pierwszej współrzędnej oraz malejąco po drugiej, to w obrębie warstwy możemy użyć kolejny raz binary-searcha. Czemu to w ogóle jest możliwe? Przyda się tutaj ważne spostrzeżenie: nie wszystkie elementy są potrzebne, więc po wrzuceniu jakiejś pary $(a,b)$ do warstwy możemy z niej usunąć wszystkie pary $(a', b')$ spełniające $a' \geq a \wedge b'\geq b$ . Zatem w ogólności algorytm wygląda tak:

dla każdego kolejnego elementu:

sprawdź binary searchem numer najdalszej warstwy, w której jest element silnie mniejszy od danego
wrzuć go do warstwy następnej
usuń elementy niepotrzebne (jak?).

Musimy jednak mieć jakąś strukturę, która umożliwi nam wykonywanie takich operacji. Do tego celu warto użyć jakiegoś drzewa (np seta z stl-a):

Niestety, na wdawanie się w szczegóły botaniczno-implementacyjne nie ma tu miejsca, mamy bowiem jeszcze jedną rzecz do omówienia. Ale policzmy jeszcze złożoność obliczeniową tego algorytmu. Dla każdego elementu binary-searchuję go w ciągu warstw, ale każde sprawdzenie wymaga znowu binary-searcha po warstwie ( $log^{2}(n)$ ). Następnie muszę go wstawić do tej warstwy, co też zajmie $log(n)$ , a potem usunąć elementy niepotrzebne, co zajmie nam maksymalnie $n*log(n)$ (jako że każdy element usuniemy co najwyżej raz) - czyli mamy $O\left(n*log\left(n\right)*log(n)+n*log(n)+n*log(n))$ , co daje $O(n*log^{2}(n))$ . Podobno, k-DimLC da się rozwiązać w czasie $O(n*log^{k-1}(n))$ . Niestety, autor niniejszego artykułu nie ma pojęcia jak to zrobić...
Teraz jeszcze jedna wariacja na temat:

Longest common subsequence

(Ten rodział jest przeznaczony dla tych, którzy znają ten problem, gdyż tutaj będziemy korzystać ze standardowego algorytmu)
Postawowy algorytm do wyszukiwania LCSa dwóch słów o długości $n,m$ polega na utworzeniu tabelki $n \times m$ i wypełnieniu jej w pewien magiczny sposób, co zajmuje mu czas $O(n*m)$ . Gdy jednak założymy, że w jednym z słów wszystkie literki sa różne (np. jakieś chińskie słowo), to problem sprowadza się do znalezienia najdłuższego podciągu rosnącego!

Otóż, każdej literce $b$ słowa $B$ (tego o różnych literach) przypiszmy jej indeks, czyli niech $b'_{i} = i$ . Wtedy weźmy to pierwsze słowo $A = a_{1}, a_{2}, \ldots, a_{n}$ i dla każdej jego literki robimy tak: jeśli nie występuje w drugim słowie to ją "usuwamy" (czyli po prostu nie rozpatrujemy), zaś gdy występuje (czyli zachodzi $a_{i} = b_{j}$ ), to wtedy zastępujemy ją przez $j$ , czyli indeks tej literki w słowie drugim. Mamy więc $a'_{i} = b'_{j} = j$ . Wtedy najdłuższy wspólny podciąg będzie najdłuższym podciągiem rosnącym dla nowego ciągu $a'_{1}, a'_{2}, \ldots, a'_{n}$ (teraz już nie słowa, a ciągu indeksów).

Czemu to działa? Dowód, oczywiście, pozostawiam czytelnikom! Ważne jest to, że potrafimy znaleźć LCS w czasie (w zależności od implementacji) $O(m+n*log(n))$ lub $O((m+n)log(n))$ , gdzie $m$ jest długością tego "zróżnicowanego" ciągu, czyli znacznie szybciej niż standardowy LCS. Do przemyślenia: co się stanie, gdy w tym drugim słowie każda z liter będzie występowała najwyżej $C$ razy, gdzie $C$ jest jakąś stałą (np. $C = 10$ )? Czy potrafimy to rozwiązać w czasie $O(m+n*log^{2}(n))$ ?

Na tym kończymy rozważania na ten temat.
Przyznam szczerze, że problem jest nietrywialny i o ile sam w sobie nie jest aż tak przydatny jak np. drzewa przedziałowe, to idee z nim zwiazane przewijają się bardzo często (np zadanie Architekci, II etap XVI OI) i nierzadko w zakamuflowanej formie.
Poniżej przedstawiam trzy zadania. Dwa z nich polegają na zaimplementowaniu tego, co zostało opisane w niniejszym artykule, jedno jest przykładem takiego "kamuflażu". Miłej zabawy :D

Ocena:

Twoja ocena: Brak Ocena: 3.7 (15 ocen)

Wersja do wydruku

Działy

Najdłuższy podciąg rosnący

Wielowymiarowy LAS

Longest common subsequence

Logowanie

Polecane artykuły

Polecane aktywności

ScriptCraft: RTS ze skryptami

Smok: programowanie inaczej

Bloki - gra logiczna

Polecane artykuły

Platformówka - jak to się robi?

Własny silnik gry TPP

Własny język programowania

Arkanoid 3D krok po kroku

Synteza mowy III: Finał

DirectX: Labirynt 3D od podstaw

Krowa, las i eksploracja terenu

Algorytmy: Zostań zawodnikiem

Szukaj