Sieci neuronowe: czego można się nauczyć bez nauczyciela?

22.09.2012 - Patryk Filipiak
TrudnośćTrudnośćTrudność

Miara wiedzy

Kiedy możemy uznać, że sieć jest nauczona? Nie ma jednoznacznej odpowiedzi na to pytanie. Istnieją pewne kryteria pomiaru poprawności klasteryzacji, jednak, z uwagi na ich matematyczną złożoność, nie będziemy się nimi zajmować. Dostarczają one jedynie pewnych specyficznych informacji, które mogą (ale nie muszą) świadczyć o faktycznym nauczeniu sieci. W gruncie rzeczy, gdybyśmy wiedzieli, jakie powinniśmy uzyskać rezultaty uczenia sieci, nie byłoby w ogóle sensu stosowania uczenia bez nadzoru.

Rozmiar sieci

Z całą pewnością, im sieć jest większa, tym dłużej powinna być trenowana. Należy się zatem również zastanowić nad rozmiarem sieci. W idealnym przypadku sieć powinna mieć dokładnie tyle neuronów, ile klastrów faktycznie jest w badanej przestrzeni. W tym miejscu znów wracamy do poruszonej przed chwilą kwestii: gdybyśmy znali właściwą liczbę klastrów, nie musielibyśmy używać SOM. Wobec tego przyjmujemy, że lepiej jest zastosować sieć za dużą niż za małą. W przypadku za dużej sieci możemy zaobserwować neurony, które formują grupy reagujące na te same bodźce, bądź też takie, które reagują na bodźce skrajne, niespotykane w praktyce. W przypadku sieci zbyt małych, uzyskamy rezultaty błędne lub mocno przybliżone.

Warto wreszcie wspomnieć o braku determinizmu w algorytmie uczenia SOM. Wykonując dwukrotnie ten sam proces, nie mamy gwarancji, że uzyskamy jednakowe wyniki, z racji na losową inicjalizację neuronów (co odgrywa szczególne znaczenie w przypadku zbyt krótkiego uczenia sieci). Przede wszystkim zaś z uwagi na fakt, że w przypadku sieci neuronowych zwykle istnieje bardzo wiele reprezentacji dokładnie tego samego lub zbliżonego rozwiązania.

Przykład

Tom Heskes z uniwersytetu w Nijmegen (Holandia) w swojej pracy "Self-organizing maps, vector quantization, and mixture modeling" (IEEE Transactions on Neural Networks, Vol. XX, 2001) przedstawił bardzo ciekawy przykład zastosowania SOM. Przeanalizował on 193639 transakcji w pewnym supermarkecie, grupując dostępne tam produkty w 199 kategoriach. Przy pomocy uzyskanych danych wytrenował sieć neuronową o rozmiarze 60 x 40 neuronów. Informacje o popularności towarów przedstawił w postaci prawdopodobieństw, że produkty z danej grupy zostaną zakupione, jeżeli kupiony został też towar z grupy X. W ten sposób dokonał klasteryzacji przestrzeni 199-wymiarowej. Uzyskana mapa widoczna jest na poniższym rysunku, zaczerpniętym z jego pracy (po kliknięciu dostępne jest powiększenie obrazka).

basket

Na mapie dodatkowo uwidoczniona jest popularność danych grup produktów. Kotliny reprezentują towary najchętniej kupowane, zaś wyżyny - kupowane najrzadziej. Na uzyskanej mapie można dostrzec, że produkty, które zwykle uznajemy za podobne, faktycznie znalazły się blisko siebie. Na pierwszy rzut oka widać na przykład obszary produktów drogeryjnych, napojów, karm dla zwierząt, przekąsek itd. Taka mapa może być bardzo użyteczna z jeszcze innego powodu: przy jej pomocy możemy zaplanować przestrzenne rozmieszczenie produktów w supermarkecie. Firmy zajmujące się taką formą sprzedaży dążą bowiem do tego, by klient kupujący towar A, miał jednocześnie w pobliżu towary B, C i D, które kupowali również inni klienci kupujący A.

Podsumowanie

W zrozumieniu działania sieci Kohonena kluczowe jest pewnego rodzaju "oswojenie się" z przestrzeniami wysokowymiarowymi, co może być trudne dla nas - funkcjonujących w przestrzeni 3-wymiarowej. Gdy uporamy się z tą przeszkodą, szeroka gama możliwości SOM jest już do naszej dyspozycji. Sceptycy zarzucać mogą, że rola sieci uczonych bez nadzoru sprowadza się na dobrą sprawę wyłącznie do klasteryzacji. Odrzec wypada, że w dobie potęgi informacji, każde skuteczne narzędzie pozwalające na przykład eksplorować ogromne ilości danych, których żaden człowiek nie jest w stanie przejrzeć "o własnych siłach", jest na wagę złota. O tym, że SOM odgrywają bardzo istotną rolę, niech świadczy fakt, że (pomimo około 30-letniego stażu) do dziś są szeroko wykorzystywane, badane, rozwijane i udoskonalane.

0
Twoja ocena: Brak

Copyright © 2008-2010 Wrocławski Portal Informatyczny

design: rafalpolito.com