Prawdopodobieństwo warunkowe i algorytm, który zadziwi Twoją panią od polskiego

15.06.2010 - Krzysztof Dryś
TrudnośćTrudnośćTrudność

Czy rachunek prawdopodobieństwa może się gdzieś przydać? Okazuje się, że tak - i to w pozornie odległej dziedzinie. W tym artykule zobaczymy, jak wykorzystać rachunek prawdopodobieństwa do stworzenia algorytmu, który rozpoznaje części mowy. Przekonajcie się, jak to możliwe, że te dwie rzeczy w ogóle mają coś wspólnego!

Czas na powtórkę z polskiego!

Pomówmy o częściach mowy. Czy wiecie jaką częścią mowy jest słowo kalafior? Oczywiście jest to rzeczownik w mianowniku liczby pojedynczej. A słowo masy? Cóż, to na pewno rzeczownik. Ale może być i w mianowniku liczby mnogiej i w dopełniaczu liczby pojedynczej. A słowo biegli to może być albo czasownik (l. mnoga, czas przeszły) albo rzeczownik (l.mnoga, mianownik).

O ile trudno powiedzieć jaką częścią mowy jest samotne słowo biegli, to w zdaniu będzie nam już dużo łatwiej. Na przykład w zdaniu: Biegli stwierdzili winę producenta. nikt chyba nie ma wątpliwości, że chodzi o rzeczownik. Natomiast w Chłopcy biegli do kina w deszczu. jasne jest, że chodzi o czasownik. Dlaczego? Bo mamy do dyspozycji kontekst. Umiemy popatrzeć na całe zdanie i z niego wydedukować jaką częścią mowy jest każde słowo.

Jak nauczyć podobnej sztuczki komputer? Trzeba jakoś wykorzystać kontekst słowa. Robi to na przykład algorytm, który można zobaczyć poniżej. Nie zawsze działa on zupełnie poprawnie, ale zazwyczaj radzi sobie całkiem nieźle. Jak działa? Spróbujemy zrozumieć to w tym artykule.

Za nim przejdziemy dalej, dobrze by było pobawić się poniższym algorytmem. Nie zawsze daje dobre odpowiedzi - warto znaleźć przykład zdania, z którym sobie nie radzi.

Mała uwaga: zdania do otagowania (tutaj tagowanie, to inaczej rozpoznawanie części mowy) należy wpisywać bez znaków interpunkcyjnych, kolejne słowa rozdzielając jedną spacją.

5
Twoja ocena: Brak Ocena: 5 (1 ocena)

Copyright © 2008-2010 Wrocławski Portal Informatyczny

design: rafalpolito.com