Sprawko.pdf

Przede wszystkim przeczytaj instrukcję, żeby nie było niejasności.

Potrzebne Ci są te kartki, w których wypełnisz dane wejściowe, instrukcja+kartki w folderze MSI

W każdym badaniu mierzysz ilość cykli, po których sieć neuronowa nauczy się wzoru.

Wzór traktujemy jako nauczony, jeśli współczynnik pod neuronem osiągnie wartość >=0.9

• Porównujemy trzy sieci neuronowe z różną liczbą neuronów w warstwie ukrytej, przy tych

samych danych wejściowych.

W tym celu wykorzystamy pliki letters1.net, letters2.net, letters3.net, letters1.pat

Plik letters1.net (10 neuronów w warstwie ukrytej) sieć nauczyła się wzoru po 55

cyklach

Plik letters2.net (5 neuronów w warstwie ukrytej) sieć nauczyła się wzoru po 105

cyklach

Plik letters3.net (2 neurony w warstwie ukrytej) sieć nauczyła się wzoru po 175

cyklach

Wniosek: im mniej neuronów tym więcej cykli potrzebnych do nauczenia się wzoru.

• Porównujemy różne funkcje aktywacji przy wykorzystaniu sieci letters2.net i pliku

letters1.pat

Funkcja Act_Logistic: wzór nauczony po 90 cyklach

Funkcja Act_Elliot: wzór nauczony po 90 cyklach

Funkcja Act_Signum: wzór nauczony po 75 cyklach

Funkcja Act_Product: wzór nauczony po 330 cyklach

Funkcje aktywacji zmieniamy dla neuronów w warstwie ukrytej!

Wniosek: dla różnych funkcji aktywacji różnie to bywa

• Porównujemy litery z szumem lub bez, plik letters2.net, letters3.pat, letters3szum.pat

Dla pliku bez szumu:

litera M: 90 cykli

litera N: 85 cykli

litera O: 105 cykli

średnio: 93 cykle

Dla pliku z szumem:

litera M: 120 cykli

litera N: 205 cykli

litera O: 75 cykli

średnio: 133 cykle

Wniosek: nawet z dużym szumem (po 3 bity na jedną linię tekstu) uczenie trwa

niewiele dłużej, niż dla danych bez szumu.

Dobra rada: zrobić wszędzie po kilka pomiarów i wyliczyć średnią, wtedy są

dokładniejsze wyniki