Sprawko.pdf

(37 KB) Pobierz
718824268 UNPDF
Przede wszystkim przeczytaj instrukcję, żeby nie było niejasności.
Potrzebne Ci są te kartki, w których wypełnisz dane wejściowe, instrukcja+kartki w folderze MSI
W każdym badaniu mierzysz ilość cykli, po których sieć neuronowa nauczy się wzoru.
Wzór traktujemy jako nauczony, jeśli współczynnik pod neuronem osiągnie wartość >=0.9
• Porównujemy trzy sieci neuronowe z różną liczbą neuronów w warstwie ukrytej, przy tych
samych danych wejściowych.
W tym celu wykorzystamy pliki letters1.net, letters2.net, letters3.net, letters1.pat
Plik letters1.net (10 neuronów w warstwie ukrytej) sieć nauczyła się wzoru po 55
cyklach
Plik letters2.net (5 neuronów w warstwie ukrytej) sieć nauczyła się wzoru po 105
cyklach
Plik letters3.net (2 neurony w warstwie ukrytej) sieć nauczyła się wzoru po 175
cyklach
Wniosek: im mniej neuronów tym więcej cykli potrzebnych do nauczenia się wzoru.
• Porównujemy różne funkcje aktywacji przy wykorzystaniu sieci letters2.net i pliku
letters1.pat
Funkcja Act_Logistic: wzór nauczony po 90 cyklach
Funkcja Act_Elliot: wzór nauczony po 90 cyklach
Funkcja Act_Signum: wzór nauczony po 75 cyklach
Funkcja Act_Product: wzór nauczony po 330 cyklach
Funkcje aktywacji zmieniamy dla neuronów w warstwie ukrytej!
Wniosek: dla różnych funkcji aktywacji różnie to bywa
• Porównujemy litery z szumem lub bez, plik letters2.net, letters3.pat, letters3szum.pat
Dla pliku bez szumu:
litera M: 90 cykli
litera N: 85 cykli
litera O: 105 cykli
średnio: 93 cykle
Dla pliku z szumem:
litera M: 120 cykli
litera N: 205 cykli
litera O: 75 cykli
średnio: 133 cykle
Wniosek: nawet z dużym szumem (po 3 bity na jedną linię tekstu) uczenie trwa
niewiele dłużej, niż dla danych bez szumu.
Dobra rada: zrobić wszędzie po kilka pomiarów i wyliczyć średnią, wtedy są
dokładniejsze wyniki
Zgłoś jeśli naruszono regulamin