Wyklad4.pdf

(84 KB) Pobierz
266719228 UNPDF
SzeregirozdzielczeihistogramywR.
Tworzenieszereg¶owrozdzielczych,histogram¶oworazwst , epnaanalizadanychs , aopisanenaprzykÃla-
dziedanychzawartychwpliku Zakupy.csv opisuj , acychkwot , ezakup¶owwsklepiewielkopowierzchnowym
powi , azan , azpewnymidanymiklienta(pÃle¶c,wiek,wyksztaÃlcenie).
1Wczytywanieiwst , epnaanalizadanych
Abywczyta¶cdanezplikutekstowego(wszczeg¶olno¶scicsv)mo_znaposÃlu_zy¶csi , ekomend , a read.table ,
np.takjakponi_zej:
>dane=read.table("Zakupy.csv",header=T,sep=";",dec=",")
Wzmiennej dane zapisanyjestwtedyobiekttypudata-frame(ramkadanych).Dojegokom¶orek
mo_znasi , eodwoÃlywa¶cjakdokolumnmacierzy,lubpoprzeznazw , ekolumny(uwaganawielko¶s¶cliter).
>mean(dane[,5])
[1]62.76964
>mean(dane$WYDATEK)
[1]62.76964
Jestr¶ownie_zmo_zliwo¶s¶csprawdzenianazwkolumnoraz(wartoprzywieluwywoÃlaniach)pracyw
konteksciekolumndanejramkidanych.
>names(dane)
[1]"LP." "PLEC" "WIEK" "WYKSZTALCENIE"
[5]"WYDATEK"
>with(dane,{
+ print(mean(WIEK))
+ print(mean(WYDATEK))
+})
[1]40.12444
[1]62.76964
Mo_znawreszcie,dzi , ekiu_zyciupolece¶n attach i detach dÃlu_zejpracowa¶cwkontekciedanejramkidanych.
>attach(dane)
Thefollowingobject(s)aremaskedfromdane(position3):
LP.PLECWIEKWYDATEKWYKSZTALCENIE
>mean(WIEK)
[1]40.12444
>mean(WYDATEK)
[1]62.76964
>detach(dane)
Odtegomomentupoleceniadotycz , acekolumnzmiennej dane b , ed , awykonywanepowydaniupolecenia
>attach(dane)
Thefollowingobject(s)aremaskedfromdane(position3):
LP.PLECWIEKWYDATEKWYKSZTALCENIE
2Wybieraniepodzbior¶owdanych
Naturalnajestkonieczno¶s¶cograniczeniasi , epodczasanalizydopewnegopodzbiorudanychnp.aby
policzy¶cstatystykiopisowedlawydatk¶owkobietim , e_zczyzn|mo_znatozrobi¶c " napiechot , e":
>n_k=sum(PLEC=="K")
>(sr_k=sum((PLEC=="K")*WYDATEK)/n_k)
[1]68.09238
>(var_k=sum((PLEC=="K")*(WYDATEK-sr_k)^2)/(n_k-1))
[1]1488.324
>n_m=sum(PLEC=="M")
>(sr_m=sum((PLEC=="M")*WYDATEK)/n_m)
[1]56.46505
>(var_m=sum((PLEC=="M")*(WYDATEK-sr_m)^2)/(n_m-1))
[1]1017.558
Mo_znawykorzysta¶cmechanizmypodziaÃluwbudowanewpakietR:
>(n_km=by(WYDATEK,PLEC,length))
PLEC:K
[1]122
------------------------------------------------------------
PLEC:M
[1]103
>(sr_km=by(WYDATEK,PLEC,mean))
PLEC:K
[1]68.09238
------------------------------------------------------------
PLEC:M
[1]56.46505
>(var_km=by(WYDATEK,PLEC,var))
2
PLEC:K
[1]1488.324
------------------------------------------------------------
PLEC:M
[1]1017.558
>n_km[[1]]
[1]122
Samedaner¶ownie_zmo_znarozdzieli¶cnapodzbiory " napiechot , e"
>wydatki_k=vector(mode="numeric",length=n_k)
>wydatki_m=vector(mode="numeric",length=n_m)
>j=1
>k=1
>for(iindane[,1]){
+ if(PLEC[i]=="K"){
+ wydatki_k[j]=WYDATEK[i]
+ j=j+1
+ }
+ else{
+ wydatki_m[k]=WYDATEK[i]
+ k=k+1
+ }
+}
>mean(wydatki_k)
[1]68.09238
>var(wydatki_k)
[1]1488.324
Mo_znajednak(cojestchybawygodniejsze)zkorzysta¶czwbudowanejfunkcji subset .
>wydatek_k=subset(WYDATEK,PLEC=="K")
>wydatek_m=subset(WYDATEK,PLEC=="M")
Literatura
[1]P.Biecek, PrzewodnikpopakiecieR ,O¯cynaWydawniczaGiS,WrocÃlaw,2008.
[2]ZaÃl , aczonadokumentacjapakietuR,2010.
3
Zgłoś jeśli naruszono regulamin