Bioinf2.doc

(32 KB) Pobierz
SRS 1

Bioinformatyka 2006/07 01.03.07

SRS 1

 

1.      Zapoznaj się z opisem poszczególnych pól we wpisach do banku danych sekwencji nukleotydowych (EMBL)

 

http://www.ebi.ac.uk/embl/Documentation/Release_notes/current/relnotes.html

http://www.ebi.ac.uk/embl/Documentation/User_manual/usrman.html

 

i białkowych (UNIPROT)

http://www.expasy.org/sprot/userman.html

 

2.      Uruchom serwer SRS : http://srs.ebi.ac.uk

 

Używając SRS (zasady zadawania pytań do poszczególnych pól opisu można uzyskać klikając w nazwę bazy w library page, a następnie na interesujące nas pole)

 

Library page - > baza (do białek :KB) -> standard query form

 

-          znajdź sekwencje rybonukleazy H z drożdży Saccharomyces cerevisiae (UNIPROT) yeast (QO4640)

-          znajdź odpowiadającą jej sekwencję nukleotydową (link do EMBL)

-          zobacz jak tekst wpisów do obu baz (text entry) przekłada się na ich reprezentacje w SRS

-          do jakich innych baz danych mają odniesienia opisy sekwencji białkowej i nukleotydowej? Zapoznaj się z poziomem opisu struktury z bazy PDB

-          znajdź białka ludzkie mające sekwencje o długości dokładnie 200 reszt aa

library query : :KB, :Homo sapiens sapiens : sequence length :200

 

-          ile jest znanych ludzkich białek mających sekwencje od 200 do 300 reszt? Ile jest takich białek u Saccharomyces cerevisiae?

Tips: to do more advances queres use the extend query form (>= ; <= ), ewentualnie zapis 200:300

 

-          Ile jest białek opisanych jako chloroplastowe u Arabidopsis thaliana?

Organellum:Chloroplast, ogranism:Arabidopsis thaliana

 

 

SRS 2

 

1.      How many human proteins are there in UniProt database? What is the difference between using “human” and “homo sapiens” in your query (organism name)?

Samo ‘human’ – także ludzkie pasożyty, adenowirusy itp. (koło 280 tyś)

„homo sapiens” tylko białka ludzkie (koło 69035)

 

2.      Find in UniProt database sequence p26358 and look at its annotation. What is the family this protein belongs to? How many proteins from this family are stored in UniProt database? How many of these proteins are human?

Family : c5-metylotransferase.

Organism name : homo sapiens, all text:c5 metylotransferase

 

3.      Find the nucleotide sequence published in Cell 112(1):29-40(2003). On which chromosome is this sequence located?

Reference: journal: Cell , Volume No:112 First Page: 29 Year:2003

Baza EMBL! (sekw. nukleotydowa, nie aminokwasowa)

Odp. PARC (p53 associated parkin-like cytoplasmatic protein)

 

4.      Find yeast proteins that bind to nucleotides (Ft_Key field : np_bind, organism : Saccharomyces cerevisiae)

Organism name : yeast

Feature - Ft_key : np_bind

 

5.      Find nukleotiode sequences of yeast histone. How many proteins are coded by these sequences? How would you explain this?

description

 

6.      Can you find names of other motifs than np_bind? (choose FtKey and click the “i” icon near the field)

CA_bind, ZN_fing, DNA_bind

http://www.expasy.org/sprotusername.html - feature identifers, the FT-line

 

 

7.      Which nucleotide sequence (only one) has something in common with a Cuban dictator?

 

...
Zgłoś jeśli naruszono regulamin