Analiza rapotului primit la exercitiul 1

65

           După linia Searching...Done, este dată o imagine.

Imagine generată automat de serverul BLAST reprezentānd gradul de omologie al secvenţei introduse cu secvenţele prezente īn baza de date.

            Īn aceasta imagine,  linia roşie reprezintă secvenţa introdusa. Această linie are īn imediata vecinătate o scală reprezentānd numărul de nucleotide. Sub scală sunt date numeroase linii de diferite lungimi şi culori fiecare reprezentānd o secvenţă din baza de date. Fiecare dintre ele ar trebui examinată īn parte. Dacă secvenţa există īn baza de date, linia imediat următoare ar trebui să aibă aceeasi lungime reprezentānd o identificare completă a secvenţei introduse. Dacă toate liniile sunt mai scurte ca īn exemplul nostru, atunci probabil că secvenţa introdusă nu este īn baza de date şi lprima linie după scală reprezintă secvenţa cu care secvenţa are cel mai lung aliniament. Toate liniile care urmează sunt mult mai scurte, Aceasta ilustrează  īntr-un mod grafic că celelalte au un grad mai redus de homologie cu secvenţa introdusă.

            Īn continuare, raportul prezintă o listă cu descrierea liniilor ce reprezintă secvenţe din baza da date. Dăm īn continuare primele 7 linii din această listă

                                                                    Score    E 
Sequences producing significant alignments:                         (bits)  Value

emb|AX336753|AX336753 [Homo sapiens]Sequence 7262 from Patent WO...   900   0.0
emb|L37747|HSLAM11 [Homo sapiens]Homo sapiens lamin B1 gene, exo...   900   0.0
emb|AC093532|AC093532 [Homo sapiens]Homo sapiens chromosome 5 cl...   862   0.0
emb|AC093284|AC093284 [Homo sapiens]Homo sapiens chromosome 5 cl...   862   0.0
emb|AX330946|AX330946 [Homo sapiens]Sequence 1455 from Patent WO...   595   e-167 
emb|M34458|HSLAMBA [Homo sapiens]Human lamin B mRNA, complete cds.    595   e-167
emb|BC012295|BC012295 [Homo sapiens]Homo sapiens, Similar to lam...   587   e-164

            Valoarea E este importantă. Este ultimul număr de pe linie şi reprezintă cāt de aproape este secvenţa introdusă de secvenţa respectivă din baza de date. Cu cāt este mai apropiată de zero această valoare, cu atāt secvenţa introdusă este mai asemănătoare cu secvenţa listată din baza de date.  Această valoare reprezintă probalilitatea de apariţie a unui astfel de aliniament din pură īntămplare.

            Din linia a doua aflăm că este vorba de o secvenţă din AND-ul uman şi anume gena lamin B1.

            Mai departe īn raport putem examina aliniamentele care au fost găsite. Acestea sunt listate īn aceeordine ca īn lista anterioară. Un scurt exemplu este dat īn continuare:

>emb|L37747|HSLAM11 [Homo sapiens]Homo sapiens lamin B1 gene, exon
         11, complete cds.
         Length = 958 

Score = 900 bits (454), Expect = 0.0 
Identities = 454/454 (100%) 
Strand = Plus / Plus Query: 1

Query: 1   aaaagaaaaggttagaaagatgagagatgataaagggtccatttgaggttaggtaatatg 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 1   aaaagaaaaggttagaaagatgagagatgataaagggtccatttgaggttaggtaatatg 60

Query: 61  gtttggtatccctgtagttaaaagtttttgtcttattttagaatactgtgatctatttct 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 61  gtttggtatccctgtagttaaaagtttttgtcttattttagaatactgtgatctatttct 120

            Putem vedea că există o potrivire de 100% dintre secvenţa introdusă (Query) şi secvenţa īn discuţie din baza de date (Sbjct). Bara (|) care uneşte două nucleotide indică homologia. Lipsa acestei bare indică lipsa homologiei (o nepotrivire).

            Pe măsură ce avansăm īn raport secvenţele prezintă aliniamente cu un scor din ce īn ce mai mic apărānd gap-uri din ce īn ce mai mari.

            Nepotrivirilor pot fi datorate mai multor cauze dintre care enumerăm: un punct de mutaţie īn secvenţa introdusă (care poate fi interesant), o eroare de secvenţiere (datorită compresiei gelului, de exemplu), sau chiar o intrare īn baza de date incorect raportată. 

            Pentru fiecare linie din lista anterioară, ca şi la īnceputul aliniamentelor sunt date link-uri către informaţii detaliate despre secvenţa din baza de date. Un astfel de link este L37747.

    Cea mai importantă informaţie din acest fişier se află chiar pe prima linie. Din ea aflăm că numele HSLAM11 reprezintă ID-ul secvenţei din baza de date.

© Cornel Mironel Niculae, 2003-

12-Jan-2012