top of page

DNA sekuentziaren analisia egiteko zenbait tresna bioinformatiko erabili genituen. 

 

Analisiaren lehenengo pausua sekuentziazio bidez lorturiko sekuentzia laburrak mihiztatzea izan zen. Hau da sekuentzia motzak batzea contigak eratzeko. Horretarako Cap3 softwarea erabili dugu. Hau egiteko beste aukera asko daude sarean, adibidez DNA baser.

 

Cap3

DNA sekuentzien mihiztaketa egiteko erabili daitekeen tresna da hau. Sekuentziazioan lortutako zatietatik abiatzen gara. Zati hauek FASTA formatuan egon behar dira. Behin formatu hau lorturik laukian sekuentzia guztiak sartzen dira eta SUBMIT botoiari ematen zaio.

Software honek daukan desabantaila da, ezin duela 50kb baino sekuentzia luzeagoak mihiztatu, beraz, nukleotido kopurua oso handia bada zatietan egin beharko da mihiztaketa.

 

Mihiztaketa guztiak egin ondoren 5 contig lortzen dira. Orain Contig horien analisia burutzen da, anotazio estrukturala eginez. Honetarako lehendabizi BLAST softwarea erabili zen.

 

BLAST (Basic Local Alignment Search Tool). Bere ingelerazko siglek dioten bezala sekuentzien lerrokaketa burutzeko tresna informatikoa da. Algoritmo batez baliatuz (defektuz dakarrena BLOSUM izenekoa da) intereseko sekuentzia datu basean aurkitzen diren beste sekuentziekin alderatzen da.

Hainbat aldaera existitzen diren arren guk erabili ditugunak hauek dira:

-blastn: Query sekuentzia nukleotidiko bat datu baseko sekuentzia nukleotidikoaren aurka alderatu.

-blastp: Query sekuentzia proteikoa datu baseko sekuentzia proteikoen aurka alderatu.

 

Esan beharra dago BLASTek bakarrik antzekotasunak bilatzen dituela, beraz, aurkitzen dituen emaitza guztien artean guk egin beharko dugu emaitzen analisia. Horretarako Score eta e balioak erabili ditugularik (Score altua eta e balio baxua dutenek fidagarritasun handiagoa daukate).

BLAST egiteko aurretik mihiztatutako sekuentziak Query jartzen duen laukian sartuz eta nahi ditugun baldintzak (zein espezie baztertu esaterako) finkatuz, BLAST botoiari ematea besterik ez dago.

 

Gainera, BLAST-ek beste aukera bat ere badu. Align two or more sequences aukeran klikatuz, gure interesekoak diren bi sekuentzia lerrokatu ditzakegu, bien arteko aldakortasunik badagoen konprobatzeko.

 

Hurrengo pausoa, gure DNA sekuentziako transposoi edo sekuentzia errepikakorrak bilatzean datza. Horretarako, Giri softwarea oso baliagarria suertatu zaigu, eta kontig-aren arabera, emaitzak oso desberdinak izan dira, nahiz eta kontig denetan topatu halako sekuentziaren bat. Zenbait kontig-etan, transposoiak kontsideratzen diren sekuentzia agertzen dira, baina hauen Score balioak oso ezberdinak dira. Datu kopuru handi honi aurre egiteko, score balio muga bat ezarri beharrarekin topatu gara, 100 hain zuzen ere. Honek esan nahi duena da 1000 balioa baino altuagoko score-a duten sekuentzia horiek kontsideratuko ditugula transposoi. Muga hori ezartzeko arrazoia da transposoien kasuan sekuentziak ez daudela oso kontserbatuta, eta hori dela eta, zaila da kontsentsuz erabakitzea kasu bakoitzean sekuentzia bat transposoi kontsideratu edo ez. Ondorioz, transposoien inguruan ezagutzen den informazio asko ziurtzat hartu ezin daitekeenez, score balioak ezartzen dira, eta horien arabera norberak erabakiko du bere kriterioa kotuan hartuz, zein score balio hartu muga bezala sekuentzia bat transposoi kontsideratzeko edo ez.

 

Genetikari bat ez da soilik gene bilaketa soil batekin konformatuko. Nukleotido sekuentziak bere barnean informazio pila gordetzen duenez, agerian ez dagoen hori ikustarazteari horri ekin diogu.

 

Geneen deskribapenerako baliagarriena izan zaigun tresna Ensembl izenekoa da. Herraminta honek izugarrizko potentziala erakusten du. Gure contigetan geneak dauzkagula badakigu. Baina gene horiek proteina kodetzeko gai izango dira? hau da exoi guztiak edukiko ahal dituzte? polimorfismoak erakutsiko dituzte? Aspektu horiek argitzen Ensemblek lagunduko digu.

 

Hasteko exoien bilatzeari ekin genion. Intereseko genea filtratzeko aukera ematen duenez,  contigean dauzkagun geneak bilatu eta datu baseko genearen exoiak, cDNA edota proteinak zeintzuk diren aurki ditzakegu. Ondoren datu basean aurkituriko sekuentzia horiek gure sekuentziekin alderatu besterik ez da egin behar, adibidez blast bidez lerrokatuz. Modu honetan gure sekuentziaren aldakortasuna analiza dezakegu. Izan ere, Ensembl-ek ere data basetan deskribatuta dauden SNPak ikusteko aukera ematen digu, baita gure genearen ortologoak diren sekuentziak zein izan daitezken jakin ere, beraz, datu hauekin esan bezala gure sekuentziak data basearen sekuentziarekin dituen desberdintasunak ikusi eta ondorioak atera daitezke.

 

Ensembl-en bidez esan bezala, cDNA eta proteina sekuentziak lortu daitezke, baina sekuentzia horiek ez dira zertan gure contigean agertzen den genearen berdinak izan behar. Beraz, gure contigeko cDNA sekuentzia lortu ostean, cDNA hau proteinetara itzultzeko software bat erabiliko dugu. Gure kasuan fr33 deitzen den bat erabili dugu, zeinak DNA edo RNA sekuentzia FASTA formatoan sarturik proteinaren sekuentzia ematen duen.

 

Behin proteinaren sekuentzia dugularik, proteina horren ezaugarri asko Uniprot bezalako data basetan agertzen dira. Honetan, genearen funtzioa edota aminoazido bakoitzak betetzen duen funtzioa agertzen da eta beraz, polimorfismo kokapenak badakizkigu eta aminoazido aldaketa gertatzen bada, proteinak izango duen aldaketa ondoriozta daiteke.

 

Gainera, proteinaren sekuentziaren analisia egiteko, hau da, aminoazido bakoitzaren portzentajea zein den jakiteko web.expasy web orrialdea erabili genuen.

 

Contig batzuetan aurkitutako SNPak hobeto aztertzeko hasle batzuk diseinatu ziren. Hau manualki egin daitekeen arren, gure kasuan, primer3 softwarea erabili genuen.  Sekuentzia sarturik eta ikertu nahi den basea zein den adieraziz hasle bera bakarrik diseinatzen dizu.

 

Bukatzeko, sekuentzia promotorearen analisia ere egin da, genearen aurreko 500 nukleotidoak aztertuz. Azterketa hau egiteko BLAST bidez, data baseko sekuentzia promotorea eta contig bakoitzeko sekuentzia lerrokatu dira, aldakortasuna aztertzeko. Gainera, sekuentzia horretan lotuko diren transkripzio faktoreak zein izango diren jakiteko Algen promo web orrialdea erabili da.

Materiala eta Metodoak

© 2023 by Î©Î›Îœ. Proudly created with Wix.com

bottom of page