cwiczenia

1. Logowanie się na stronie https://usegalaxy.org.  


2. Importowanie historii zawierającej pliki FASTQ analizowanych próbek oraz plik BED z "celowanymi" lokalizacjami genów https://usegalaxy.org/u/mswierniak/h/cwiczeniapato-1  


3. Analiza jakości jednego z plików FASTQ przy użyciu programu FASTQC. 

4. Mapowanie analizowanych próbek przy użyciu BWA-MEM na referencyjny genom ludzki hg19. Dla każdej próbki należy ustawić "read groups (Picard style)" używając wspólnego ID (ngs) i unikalnej nazwy próbki (kid/mum/dad). Znacznik LB (nazwa biblioteki) ustawić jako nadawany automatycznie. Dla pozostałych parametrów pozostawić ustawienia domyślne.

UWAGA: MAPOWANIE NALEŻY WYKONAĆ 3 RAZY - DLA KAŻDEJ PRÓBKI (KID, MUM, DAD) ODDZIELNIE!

5. Usuwanie duplikatów w uzyskanych plikach BAM.

UWAGA: TEN PUNKT MOŻNA WYKONAĆ DLA WSZYSTKICH PRÓBEK JEDNOCZEŚNIE (TRZEBA JE ZAZNACZYĆ W OKIENKU).

6. Łączenie 3 analizowanych pliki BAM (z usuniętymi duplikatami) w jeden plik. 

 

7. Analiza wariantów z użyciem algorytmu FreeBayes. 

8. Filtrowanie pliku VCF (-f "QUAL > 1 & QUAL / AO > 10 & SAF > 0 & SAR > 0 & RPR > 1 & RPL > 1")


 


9. Adnotacja funkcjonalna przy użyciu wANNOVAR http://wannovar.usc.edu/

(plik wynikowy dostępny pod adresem http://wannovar.usc.edu/done/43332/HByZID77TfNMspGd/index.html)