Merhaba, bu depo içerisinde Miuul Biyoinformatik Bootcamp programı için hazırladığım bitirme projemin kodları yer almaktadır. Şimdi gelin size biraz neler yaptığımdan bahsedeyim;
Bitirme projem kapsamında biyoremediasyonda aktif olarak rol oynayan 3 bakteri türünün genom ve proteomlarını incelemek istedim.Seçtiğim bakteri türleri ve yapay zeka kullanarak oluşturduğum bu miniklerin görselleri;
- Bacillus subtilis: Organik maddelerin parçalanması ve sindirilmesinde önemli rol oynar.
- Deinococcus radiodurans: Aşırı radyasyona dayanabilme özelliği sayesinde radyasyon temizliğinde uzmanlaşmıştır.
- Rhodococcus erythropolis: Özellikle petrol hidrokarbonlarının parçalanması ve metabolizasyonunda uzmanlaşmıştır.
Bu depo içerisinde;
- Veri yönetimi ve kullanılan yazılımların iş akışı için; Snakemake boru hatlarına (Snakefile dosyasından) ve bağlı olduğu env/env.yaml klasöründen ulaşabilirsiniz.
- 'data' klasörü; 3 bakteri türü için, genom ve proteom projesinde kullanılacak olan protein_aa.fasta ve nükleotid.fasta verilerini içermektedir.
- 'output' klasörü içerisinde 3 bakteri türü için; a) 'barrnap' klasörü içerisinde barrnap yazılımının rRNA sayımı çıktıları, b) 'Orthofinder' klasörü içerisinde orthofinder yazılımının çıktıları, c) 'directory_with_processed_fasta_and_blast_results' klasörü içerisinde orthofinder yazılımına ait Orthologues istatistikleri; one-to-one, one-to-many, many-to-one ve many-to-many.tsv gibi bir çok istatistiksel sonucu içeren bilgilere, d) 'RepeatModeler_output' klasörü içeriside RepeatModeler yazılımının çıktılarına, e) 'RepeatMasker_output' klasörü içeriside RepeatMasker yazılımının çıktılarına, f) 'plot' klasörü içerisinde yazılımlarının sonnuçları dahilinde görselleştirilen plotlara ulaşabilirsiniz.
Genom Projesi Ödevi İçin;
- Öncelikle 'barrnap' yazılımı kullanılarak bakteri türlerinin rRNA sayımını gerçekleştirildi ve daha sonra sonuçlar görselleştirilerek 'Scatter Plot' oluşturuldu (https://github.com/mnwrdmr/my_bioinformatics_project/blob/main/scripts/2_DataAnalysis/barrnap_analysis.py).
- Tekrarlı bölgeler için RepeatModeler ve RepeatMasker yazılımları kullanıldı ve sonuçlar ile 'PieChart' oluşturuldu.
- Planlanan StainedGlass yazılımı için bütün gereklilikler yerine getirildi fakat çeşitli python uyuşmazlıkları ve hatalarından dolayı çıktı alınamadı.
Proteom Projesi Ödevi İçin;
- Ortak gen kümeleri incelenmek istenildiği için 'Orthofinder' yazılımı kullanılarak çıktıları alındı.
- Orthofinder yazılımı sonucunda çıkan istatistiksel çıktılar ile; a) Her bakteri türü için Species-Specific ve Conversed çıktıları doğrultusunda 'BarPlot' oluşturuldu(https://github.com/mnwrdmr/my_bioinformatics_project/blob/main/scripts/2_DataAnalysis/Orthogroups_analysis_plots.py). b) Bacillus subtilis ile diğer 2 bakteri türünün Pairwise Orthologue Comparisons çıktıları; one-to-one, one-to-many, many-to-one ve many-to-many karşılaştırılarak 'Stacked Bar Plot' oluşturuldu.