Skip to content

mnwrdmr/my_bioinformatics_project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Biyoinformatik İş Akış Şemam

Merhaba, bu depo içerisinde Miuul Biyoinformatik Bootcamp programı için hazırladığım bitirme projemin kodları yer almaktadır. Şimdi gelin size biraz neler yaptığımdan bahsedeyim;

Bitirme projem kapsamında biyoremediasyonda aktif olarak rol oynayan 3 bakteri türünün genom ve proteomlarını incelemek istedim.Seçtiğim bakteri türleri ve yapay zeka kullanarak oluşturduğum bu miniklerin görselleri;

  1. Bacillus subtilis: Organik maddelerin parçalanması ve sindirilmesinde önemli rol oynar.
  2. Deinococcus radiodurans: Aşırı radyasyona dayanabilme özelliği sayesinde radyasyon temizliğinde uzmanlaşmıştır.
  3. Rhodococcus erythropolis: Özellikle petrol hidrokarbonlarının parçalanması ve metabolizasyonunda uzmanlaşmıştır.
Screenshot 2024-02-26 at 14 14 14

Bu depo içerisinde;

  1. Veri yönetimi ve kullanılan yazılımların iş akışı için; Snakemake boru hatlarına (Snakefile dosyasından) ve bağlı olduğu env/env.yaml klasöründen ulaşabilirsiniz.
  2. 'data' klasörü; 3 bakteri türü için, genom ve proteom projesinde kullanılacak olan protein_aa.fasta ve nükleotid.fasta verilerini içermektedir.
  3. 'output' klasörü içerisinde 3 bakteri türü için; a) 'barrnap' klasörü içerisinde barrnap yazılımının rRNA sayımı çıktıları, b) 'Orthofinder' klasörü içerisinde orthofinder yazılımının çıktıları, c) 'directory_with_processed_fasta_and_blast_results' klasörü içerisinde orthofinder yazılımına ait Orthologues istatistikleri; one-to-one, one-to-many, many-to-one ve many-to-many.tsv gibi bir çok istatistiksel sonucu içeren bilgilere, d) 'RepeatModeler_output' klasörü içeriside RepeatModeler yazılımının çıktılarına, e) 'RepeatMasker_output' klasörü içeriside RepeatMasker yazılımının çıktılarına, f) 'plot' klasörü içerisinde yazılımlarının sonnuçları dahilinde görselleştirilen plotlara ulaşabilirsiniz.

Genom Projesi Ödevi İçin;

  1. Öncelikle 'barrnap' yazılımı kullanılarak bakteri türlerinin rRNA sayımını gerçekleştirildi ve daha sonra sonuçlar görselleştirilerek 'Scatter Plot' oluşturuldu (https://github.com/mnwrdmr/my_bioinformatics_project/blob/main/scripts/2_DataAnalysis/barrnap_analysis.py).
  2. Tekrarlı bölgeler için RepeatModeler ve RepeatMasker yazılımları kullanıldı ve sonuçlar ile 'PieChart' oluşturuldu.
  3. Planlanan StainedGlass yazılımı için bütün gereklilikler yerine getirildi fakat çeşitli python uyuşmazlıkları ve hatalarından dolayı çıktı alınamadı.
Screenshot 2024-02-27 at 02 09 45

Proteom Projesi Ödevi İçin;

  1. Ortak gen kümeleri incelenmek istenildiği için 'Orthofinder' yazılımı kullanılarak çıktıları alındı.
  2. Orthofinder yazılımı sonucunda çıkan istatistiksel çıktılar ile; a) Her bakteri türü için Species-Specific ve Conversed çıktıları doğrultusunda 'BarPlot' oluşturuldu(https://github.com/mnwrdmr/my_bioinformatics_project/blob/main/scripts/2_DataAnalysis/Orthogroups_analysis_plots.py). b) Bacillus subtilis ile diğer 2 bakteri türünün Pairwise Orthologue Comparisons çıktıları; one-to-one, one-to-many, many-to-one ve many-to-many karşılaştırılarak 'Stacked Bar Plot' oluşturuldu.
Screenshot 2024-02-26 at 15 58 43

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages