Cannabis-Analysis

Subject

Cannabis strains exist for a long time. The goal is to develop a Machine Learning model that can predict whether a strain is of Hybrid, Indica or Sativa type.

Data Acquisition

Crawling is used to get the data.

Leafly - https://www.leafly.com/
Strain Of Weed - https://www.strainofweed.com/

Data Arrangement

Once the data was acquired, we coverted nested dictionaries to columns.

Data Cleaning

After reviewing the data, it was found some of the data was faulty

Missing data
Data type was wrong (float instead of integer)

To complete missing values for ['Feelings', 'Flavors'] - For each column of 'Feeling'/'Flavor' - found the most frequent feeling for each strain that is a "sibling" or "parent".

To complete missing values for ['Cannbinoids'] - For each column of 'Cannbinoids' - got the mean value for each strain that is a "sibling" or "parent".

Data Visualisation

Visualisation technics such as scatter plot, bar plot and pie plot were used

Machine Learning

Predict strain type
Predict strain type without data of "Hybrid" strains

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
CSVs		CSVs
.gitignore		.gitignore
Cannabis Analysis.pptx		Cannabis Analysis.pptx
Crawler.ipynb		Crawler.ipynb
DataCleaning.ipynb		DataCleaning.ipynb
EDA.ipynb		EDA.ipynb
MachineLearning.ipynb		MachineLearning.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cannabis-Analysis

Subject

Data Acquisition

Data Arrangement

Data Cleaning

Data Visualisation

Machine Learning

About

Releases

Packages

Languages

DanielOfir/Cannabis-Analysis

Folders and files

Latest commit

History

Repository files navigation

Cannabis-Analysis

Subject

Data Acquisition

Data Arrangement

Data Cleaning

Data Visualisation

Machine Learning

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages