Undetected Chrome Scraper!

Scalable web scraper bypassing bot-blockers without using paid proxy IPs. (Chrome runs headless, the demo shows chrome instance for demonstration purpose)

Sample data of crawling 5000+ URLs from 18 domains spread over 8 countries for 30 days

Features

Crawl data from both Desktop and Mobile as a channel
Scale up the speed by increasing the number of chrome instances to run in parallel
Deployable on virtual machines - EC2, Digital Ocean Droplet, Google Compute Engine etc
Saves screenshots of webpages
Support to translate the webpage to a particular language
Support for providing a configuration file to parse data from the webpages

Name		Name	Last commit message	Last commit date
Latest commit History 235 Commits
Snowflake		Snowflake
chrome		chrome
masters		masters
page_all_urls		page_all_urls
page_urls		page_urls
pdp_urls/United Kingdom		pdp_urls/United Kingdom
retailer_config		retailer_config
src		src
.gitignore		.gitignore
Demo.gif		Demo.gif
Dockerfile		Dockerfile
README.md		README.md
brand_dictionary.csv		brand_dictionary.csv
notes.txt		notes.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Undetected Chrome Scraper!

Features

About

Releases

Packages

Languages

bhargav-sarvaria/Crawling-UndetectedChrome

Folders and files

Latest commit

History

Repository files navigation

Undetected Chrome Scraper!

Features

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages