Skip to content

Commit

Permalink
důkladnější scrawling filmů, přehlednější řazení sešitů
Browse files Browse the repository at this point in the history
  • Loading branch information
michalkasparek committed Apr 20, 2023
1 parent ef16e3d commit 7028004
Show file tree
Hide file tree
Showing 19 changed files with 165 additions and 33 deletions.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.

Large diffs are not rendered by default.

File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
2 changes: 1 addition & 1 deletion README.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,5 @@
Scraping a analýza dat o 125 letech českého filmu pro články na serveru iROZHLAS.cz.

Výsledky by mělo jít reprodukovat spuštěním notebooků v číselném pořadí, pajplajna jede od scrapování přes čištění po exploraci a analýzu. S ohledem na servery _Filmového přehledu_ však radím to takto nedělat. Doporučený postup: ručně rozbalit ZIPy ve složce a začít až notebooky s explorací.
Výsledky by mělo jít reprodukovat spuštěním notebooků v číselném pořadí, pajplajna jede od scrapování přes čištění po exploraci a analýzu. S ohledem na servery _Filmového přehledu_ však radím to takto nedělat. Doporučený postup: ručně rozbalit ZIPy ve složce a začít až notebooky s explorací od čísla 100 výš.

Data pocházejí z _[Filmového přehledu](https://filmovyprehled.cz/)_, autoritativní databáze spravované Národním filmovým archivem.

0 comments on commit 7028004

Please sign in to comment.