Парсинг данных с сайта https://fantlab.ru/
Было собрано 9344 книг и 272 признака, таким как жанровая принадлежность, средняя оценка, количество оценок, способ введения повествования и.т.д. Так же было собрано 108 тыс. оценок пользователей различным произведениям.
Датасеты выложены на kaggle.
Сбор производился, так как в открытом доступе можно найти максимум 1-2 признака книги и в лучшем случае среди них будет жанр.