В репозитории приведены примеры использования платформы ML Space от начального до продвинутого уровня для решения ML-задач.
Базовые примеры размещены в директории quick-start. Они иллюстрируют, как обучить модель:
-
Напрямую из Jupyter Server, подключенного к GPU
-
В регионе с помощью
client-lib
Дополнительные примеры обучения моделей под разные задачи:
- pytorch-example — задача распределенного обучения Pytorch-модели с двумя типами запуска: стандартный
horovod
и дополнительныйpytorch
, он жеPytorch.Distributed
. - hugging-face-llm-example — работа с языковой моделью методами LoRA и PEFT, а также распределенное обучение с PyTorch Distributed Data Parallel (DDP).
- lightning-example — использование PyTorch и PyTorch Lightning для задачи классификации изображений.
- pytorch-elastic-example — обучение модели на PyTorch и Elastic Learning с сохранением контрольных точек обучения (чекпоинтов).
- Загрузка/выгрузка данных на S3 в базовых примерах quickstart.
- Работа с Rapids — библиотекой, ускоряющей обработку датасетов на GPU.
- В ноутбуке
Spark_preproc.ipynb
поясняется, как c использованием ресурсов кластера Spark создать SparkSession и SparkContext, загрузить данные на S3 и выполнить препроцессинг этих данных.
В ноутбуке public-api-example содержатся примеры того, как взаимодействовать с публичным API v2.