Release: 0.1.0

BobaZooba · Nov 15, 2023 · 88b26b2 · 88b26b2
1 parent 3e07291
commit 88b26b2
Show file tree

Hide file tree

Showing 8 changed files with 16,115 additions and 16,102 deletions.
diff --git a/README.md b/README.md
@@ -90,7 +90,17 @@ from xllm.datasets import GeneralDataset
 from xllm.experiments import Experiment
 
 # Init Config which controls the internal logic of xllm
-config = Config(model_name_or_path="HuggingFaceH4/zephyr-7b-beta")
+# QLoRA example
+config = Config(
+  model_name_or_path="HuggingFaceH4/zephyr-7b-beta",
+  stabilize=True,
+  apply_lora=True,
+  load_in_4bit=True,
+  push_to_hub=True,
+  hub_private_repo=True,
+  hub_model_id="BobaZooba/SupaDupaZephyr-7B-LoRA",
+  save_steps=1_000,
+)
 
 # Prepare the data
 train_data = ["Hello!"] * 100

diff --git a/..._AI_efficient_fine_tuning_using_QLoRA,_bnb_int4,_gradient_checkpointing_and_X—LLM_🦖.ipynb b/..._AI_efficient_fine_tuning_using_QLoRA,_bnb_int4,_gradient_checkpointing_and_X—LLM_🦖.ipynb
diff --git a/examples/notebooks/🦖_X—LLM_Prototyping.ipynb b/examples/notebooks/🦖_X—LLM_Prototyping.ipynb
diff --git a/setup.py b/setup.py
@@ -62,7 +62,7 @@
 # Setup
 setup(
     name="xllm",
-    version="0.0.10",
+    version="0.1.0",
     description="Simple & Cutting Edge LLM Finetuning",
     license_files=["LICENSE"],
     long_description=open("README.md", "r", encoding="utf-8").read(),

diff --git a/src/xllm/__init__.py b/src/xllm/__init__.py
@@ -14,7 +14,7 @@
 
 # ruff: noqa: F401
 
-__version__ = "0.0.10"
+__version__ = "0.1.0"
 
 from . import enums, types
 from .cli.fuse import cli_run_fuse

diff --git a/src/xllm/core/config.py b/src/xllm/core/config.py
@@ -344,8 +344,8 @@ class Config:
             "help": "Device map for loading the model",
         },
     )
-    prepare_model_for_kbit_training: bool = field(
-        default=True,
+    prepare_model_for_kbit_training: Optional[bool] = field(
+        default=None,
         metadata={
             "help": "Prepare or not for kbit training",
         },
@@ -1069,3 +1069,10 @@ def lora_model_name_or_path_for_fusing(self) -> str:
             return self.lora_model_local_path
         else:
             raise ValueError("Please set lora_hub_model_id or lora_model_local_path for fusing")
+
+    @property
+    def need_to_prepare_model_for_kbit_training(self) -> bool:
+        if self.prepare_model_for_kbit_training is not None:
+            return self.prepare_model_for_kbit_training
+        else:
+            return self.from_gptq or self.load_in_4bit or self.load_in_8bit
diff --git a/src/xllm/core/dependencies.py b/src/xllm/core/dependencies.py
@@ -453,7 +453,7 @@ def build_model(
     )
     model.config.pretraining_tp = 1
 
-    if quantization_config is not None and config.prepare_model_for_kbit_training:
+    if quantization_config is not None and config.need_to_prepare_model_for_kbit_training:
         model = prepare_model_for_kbit_training(
             model=model, use_gradient_checkpointing=config.use_gradient_checkpointing
         )

diff --git a/src/xllm/experiments/base.py b/src/xllm/experiments/base.py
@@ -456,7 +456,7 @@ def bnb_quantization(self) -> None:
         )
         self.model.is_loaded_in_4bit = self.config.load_in_4bit
         self.model.is_loaded_in_8bit = self.config.load_in_8bit
-        if self.config.prepare_model_for_kbit_training:
+        if self.config.need_to_prepare_model_for_kbit_training:
             self.model = prepare_model_for_kbit_training(
                 model=self.model, use_gradient_checkpointing=self.config.use_gradient_checkpointing
             )