blend LoRAs into existing model

2023-02-25 07:40:51 -06:00 · 2023-02-25 07:40:51 -06:00 · ce74183e97
parent f8658c88cd
commit ce74183e97
1 changed files with 80 additions and 0 deletions
--- a/api/onnx_web/convert/diffusion/lora.py
+++ b/api/onnx_web/convert/diffusion/lora.py
@ -3,6 +3,11 @@ from typing import List, Tuple

 from numpy import ndarray
 from onnx import ModelProto, TensorProto, helper, load, numpy_helper, save_model
+from sys import argv
+from safetensors import safe_open
+
+import torch
+import onnx.checker

 logger = getLogger(__name__)

@ -100,6 +105,81 @@ def convert_diffusion_lora(part: str):
    )


+def fix_key(key: str):
+    # lora_unet_up_blocks_3_attentions_2_transformer_blocks_0_attn2_to_out_0.lora_down.weight
+    # lora, unet, up_block.3.attentions.2.transformer_blocks.0.attn2.to_out.0
+    return key.replace(".", "_")
+
+
+def merge_lora():
+    base_name = argv[1]
+    lora_name = argv[2]
+
+    base_model = load(base_name)
+    lora_model = safe_open(lora_name, framework="pt")
+
+    lora_nodes = []
+    for base_node in base_model.graph.initializer:
+        base_key = fix_key(base_node.name)
+
+        for key in lora_model.keys():
+            if "lora_down" in key:
+                lora_key = key[:key.index("lora_down")].replace("lora_unet_", "")
+                if lora_key.startswith(base_key):
+                    print("down for key:", base_key, lora_key)
+
+                    up_key = key.replace("lora_down", "lora_up")
+                    alpha_key = key[:key.index("lora_down")] + 'alpha'
+
+                    down_weight = lora_model.get_tensor(key).to(dtype=torch.float32)
+                    up_weight = lora_model.get_tensor(up_key).to(dtype=torch.float32)
+
+                    dim = down_weight.size()[0]
+                    alpha = lora_model.get(alpha_key).numpy() or dim
+                    scale = alpha / dim
+
+                    np_vals = numpy_helper.to_array(base_node)
+                    print(np_vals.shape, up_weight.shape, down_weight.shape)
+
+                    squoze = (up_weight.squeeze(3).squeeze(2) @ down_weight.squeeze(3).squeeze(2)).unsqueeze(2).unsqueeze(3)
+                    print(squoze.shape)
+
+                    np_vals = np_vals + (alpha * squoze.numpy())
+
+                    try:
+                        if len(up_weight.size()) == 2:
+                            squoze = (up_weight @ down_weight)
+                            print(squoze.shape)
+                            np_vals = np_vals + (squoze.numpy() * (alpha / dim))
+                        else:
+                            squoze = (up_weight.squeeze(3).squeeze(2) @ down_weight.squeeze(3).squeeze(2)).unsqueeze(2).unsqueeze(3)
+                            print(squoze.shape)
+                            np_vals = np_vals + (alpha * squoze.numpy())
+
+                        # retensor = numpy_helper.from_array(np_vals, base_node.name)
+                        retensor = helper.make_tensor(base_node.name, base_node.data_type, base_node.dim, np_vals, raw=True)
+                        print(retensor)
+
+                        # TypeError: does not support assignment
+                        lora_nodes.append(retensor)
+
+                        break
+                    except Exception as e:
+                        print(e)
+
+
+        if retensor is None:
+            print("no lora found for key", base_key)
+            lora_nodes.append(base_node)
+
+    print(len(lora_nodes), len(base_model.graph.initializer))
+    del base_model.graph.initializer[:]
+    base_model.graph.initializer.extend(lora_nodes)
+
+    onnx.checker.check_model(base_model)
+
+
+
 if __name__ == "__main__":
    convert_diffusion_lora("unet")
    convert_diffusion_lora("text_encoder")