onnx-web/api/onnx_web/diffusers/patches/unet.py

from logging import getLogger
from typing import Dict, List, Optional, Union

import numpy as np
from diffusers import OnnxRuntimeModel
from diffusers.pipelines.onnx_utils import ORT_TO_NP_TYPE
from optimum.onnxruntime.modeling_diffusion import ORTModelUnet

from ...server import ServerContext

logger = getLogger(__name__)


class UNetWrapper(object):
    input_types: Optional[Dict[str, np.dtype]] = None
    prompt_embeds: Optional[List[np.ndarray]] = None
    prompt_index: int = 0
    sample_dtype: np.dtype
    server: ServerContext
    timestep_dtype: np.dtype
    wrapped: Union[OnnxRuntimeModel, ORTModelUnet]
    xl: bool

    def __init__(
        self,
        server: ServerContext,
        wrapped: Union[OnnxRuntimeModel, ORTModelUnet],
        xl: bool,
        sample_dtype: Optional[np.dtype] = None,
        timestep_dtype: np.dtype = np.int64,
    ):
        self.server = server
        self.wrapped = wrapped
        self.xl = xl
        self.sample_dtype = sample_dtype or server.torch_dtype
        self.timestep_dtype = timestep_dtype

        self.cache_input_types()

    def __call__(
        self,
        sample: Optional[np.ndarray] = None,
        timestep: Optional[np.ndarray] = None,
        encoder_hidden_states: Optional[np.ndarray] = None,
        **kwargs,
    ):
        logger.trace(
            "UNet parameter types: %s, %s, %s",
            sample.dtype,
            timestep.dtype,
            encoder_hidden_states.dtype,
        )

        if self.prompt_embeds is not None:
            step_index = self.prompt_index % len(self.prompt_embeds)
            logger.trace("multiple prompt embeds found, using step: %s", step_index)
            encoder_hidden_states = self.prompt_embeds[step_index]
            self.prompt_index += 1

        if self.input_types is None:
            self.cache_input_types()

        encoder_hidden_states_input_dtype = self.input_types.get(
            "encoder_hidden_states", self.sample_dtype
        )
        if encoder_hidden_states.dtype != encoder_hidden_states_input_dtype:
            logger.debug(
                "converting UNet hidden states to input dtype from %s to %s",
                encoder_hidden_states.dtype,
                encoder_hidden_states_input_dtype,
            )
            encoder_hidden_states = encoder_hidden_states.astype(
                encoder_hidden_states_input_dtype
            )

        sample_input_dtype = self.input_types.get("sample", self.sample_dtype)
        if sample.dtype != sample_input_dtype:
            logger.debug(
                "converting UNet sample to input dtype from %s to %s",
                sample.dtype,
                sample_input_dtype,
            )
            sample = sample.astype(sample_input_dtype)

        timestep_input_dtype = self.input_types.get("timestep", self.timestep_dtype)
        if timestep.dtype != timestep_input_dtype:
            logger.debug(
                "converting UNet timestep to input dtype from %s to %s",
                timestep.dtype,
                timestep_input_dtype,
            )
            timestep = timestep.astype(timestep_input_dtype)

        return self.wrapped(
            sample=sample,
            timestep=timestep,
            encoder_hidden_states=encoder_hidden_states,
            **kwargs,
        )

    def __getattr__(self, attr):
        return getattr(self.wrapped, attr)

    def cache_input_types(self):
        if isinstance(self.wrapped, ORTModelUnet):
            session = self.wrapped.session
        elif isinstance(self.wrapped, OnnxRuntimeModel):
            session = self.wrapped.model
        else:
            raise ValueError("unknown UNet class")

        inputs = session.get_inputs()
        self.input_types = dict(
            [(input.name, ORT_TO_NP_TYPE[input.type]) for input in inputs]
        )
        logger.debug("cached UNet input types: %s", self.input_types)

    def set_prompts(self, prompt_embeds: List[np.ndarray]):
        logger.debug(
            "setting prompt embeds for UNet: %s", [p.shape for p in prompt_embeds]
        )
        self.prompt_embeds = prompt_embeds
        self.prompt_index = 0
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`from logging import getLogger`
handle XL UNets 2023-12-25 04:36:39 +00:00			`from typing import Dict, List, Optional, Union`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00
apply lint 2023-04-28 18:56:36 +00:00			`import numpy as np`
			`from diffusers import OnnxRuntimeModel`
use right type mapping 2023-12-25 04:46:22 +00:00			`from diffusers.pipelines.onnx_utils import ORT_TO_NP_TYPE`
handle XL UNets 2023-12-25 04:36:39 +00:00			`from optimum.onnxruntime.modeling_diffusion import ORTModelUnet`
apply lint 2023-04-28 18:56:36 +00:00
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`from ...server import ServerContext`

			`logger = getLogger(__name__)`


			`class UNetWrapper(object):`
feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`input_types: Optional[Dict[str, np.dtype]] = None`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`prompt_embeds: Optional[List[np.ndarray]] = None`
			`prompt_index: int = 0`
add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`sample_dtype: np.dtype`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`server: ServerContext`
add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`timestep_dtype: np.dtype`
handle XL UNets 2023-12-25 04:36:39 +00:00			`wrapped: Union[OnnxRuntimeModel, ORTModelUnet]`
fix(api): enable Unet patch for SDXL 2023-09-21 00:28:34 +00:00			`xl: bool`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00
			`def __init__(`
			`self,`
			`server: ServerContext,`
handle XL UNets 2023-12-25 04:36:39 +00:00			`wrapped: Union[OnnxRuntimeModel, ORTModelUnet],`
fix(api): enable Unet patch for SDXL 2023-09-21 00:28:34 +00:00			`xl: bool,`
add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`sample_dtype: Optional[np.dtype] = None,`
			`timestep_dtype: np.dtype = np.int64,`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`):`
			`self.server = server`
			`self.wrapped = wrapped`
fix(api): enable Unet patch for SDXL 2023-09-21 00:28:34 +00:00			`self.xl = xl`
add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`self.sample_dtype = sample_dtype or server.torch_dtype`
			`self.timestep_dtype = timestep_dtype`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00
feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`self.cache_input_types()`

feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`def __call__(`
			`self,`
lint and test fixes 2023-12-03 18:53:50 +00:00			`sample: Optional[np.ndarray] = None,`
			`timestep: Optional[np.ndarray] = None,`
			`encoder_hidden_states: Optional[np.ndarray] = None,`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`**kwargs,`
			`):`
			`logger.trace(`
			`"UNet parameter types: %s, %s, %s",`
			`sample.dtype,`
			`timestep.dtype,`
			`encoder_hidden_states.dtype,`
			`)`

			`if self.prompt_embeds is not None:`
			`step_index = self.prompt_index % len(self.prompt_embeds)`
			`logger.trace("multiple prompt embeds found, using step: %s", step_index)`
			`encoder_hidden_states = self.prompt_embeds[step_index]`
			`self.prompt_index += 1`

feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`if self.input_types is None:`
			`self.cache_input_types()`

add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`encoder_hidden_states_input_dtype = self.input_types.get(`
			`"encoder_hidden_states", self.sample_dtype`
			`)`
			`if encoder_hidden_states.dtype != encoder_hidden_states_input_dtype:`
			`logger.debug(`
			`"converting UNet hidden states to input dtype from %s to %s",`
			`encoder_hidden_states.dtype,`
			`encoder_hidden_states_input_dtype,`
			`)`
feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`encoder_hidden_states = encoder_hidden_states.astype(`
add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`encoder_hidden_states_input_dtype`
feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`)`

add fallback dtypes to unet patch 2023-12-25 04:57:02 +00:00			`sample_input_dtype = self.input_types.get("sample", self.sample_dtype)`
			`if sample.dtype != sample_input_dtype:`
			`logger.debug(`
			`"converting UNet sample to input dtype from %s to %s",`
			`sample.dtype,`
			`sample_input_dtype,`
			`)`
			`sample = sample.astype(sample_input_dtype)`

			`timestep_input_dtype = self.input_types.get("timestep", self.timestep_dtype)`
			`if timestep.dtype != timestep_input_dtype:`
			`logger.debug(`
			`"converting UNet timestep to input dtype from %s to %s",`
			`timestep.dtype,`
			`timestep_input_dtype,`
			`)`
			`timestep = timestep.astype(timestep_input_dtype)`
feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00
			`return self.wrapped(`
			`sample=sample,`
			`timestep=timestep,`
			`encoder_hidden_states=encoder_hidden_states,`
			`**kwargs,`
			`)`

			`def __getattr__(self, attr):`
			`return getattr(self.wrapped, attr)`

feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`def cache_input_types(self):`
handle XL UNets 2023-12-25 04:36:39 +00:00			`if isinstance(self.wrapped, ORTModelUnet):`
			`session = self.wrapped.session`
			`elif isinstance(self.wrapped, OnnxRuntimeModel):`
			`session = self.wrapped.model`
			`else:`
add message to unet type error 2023-12-25 05:10:08 +00:00			`raise ValueError("unknown UNet class")`
handle XL UNets 2023-12-25 04:36:39 +00:00
			`inputs = session.get_inputs()`
use right type mapping 2023-12-25 04:46:22 +00:00			`self.input_types = dict(`
			`[(input.name, ORT_TO_NP_TYPE[input.type]) for input in inputs]`
			`)`
feat(api): use wrapped model's input types in UNet patch 2023-12-25 04:21:52 +00:00			`logger.debug("cached UNet input types: %s", self.input_types)`

feat(api): add tiled VAE wrapper 2023-04-28 03:50:11 +00:00			`def set_prompts(self, prompt_embeds: List[np.ndarray]):`
			`logger.debug(`
			`"setting prompt embeds for UNet: %s", [p.shape for p in prompt_embeds]`
			`)`
			`self.prompt_embeds = prompt_embeds`
			`self.prompt_index = 0`