onnx-web/api/onnx_web/transformers.py

from logging import getLogger

from .params import ImageParams, Size
from .server import JobContext, ServerContext

logger = getLogger(__name__)


def run_txt2txt_pipeline(
    job: JobContext,
    _server: ServerContext,
    params: ImageParams,
    _size: Size,
    output: str,
) -> None:
    from transformers import AutoTokenizer, GPTJForCausalLM

    # tested with "EleutherAI/gpt-j-6B"
    model = "EleutherAI/gpt-j-6B"
    tokens = 1024

    device = job.get_device()

    model = GPTJForCausalLM.from_pretrained(model).to(device.torch_device())
    tokenizer = AutoTokenizer.from_pretrained(model)

    input_ids = tokenizer.encode(params.prompt, return_tensors="pt").to(
        device.torch_device()
    )
    output = model.generate(
        input_ids,
        do_sample=True,
        max_length=tokens,
        temperature=0.8,
    )
    result = tokenizer.decode(output[0], skip_special_tokens=True)

    print("Server says: %s" % result)

    logger.info("finished txt2txt job: %s", output)
feat(api): add txt2txt endpoint 2023-02-14 13:40:06 +00:00			`from logging import getLogger`

			`from .params import ImageParams, Size`
			`from .server import JobContext, ServerContext`

			`logger = getLogger(__name__)`


			`def run_txt2txt_pipeline(`
			`job: JobContext,`
			`_server: ServerContext,`
			`params: ImageParams,`
			`_size: Size,`
			`output: str,`
			`) -> None:`
			`from transformers import AutoTokenizer, GPTJForCausalLM`

			`# tested with "EleutherAI/gpt-j-6B"`
			`model = "EleutherAI/gpt-j-6B"`
			`tokens = 1024`

			`device = job.get_device()`

			`model = GPTJForCausalLM.from_pretrained(model).to(device.torch_device())`
			`tokenizer = AutoTokenizer.from_pretrained(model)`

			`input_ids = tokenizer.encode(params.prompt, return_tensors="pt").to(`
			`device.torch_device()`
			`)`
			`output = model.generate(`
			`input_ids,`
			`do_sample=True,`
			`max_length=tokens,`
			`temperature=0.8,`
			`)`
			`result = tokenizer.decode(output[0], skip_special_tokens=True)`

			`print("Server says: %s" % result)`

			`logger.info("finished txt2txt job: %s", output)`