onnx-web/api/onnx_web/prompt/grammar.py

from typing import List, Union

from arpeggio import EOF, OneOrMore, PTNodeVisitor, RegExMatch


def token_delimiter():
    return ":"


def token():
    return RegExMatch(r"\w+")


def token_run():
    return OneOrMore(token)


def decimal():
    return RegExMatch(r"\d+\.\d*")


def token_inversion():
    return ("inversion", token_delimiter, token_run, token_delimiter, decimal)


def token_lora():
    return ("lora", token_delimiter, token_run, token_delimiter, decimal)


def token_inner():
    return [token_inversion, token_lora]


def phrase_inner():
    return [phrase, token_run]


def pos_phrase():
    return ("(", OneOrMore(phrase_inner), ")")


def neg_phrase():
    return ("[", OneOrMore(phrase_inner), "]")


def token_phrase():
    return ("<", OneOrMore(token_inner), ">")


def phrase():
    return [pos_phrase, neg_phrase, token_phrase, token_run]


def prompt():
    return OneOrMore(phrase), EOF


class PromptPhrase:
    def __init__(self, tokens: Union[List[str], str], weight: float = 1.0) -> None:
        self.tokens = tokens
        self.weight = weight

    def __repr__(self) -> str:
        return f"{self.tokens} * {self.weight}"

    def __eq__(self, other: object) -> bool:
        if isinstance(other, self.__class__):
            return other.tokens == self.tokens and other.weight == self.weight

        return False


class PromptToken:
    def __init__(self, token_type: str, token_name: str, *rest):
        self.token_type = token_type
        self.token_name = token_name
        self.rest = rest

    def __repr__(self) -> str:
        return f"<{self.token_type}:{self.token_name}:{self.rest}>"

    def __eq__(self, other: object) -> bool:
        if isinstance(other, self.__class__):
            return (
                other.token_type == self.token_type
                and other.token_name == self.token_name
                and other.rest == self.rest
            )

        return False


class OnnxPromptVisitor(PTNodeVisitor):
    def __init__(self, defaults=True, weight=0.5, **kwargs):
        super().__init__(defaults, **kwargs)

        self.neg_weight = weight
        self.pos_weight = 1.0 + weight

    def visit_decimal(self, node, children):
        return float(node.value)

    def visit_token(self, node, children):
        return str(node.value)

    def visit_token_inversion(self, node, children):
        return PromptToken("lora", children[0][0], children[1])

    def visit_token_lora(self, node, children):
        return PromptToken("lora", children[0][0], children[1])

    def visit_token_run(self, node, children):
        return children

    def visit_phrase_inner(self, node, children):
        if isinstance(children[0], PromptPhrase):
            return children[0]
        elif isinstance(children[0], PromptToken):
            return children[0]
        else:
            return PromptPhrase(children[0])

    def visit_pos_phrase(self, node, children):
        c = children[0]
        if isinstance(c, PromptPhrase):
            return PromptPhrase(c.tokens, c.weight * self.pos_weight)
        elif isinstance(c, str):
            return PromptPhrase(c, self.pos_weight)

    def visit_neg_phrase(self, node, children):
        c = children[0]
        if isinstance(c, PromptPhrase):
            return PromptPhrase(c.tokens, c.weight * self.neg_weight)
        elif isinstance(c, str):
            return PromptPhrase(c, self.neg_weight)

    def visit_phrase(self, node, children):
        return children[0]

    def visit_prompt(self, node, children):
        return children
feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`from typing import List, Union`

			`from arpeggio import EOF, OneOrMore, PTNodeVisitor, RegExMatch`


add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`def token_delimiter():`
			`return ":"`


feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`def token():`
			`return RegExMatch(r"\w+")`


			`def token_run():`
			`return OneOrMore(token)`


add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`def decimal():`
			`return RegExMatch(r"\d+\.\d*")`


			`def token_inversion():`
			`return ("inversion", token_delimiter, token_run, token_delimiter, decimal)`


			`def token_lora():`
			`return ("lora", token_delimiter, token_run, token_delimiter, decimal)`


			`def token_inner():`
			`return [token_inversion, token_lora]`


feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`def phrase_inner():`
			`return [phrase, token_run]`


			`def pos_phrase():`
			`return ("(", OneOrMore(phrase_inner), ")")`


			`def neg_phrase():`
			`return ("[", OneOrMore(phrase_inner), "]")`


add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`def token_phrase():`
			`return ("<", OneOrMore(token_inner), ">")`


feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`def phrase():`
add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`return [pos_phrase, neg_phrase, token_phrase, token_run]`
feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00

			`def prompt():`
			`return OneOrMore(phrase), EOF`


			`class PromptPhrase:`
			`def __init__(self, tokens: Union[List[str], str], weight: float = 1.0) -> None:`
			`self.tokens = tokens`
			`self.weight = weight`

			`def __repr__(self) -> str:`
			`return f"{self.tokens} * {self.weight}"`

			`def __eq__(self, other: object) -> bool:`
			`if isinstance(other, self.__class__):`
			`return other.tokens == self.tokens and other.weight == self.weight`

lint(api): type fixes and hints throughout 2023-07-04 15:20:28 +00:00			`return False`

feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00
add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`class PromptToken:`
			`def __init__(self, token_type: str, token_name: str, *rest):`
			`self.token_type = token_type`
			`self.token_name = token_name`
			`self.rest = rest`

			`def __repr__(self) -> str:`
			`return f"<{self.token_type}:{self.token_name}:{self.rest}>"`

			`def __eq__(self, other: object) -> bool:`
			`if isinstance(other, self.__class__):`
			`return (`
			`other.token_type == self.token_type`
			`and other.token_name == self.token_name`
			`and other.rest == self.rest`
			`)`

			`return False`


feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`class OnnxPromptVisitor(PTNodeVisitor):`
			`def __init__(self, defaults=True, weight=0.5, **kwargs):`
			`super().__init__(defaults, **kwargs)`

			`self.neg_weight = weight`
			`self.pos_weight = 1.0 + weight`

add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`def visit_decimal(self, node, children):`
			`return float(node.value)`

feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`def visit_token(self, node, children):`
			`return str(node.value)`

add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`def visit_token_inversion(self, node, children):`
			`return PromptToken("lora", children[0][0], children[1])`

			`def visit_token_lora(self, node, children):`
			`return PromptToken("lora", children[0][0], children[1])`

feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`def visit_token_run(self, node, children):`
			`return children`

			`def visit_phrase_inner(self, node, children):`
			`if isinstance(children[0], PromptPhrase):`
			`return children[0]`
add network tokens to experimental prompt parser 2024-01-14 02:54:59 +00:00			`elif isinstance(children[0], PromptToken):`
			`return children[0]`
feat(api): start adding support for multiple prompt parsers 2023-05-06 16:41:57 +00:00			`else:`
			`return PromptPhrase(children[0])`

			`def visit_pos_phrase(self, node, children):`
			`c = children[0]`
			`if isinstance(c, PromptPhrase):`
			`return PromptPhrase(c.tokens, c.weight * self.pos_weight)`
			`elif isinstance(c, str):`
			`return PromptPhrase(c, self.pos_weight)`

			`def visit_neg_phrase(self, node, children):`
			`c = children[0]`
			`if isinstance(c, PromptPhrase):`
			`return PromptPhrase(c.tokens, c.weight * self.neg_weight)`
			`elif isinstance(c, str):`
			`return PromptPhrase(c, self.neg_weight)`

			`def visit_phrase(self, node, children):`
			`return children[0]`

			`def visit_prompt(self, node, children):`
			`return children`