update model server features from langchain-chatchat

2023-12-15 17:58:49 +08:00 · 2023-12-15 17:58:49 +08:00 · e9b40ee51c
commit e9b40ee51c
parent 2be6ffe4e0
6 changed files with 961 additions and 186 deletions
--- a/configs/model_config.py.example
+++ b/configs/model_config.py.example
@ -51,6 +51,17 @@ EMBEDDING_MODEL = "text2vec-base"
 # Embedding 模型运行设备
 EMBEDDING_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"

+ONLINE_LLM_MODEL = {
+    # 线上模型。请在server_config中为每个在线API设置不同的端口
+
+    "openai-api": {
+        "model_name": "gpt-3.5-turbo",
+        "api_base_url": "https://api.openai.com/v1",
+        "api_key": "",
+        "openai_proxy": "",
+    },
+}
+

 llm_model_dict = {
    "chatglm-6b": {
@ -123,6 +134,7 @@ llm_model_dict = llm_model_dict_c

 # LLM 名称
 LLM_MODEL = "gpt-3.5-turbo"
+LLM_MODELs = ["chatglm2-6b"]
 USE_FASTCHAT = "gpt" not in LLM_MODEL # 判断是否进行fastchat

 # LLM 运行设备
--- a/configs/server_config.py.example
+++ b/configs/server_config.py.example
@ -76,7 +76,7 @@ SANDBOX_SERVER = {
 # 这些模型必须是在model_config.llm_model_dict中正确配置的。
 # 在启动startup.py时，可用通过`--model-worker --model-name xxxx`指定模型，不指定则为LLM_MODEL
 FSCHAT_MODEL_WORKERS = {
-    LLM_MODEL: {
+    "default": {
        "host": DEFAULT_BIND_HOST,
        "port": 20002,
        "device": LLM_DEVICE,
@ -100,8 +100,13 @@ FSCHAT_MODEL_WORKERS = {
        # "stream_interval": 2,
        # "no_register": False,
    },
+    "chatglm2-6b": {
+        "port": 20003
+    },
+    "baichuan2-7b-base": {
+        "port": 20004
+    }
 }
-
 # fastchat multi model worker server
 FSCHAT_MULTI_MODEL_WORKERS = {
    # todo
--- a/dev_opsgpt/service/llm_api.py
+++ b/dev_opsgpt/service/llm_api.py
--- a/dev_opsgpt/service/llm_api.py.bak
+++ b/dev_opsgpt/service/llm_api.py.bak
--- a/examples/agent_examples/codeChatXX_examply.py
+++ b/examples/agent_examples/codeChatXX_examply.py
@ -0,0 +1,59 @@
+import os, sys, requests
+
+src_dir = os.path.join(
+    os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
+)
+sys.path.append(src_dir)
+
+from dev_opsgpt.tools import (
+    toLangchainTools, get_tool_schema, DDGSTool, DocRetrieval,
+    TOOL_DICT, TOOL_SETS
+    )
+
+from configs.model_config import *
+from dev_opsgpt.connector.phase import BasePhase
+from dev_opsgpt.connector.agents import BaseAgent
+from dev_opsgpt.connector.chains import BaseChain
+from dev_opsgpt.connector.schema import (
+    Message, Memory, load_role_configs, load_phase_configs, load_chain_configs
+    )
+from dev_opsgpt.connector.configs import AGETN_CONFIGS, CHAIN_CONFIGS, PHASE_CONFIGS
+import importlib
+
+tools = toLangchainTools([TOOL_DICT[i] for i in TOOL_SETS if i in TOOL_DICT])
+
+
+role_configs = load_role_configs(AGETN_CONFIGS)
+chain_configs = load_chain_configs(CHAIN_CONFIGS)
+phase_configs = load_phase_configs(PHASE_CONFIGS)
+
+agent_module = importlib.import_module("dev_opsgpt.connector.agents")
+
+
+phase_name = "codeChatPhase"
+phase = BasePhase(phase_name,
+            task = None,
+            phase_config = PHASE_CONFIGS,
+            chain_config = CHAIN_CONFIGS,
+            role_config = AGETN_CONFIGS,
+            do_summary=False,
+            do_code_retrieval=True,
+            do_doc_retrieval=False,
+            do_search=False,
+            )
+
+# 代码一共有多少类 => 基于cypher
+# 代码库里有哪些函数，返回5个就行 => 基于cypher
+# remove 这个函数是做什么的  => 基于标签
+# 有没有函数已经实现了从字符串删除指定字符串的功能，使用的话可以怎么使用，写个java代码  => 基于描述
+# 有根据我以下的需求用 java 开发一个方法：输入为字符串，将输入中的 .java 字符串给删除掉，然后返回新的字符串 => 基于描述
+
+# round-1
+query_content = "代码一共有多少类"
+query = Message(
+    role_name="user", role_type="human", 
+    role_content=query_content, input_query=query_content, origin_query=query_content,
+    code_engine_name="client", score_threshold=1.0, top_k=3, cb_search_type="cypher"
+    )
+
+output_message1, _ = phase.step(query)
--- a/requirements.txt
+++ b/requirements.txt
@ -1,7 +1,7 @@
 langchain==0.0.266
 openai==0.28.1
 sentence_transformers
-fschat==0.2.24
+fschat==0.2.33
 transformers>=4.31.0
 # torch~=2.0.0
 fastapi~=0.99.1
@ -45,3 +45,10 @@ javalang==0.13.0
 jsonref==1.1.0
 chromadb==0.4.17
 nebula3-python==3.1.0
+
+
+# qwen model
+protobuf==3.20.*
+transformers_stream_generator
+einops
+