V4.8.20 feature (#3686)

* Aiproxy (#3649) * model config * feat: model config ui * perf: rename variable * feat: custom request url * perf: model buffer * perf: init model * feat: json model config * auto login * fix: ts * update packages * package * fix: dockerfile * feat: usage filter & export & dashbord (#3538) * feat: usage filter & export & dashbord * adjust ui * fix tmb scroll * fix code & selecte all * merge * perf: usages list；perf: move components (#3654) * perf: usages list * team sub plan load * perf: usage dashboard code * perf: dashboard ui * perf: move components * add default model config (#3653) * 4.8.20 test (#3656) * provider * perf: model config * model perf (#3657) * fix: model * dataset quote * perf: model config * model tag * doubao model config * perf: config model * feat: model test * fix: POST 500 error on dingtalk bot (#3655) * feat: default model (#3662) * move model config * feat: default model * fix: false triggerd org selection (#3661) * export usage csv i18n (#3660) * export usage csv i18n * fix build * feat: markdown extension (#3663) * feat: markdown extension * media cros * rerank test * default price * perf: default model * fix: cannot custom provider * fix: default model select * update bg * perf: default model selector * fix: usage export * i18n * fix: rerank * update init extension * perf: ip limit check * doubao model order * web default modle * perf: tts selector * perf: tts error * qrcode package * reload buffer (#3665) * reload buffer * reload buffer * tts selector * fix: err tip (#3666) * fix: err tip * perf: training queue * doc * fix interactive edge (#3659) * fix interactive edge * fix * comment * add gemini model * fix: chat model select * perf: supplement assistant empty response (#3669) * perf: supplement assistant empty response * check array * perf: max_token count;feat: support resoner output;fix: member scroll (#3681) * perf: supplement assistant empty response * check array * perf: max_token count * feat: support resoner output * member scroll * update provider order * i18n * fix: stream response (#3682) * perf: supplement assistant empty response * check array * fix: stream response * fix: model config cannot set to null * fix: reasoning response (#3684) * perf: supplement assistant empty response * check array * fix: reasoning response * fix: reasoning response * doc (#3685) * perf: supplement assistant empty response * check array * doc * lock * animation * update doc * update compose * doc * doc --------- Co-authored-by: heheer <[email protected]> Co-authored-by: a.e. <[email protected]>
labring · Feb 4, 2025 · db2c0a0 · db2c0a0
1 parent c393002
commit db2c0a0
Show file tree

Hide file tree

Showing 496 changed files with 9,006 additions and 4,701 deletions.
diff --git a/.github/workflows/docs-deploy-vercel.yml b/.github/workflows/docs-deploy-vercel.yml
@@ -58,7 +58,7 @@ jobs:
 
       # Step 4 - Builds the site using Hugo
       - name: Build
-        run: cd docSite && hugo mod get -u github.com/colinwilson/lotusdocs && hugo -v --minify
+        run: cd docSite && hugo mod get -u github.com/colinwilson/lotusdocs@6d0568e” && hugo -v --minify
 
       # Step 5 - Push our generated site to Vercel
       - name: Deploy to Vercel

diff --git a/.github/workflows/docs-preview.yml b/.github/workflows/docs-preview.yml
@@ -58,7 +58,7 @@ jobs:
 
       # Step 4 - Builds the site using Hugo
       - name: Build
-        run: cd docSite && hugo mod get -u github.com/colinwilson/lotusdocs && hugo -v --minify
+        run: cd docSite && hugo mod get -u github.com/colinwilson/lotusdocs@6d0568e” && hugo -v --minify
 
       # Step 5 - Push our generated site to Vercel
       - name: Deploy to Vercel

diff --git a/docSite/Dockerfile b/docSite/Dockerfile
@@ -3,7 +3,7 @@ FROM hugomods/hugo:0.117.0 AS builder
 WORKDIR /app
 
 ADD ./docSite hugo
-RUN cd /app/hugo && hugo mod get -u github.com/colinwilson/lotusdocs && hugo -v --minify
+RUN cd /app/hugo && hugo mod get -u github.com/colinwilson/lotusdocs@6d0568e” && hugo -v --minify
 
 FROM fholzer/nginx-brotli:latest
 

diff --git a/docSite/assets/imgs/image-100.png b/docSite/assets/imgs/image-100.png
diff --git a/docSite/assets/imgs/image-101.png b/docSite/assets/imgs/image-101.png
diff --git a/docSite/assets/imgs/image-102.png b/docSite/assets/imgs/image-102.png
diff --git a/docSite/assets/imgs/image-103.png b/docSite/assets/imgs/image-103.png
diff --git a/docSite/assets/imgs/image-104.png b/docSite/assets/imgs/image-104.png
diff --git a/docSite/assets/imgs/image-105.png b/docSite/assets/imgs/image-105.png
diff --git a/docSite/assets/imgs/image-106.png b/docSite/assets/imgs/image-106.png
diff --git a/docSite/assets/imgs/image-107.png b/docSite/assets/imgs/image-107.png
diff --git a/docSite/assets/imgs/image-88.png b/docSite/assets/imgs/image-88.png
diff --git a/docSite/assets/imgs/image-89.png b/docSite/assets/imgs/image-89.png
diff --git a/docSite/assets/imgs/image-90.png b/docSite/assets/imgs/image-90.png
diff --git a/docSite/assets/imgs/image-91.png b/docSite/assets/imgs/image-91.png
diff --git a/docSite/assets/imgs/image-92.png b/docSite/assets/imgs/image-92.png
diff --git a/docSite/assets/imgs/image-93.png b/docSite/assets/imgs/image-93.png
diff --git a/docSite/assets/imgs/image-94.png b/docSite/assets/imgs/image-94.png
diff --git a/docSite/assets/imgs/image-95.png b/docSite/assets/imgs/image-95.png
diff --git a/docSite/assets/imgs/image-96.png b/docSite/assets/imgs/image-96.png
diff --git a/docSite/assets/imgs/image-97.png b/docSite/assets/imgs/image-97.png
diff --git a/docSite/assets/imgs/image-98.png b/docSite/assets/imgs/image-98.png
diff --git a/docSite/assets/imgs/image-99.png b/docSite/assets/imgs/image-99.png
diff --git a/docSite/content/zh-cn/docs/development/configuration.md b/docSite/content/zh-cn/docs/development/configuration.md
@@ -25,251 +25,6 @@ weight: 707
     "qaMaxProcess": 15, // 问答拆分线程数量
     "tokenWorkers": 50, // Token 计算线程保持数，会持续占用内存，不能设置太大。
     "pgHNSWEfSearch": 100 // 向量搜索参数。越大，搜索越精确，但是速度越慢。设置为100，有99%+精度。
-  },
-  "llmModels": [
-    {
-      "provider": "OpenAI", // 模型提供商，主要用于分类展示，目前已经内置提供商包括：https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商，或直接填写 Other
-      "model": "gpt-4o-mini", // 模型名(对应OneAPI中渠道的模型名)
-      "name": "gpt-4o-mini", // 模型别名
-      "maxContext": 125000, // 最大上下文
-      "maxResponse": 16000, // 最大回复
-      "quoteMaxToken": 120000, // 最大引用内容
-      "maxTemperature": 1.2, // 最大温度
-      "charsPointsPrice": 0, // n积分/1k token（商业版）
-      "censor": false, // 是否开启敏感校验（商业版）
-      "vision": true, // 是否支持图片输入
-      "datasetProcess": true, // 是否设置为文本理解模型（QA），务必保证至少有一个为true，否则知识库会报错
-      "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
-      "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
-      "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
-      "usedInQueryExtension": true, // 是否用于问题优化（务必保证至少有一个为true）
-      "toolChoice": true, // 是否支持工具选择（分类，内容提取，工具调用会用到。）
-      "functionCall": false, // 是否支持函数调用（分类，内容提取，工具调用会用到。会优先使用 toolChoice，如果为false，则使用 functionCall，如果仍为 false，则使用提示词模式）
-      "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型
-      "customExtractPrompt": "", // 自定义内容提取提示词
-      "defaultSystemChatPrompt": "", // 对话默认携带的系统提示词
-      "defaultConfig": {}, // 请求API时，挟带一些默认配置（比如 GLM4 的 top_p）
-      "fieldMap": {} // 字段映射（o1 模型需要把 max_tokens 映射为 max_completion_tokens）
-    },
-    {
-      "provider": "OpenAI",
-      "model": "gpt-4o",
-      "name": "gpt-4o",
-      "maxContext": 125000,
-      "maxResponse": 4000,
-      "quoteMaxToken": 120000,
-      "maxTemperature": 1.2,
-      "charsPointsPrice": 0,
-      "censor": false,
-      "vision": true,
-      "datasetProcess": true,
-      "usedInClassify": true,
-      "usedInExtractFields": true,
-      "usedInToolCall": true,
-      "usedInQueryExtension": true,
-      "toolChoice": true,
-      "functionCall": false,
-      "customCQPrompt": "",
-      "customExtractPrompt": "",
-      "defaultSystemChatPrompt": "",
-      "defaultConfig": {},
-      "fieldMap": {}
-    },
-    {
-      "provider": "OpenAI",
-      "model": "o1-mini",
-      "name": "o1-mini",
-      "maxContext": 125000,
-      "maxResponse": 65000,
-      "quoteMaxToken": 120000,
-      "maxTemperature": 1.2,
-      "charsPointsPrice": 0,
-      "censor": false,
-      "vision": false,
-      "datasetProcess": true,
-      "usedInClassify": true,
-      "usedInExtractFields": true,
-      "usedInToolCall": true,
-      "usedInQueryExtension": true,
-      "toolChoice": false,
-      "functionCall": false,
-      "customCQPrompt": "",
-      "customExtractPrompt": "",
-      "defaultSystemChatPrompt": "",
-      "defaultConfig": {
-        "temperature": 1,
-        "max_tokens": null,
-        "stream": false
-      }
-    },
-    {
-      "provider": "OpenAI",
-      "model": "o1-preview",
-      "name": "o1-preview",
-      "maxContext": 125000,
-      "maxResponse": 32000,
-      "quoteMaxToken": 120000,
-      "maxTemperature": 1.2,
-      "charsPointsPrice": 0,
-      "censor": false,
-      "vision": false,
-      "datasetProcess": true,
-      "usedInClassify": true,
-      "usedInExtractFields": true,
-      "usedInToolCall": true,
-      "usedInQueryExtension": true,
-      "toolChoice": false,
-      "functionCall": false,
-      "customCQPrompt": "",
-      "customExtractPrompt": "",
-      "defaultSystemChatPrompt": "",
-      "defaultConfig": {
-         "temperature": 1,
-        "max_tokens": null,
-        "stream": false
-      }
-    }
-  ],
-  "vectorModels": [
-    {
-      "provider": "OpenAI",
-      "model": "text-embedding-3-small",
-      "name": "text-embedding-3-small",
-      "charsPointsPrice": 0,
-      "defaultToken": 512,
-      "maxToken": 3000,
-      "weight": 100
-    },
-    {
-      "provider": "OpenAI",
-      "model": "text-embedding-3-large",
-      "name": "text-embedding-3-large",
-      "charsPointsPrice": 0,
-      "defaultToken": 512,
-      "maxToken": 3000,
-      "weight": 100,
-      "defaultConfig": {
-        "dimensions": 1024
-      }
-    },
-    {
-      "provider": "OpenAI",
-      "model": "text-embedding-ada-002", // 模型名（与OneAPI对应）
-      "name": "Embedding-2", // 模型展示名
-      "charsPointsPrice": 0, // n积分/1k token
-      "defaultToken": 700, // 默认文本分割时候的 token
-      "maxToken": 3000, // 最大 token
-      "weight": 100, // 优先训练权重
-      "defaultConfig": {}, // 自定义额外参数。例如，如果希望使用 embedding3-large 的话，可以传入 dimensions:1024，来返回1024维度的向量。（目前必须小于1536维度）
-      "dbConfig": {}, // 存储时的额外参数（非对称向量模型时候需要用到）
-      "queryConfig": {} // 参训时的额外参数
-    }
-  ],
-  "reRankModels": [],
-  "audioSpeechModels": [
-    {
-      "provider": "OpenAI",
-      "model": "tts-1",
-      "name": "OpenAI TTS1",
-      "charsPointsPrice": 0,
-      "voices": [
-        { "label": "Alloy", "value": "alloy", "bufferId": "openai-Alloy" },
-        { "label": "Echo", "value": "echo", "bufferId": "openai-Echo" },
-        { "label": "Fable", "value": "fable", "bufferId": "openai-Fable" },
-        { "label": "Onyx", "value": "onyx", "bufferId": "openai-Onyx" },
-        { "label": "Nova", "value": "nova", "bufferId": "openai-Nova" },
-        { "label": "Shimmer", "value": "shimmer", "bufferId": "openai-Shimmer" }
-      ]
-    }
-  ],
-  "whisperModel": {
-    "provider": "OpenAI",
-    "model": "whisper-1",
-    "name": "Whisper1",
-    "charsPointsPrice": 0
   }
 }
-```
-
-##  内置的模型提供商ID
-
-为了方便模型分类展示，FastGPT 内置了部分模型提供商的名字和 Logo。如果你期望补充提供商，可[提交 Issue](https://github.com/labring/FastGPT/issues)，并提供几个信息：
-
-1. 厂商官网地址
-2. 厂商 SVG logo，建议是正方形图片。
-
-目前已支持的提供商, 复制 "-" 之前的字符串，作为 provider 的值。
-
-- OpenAI
-- Claude
-- Gemini
-- Meta
-- MistralAI
-- AliCloud - 阿里云
-- Qwen - 通义千问
-- Doubao - 豆包
-- ChatGLM - 智谱
-- DeepSeek - 深度求索
-- Moonshot - 月之暗面
-- MiniMax
-- SparkDesk - 讯飞星火
-- Hunyuan - 腾讯混元
-- Baichuan - 百川
-- Yi - 零一万物
-- Ernie - 文心一言
-- StepFun - 阶跃星辰
-- Ollama
-- BAAI - 智源研究院
-- FishAudio
-- Intern - 书生
-- Moka - Moka-AI
-- Other - 其他
-
-
-## ReRank 模型接入
-
-由于 OneAPI 不支持 Rerank 模型，所以需要单独配置接入，这里
-
-
-### 使用硅基流动的在线模型
-
-有免费的 `bge-reranker-v2-m3` 模型可以使用。
-
-1. [点击注册硅基流动账号](https://cloud.siliconflow.cn/i/TR9Ym0c4)
-2. 进入控制台，获取 API key: https://cloud.siliconflow.cn/account/ak
-3. 修改 FastGPT 配置文件
-
-```json
-{
-    "reRankModels": [
-        {
-            "model": "BAAI/bge-reranker-v2-m3", // 这里的model需要对应 siliconflow 的模型名
-            "name": "BAAI/bge-reranker-v2-m3",
-            "requestUrl": "https://api.siliconflow.cn/v1/rerank",
-            "requestAuth": "siliconflow 上申请的 key"
-        }
-    ]
-}
-```
-
-### 私有部署模型
-
-请使用 4.6.6-alpha 以上版本，配置文件中的 `reRankModels` 为重排模型，虽然是数组，不过目前仅有第1个生效。
-
-1. [部署 ReRank 模型](/docs/development/custom-models/bge-rerank/)
-1. 找到 FastGPT 的配置文件中的 `reRankModels`， 4.6.6 以前是 `ReRankModels`。
-2. 修改对应的值：
-
-```json
-{
-    "reRankModels": [
-        {
-            "model": "bge-reranker-base", // 随意
-            "name": "检索重排-base", // 随意
-            "charsPointsPrice": 0,
-            "requestUrl": "{{host}}/v1/rerank",
-            "requestAuth": "安全凭证，已自动补 Bearer"
-        }
-    ]
-}
-```
+```
diff --git a/docSite/content/zh-cn/docs/development/custom-models/bge-rerank.md b/docSite/content/zh-cn/docs/development/custom-models/bge-rerank.md
@@ -118,10 +118,17 @@ services:
 ```
 ## 接入 FastGPT
 
-参考 [ReRank模型接入](/docs/development/configuration/#rerank-接入)，host 变量为部署的域名。
+1. 打开 FastGPT 模型配置，新增一个重排模型。
+2. 填写模型配置表单：模型 ID 为`bge-reranker-base`，地址填写`{{host}}/v1/rerank`，host 为你部署的域名/IP:Port。
+
+![alt text](/imgs/image-102.png)
 
 ## QA
 
+### 403报错
+
+FastGPT中，自定义请求 Token 和环境变量的 ACCESS_TOKEN 不一致。 
+
 ### Docker 运行提示 `Bus error (core dumped)`
 
 尝试增加 `docker-compose.yml` 配置项 `shm_size` ，以增加容器中的共享内存目录大小。

diff --git a/docSite/content/zh-cn/docs/development/custom-models/xinference.md b/docSite/content/zh-cn/docs/development/custom-models/xinference.md
@@ -144,7 +144,6 @@ curl --location --request POST 'https://<oneapi_url>/v1/chat/completions' \
       "usedInClassify": true, // 是否用于问题分类（务必保证至少有一个为true）
       "usedInExtractFields": true, // 是否用于内容提取（务必保证至少有一个为true）
       "usedInToolCall": true, // 是否用于工具调用（务必保证至少有一个为true）
-      "usedInQueryExtension": true, // 是否用于问题优化（务必保证至少有一个为true）
       "toolChoice": true, // 是否支持工具选择（分类，内容提取，工具调用会用到。）
       "functionCall": false, // 是否支持函数调用（分类，内容提取，工具调用会用到。会优先使用 toolChoice，如果为false，则使用 functionCall，如果仍为 false，则使用提示词模式）
       "customCQPrompt": "", // 自定义文本分类提示词（不支持工具和函数调用的模型

diff --git a/docSite/content/zh-cn/docs/development/docker.md b/docSite/content/zh-cn/docs/development/docker.md
@@ -7,6 +7,13 @@ toc: true
 weight: 707
 ---
 
+## 前置知识
+
+1. 基础的网络知识：端口，防火墙……  
+2. Docker 和 Docker Compose 基础知识  
+3. 大模型相关接口和参数
+4. RAG 相关知识：向量模型，向量数据库，向量检索
+
 ## 部署架构图
 
 ![](/imgs/sealos-fastgpt.webp)
@@ -202,6 +209,10 @@ docker restart oneapi
 
 首次运行，会自动初始化 root 用户，密码为 `1234`（与环境变量中的`DEFAULT_ROOT_PSW`一致），日志里会提示一次`MongoServerError: Unable to read from a snapshot due to pending collection catalog changes;`可忽略。
 
+### 6. 配置模型
+
+[点击查看模型配置教程](/docs/development/modelConfig/intro/)
+
 ## FAQ
 
 ### Mongo 副本集自动初始化失败

diff --git a/docSite/content/zh-cn/docs/development/faq.md b/docSite/content/zh-cn/docs/development/faq.md
@@ -23,11 +23,11 @@ images: []
 ![](/imgs/faq1.png)
 这是索引模型的长度限制，通过任何方式部署都一样的，但不同索引模型的配置不一样，可以在后台修改参数。
 
-### sealos怎么挂载 小程序配置文件
+### 怎么挂载小程序配置文件
 
-新增配置文件：/app/projects/app/public/xxxx.txt
+将验证文件，挂载到指定位置：/app/projects/app/public/xxxx.txt
 
-如图:
+然后重启。例如:
 
 ![](/imgs/faq2.png)