Skip to content

AnythingLLM

AnythingLLM 是一个全栈应用程序,可让您将任何文档、资源或内容转换为上下文,以供任何 LLM 在聊天过程中作为参考使用。

它允许您部署一个以 vLLM 作为后端的大语言模型(LLM)服务器,该服务器提供 OpenAI 兼容的端点。

先决条件

设置 vLLM 环境:

pip install vllm

部署

  1. 启动支持聊天完成的 vLLM 服务器,例如:

    vllm serve Qwen/Qwen1.5-32B-Chat-AWQ --max-model-len 4096
    
  2. 下载并安装 AnythingLLM Desktop

  3. 配置 AI 提供商:

    • 在底部点击 🔧 扳手图标 -> 打开设置 -> AI 提供商 -> LLM
    • 输入以下值:
      • LLM 提供商:Generic OpenAI
      • 基础 URL:http://{vllm 服务器主机}:{vllm 服务器端口}/v1
      • 聊天模型名称:Qwen/Qwen1.5-32B-Chat-AWQ

    设置 AI 提供商

  4. 创建一个工作区:

    1. 在底部点击 ↺ 返回图标,返回工作区列表。
    2. 创建一个工作区(例如 vllm),然后开始聊天。

    创建工作区

  5. 添加文档:

    1. 点击 📎 附件图标。
    2. 上传文档。
    3. 选择并把文档移动到您的工作区。
    4. 保存并嵌入文档。

    添加文档

  6. 使用文档作为上下文进行聊天。

    使用上下文聊天