Skip to content

示例

vLLM 的示例分为三类:

  • 如果您在 Python 代码中使用 vLLM,请参阅 离线推理 部分。
  • 如果您在 HTTP 应用程序或客户端中使用 vLLM,请参阅 在线服务 部分。
  • 有关使用 vLLM 某些高级功能(例如 LMCache 或 Tensorizer)的示例(这些功能不特定于上述任一用例),请参阅 其他 部分。