From 75546351d8ad7cc891302a386298192eadbebf00 Mon Sep 17 00:00:00 2001 From: roc Date: Sat, 27 Apr 2024 08:56:22 +0800 Subject: [PATCH] update at 2024-04-27 08:56:22 --- content/cases/llama3.md | 6 ++++++ 1 file changed, 6 insertions(+) diff --git a/content/cases/llama3.md b/content/cases/llama3.md index 1b8554c..18cbb88 100644 --- a/content/cases/llama3.md +++ b/content/cases/llama3.md @@ -1,5 +1,11 @@ # 在 Kubernetes 上部署 llama3 +## Ollama 与 OpenWebUI 介绍 + +[Ollama](https://ollama.com/) 是一个运行大模型的工具,可以下载所需的大模型并暴露 API。[OpenWebUI](https://openwebui.com/) 是一个大模型的 Web UI 交互工具,支持 Ollama,即调用 Ollama 暴露的 API 实现与大模型交互。 + +![](https://image-host-1251893006.cos.ap-chengdu.myqcloud.com/2024%2F04%2F27%2F20240427085614.png) + ## 部署方案选型 OpenWebUI 的仓库中自带 Ollama + OpenWebUI 的部署方式,主要是 kustomize 和 helm 这两种方式,参考 [open-webui 仓库的 kubernetes 目录](https://github.com/open-webui/open-webui/tree/main/kubernetes)。