docs: 更新README以支持LM Studio服务器

- 更新项目背景和说明，加入LM Studio支持 - 新增多服务器支持特性说明 - 更新配置参数，添加LMS_URL参数 - 添加Ollama和LM Studio的部署示例 - 更新注意事项，说明服务器配置互斥关系 - 将唤醒功能标记为可选配置
feat: 增加LM Studio服务器支持
2026-06-19 10:22:04 +08:00 · 2025-02-03 17:58:59 +08:00 · 2025-02-03 17:48:38 +08:00
3 changed files with 238 additions and 68 deletions
--- a/README.md
+++ b/README.md
@@ -2,14 +2,14 @@

 ## 项目背景

-随着大语言模型的普及，越来越多的个人用户选择在本地部署 Ollama 服务来使用 AI 模型。然而，这带来了一个普遍的问题：
+随着大语言模型的普及，越来越多的个人用户选择在本地部署 Ollama 或 LM Studio 服务来使用 AI 模型。然而，这带来了一个普遍的问题：

- Ollama 通常需要部署在高性能台式机上（配备强大的GPU）
+- Ollama/LM Studio 通常需要部署在高性能台式机上（配备强大的GPU）
 - 24小时开机运行会导致较高的电费支出
- 设置电脑定时睡眠可以节省电力，但会导致 Ollama 服务不可用
+- 设置电脑定时睡眠可以节省电力，但会导致服务不可用
 - 用户需要手动唤醒电脑才能继续使用服务

-Ollama Proxy 正是为解决这个问题而设计：它允许用户在保持节能的同时，仍然可以随时便捷地使用 Ollama 服务。项目采用了两个关键策略来提升用户体验：
+Ollama Proxy 正是为解决这个问题而设计：它允许用户在保持节能的同时，仍然可以随时便捷地使用 Ollama 或 LM Studio 服务。项目采用了两个关键策略来提升用户体验：

 1. **智能唤醒机制**：通过请求管理，在需要时自动唤醒服务器，在空闲时允许系统进入睡眠状态，实现了服务可用性和节能环保的平衡。

@@ -20,7 +20,7 @@ Ollama Proxy 正是为解决这个问题而设计：它允许用户在保持节

 通过这种设计，Ollama Proxy 不仅解决了节能问题，还确保了服务响应的及时性，为用户提供了一个既环保又高效的解决方案。

-Ollama Proxy 是一个为 Ollama 服务设计的智能代理服务器，它提供了以下主要功能：
+Ollama Proxy 是一个为 Ollama 或 LM Studio 服务设计的智能代理服务器，它提供了以下主要功能：

 1. 自动唤醒功能
 2. 请求转发
@@ -30,23 +30,29 @@ Ollama Proxy 是一个为 Ollama 服务设计的智能代理服务器，它提

 ## 主要特性

-### 1. 自动唤醒功能
- 定期发送唤醒请求，防止 Ollama 服务进入休眠状态
+### 1. 多服务器支持
+- 支持 Ollama 服务器
+- 支持 LM Studio 服务器
+- 智能识别服务器类型，自动调整 API 路径
+
+### 2. 自动唤醒功能（可选）
+- 定期发送唤醒请求，防止服务进入休眠状态
 - 可配置唤醒间隔时间
 - 在请求超时时自动触发唤醒
+- 可选配置，不强制要求配置唤醒服务器

-### 2. 智能请求转发
+### 3. 智能请求转发
 - 支持所有 Ollama API 端点的请求转发
 - 动态超时控制：对不同类型的请求使用不同的超时时间
  - 普通请求：可配置的短超时时间
  - 模型推理请求：较长的超时时间（默认30秒）

-### 3. 模型列表缓存
+### 4. 模型列表缓存
 - 缓存 `/api/tags` 接口返回的模型列表
 - 可配置缓存有效期，默认为1440分钟（1天）
 - 当主服务不可用时返回缓存数据，确保客户端始终可以获取模型列表

-### 4. 健康检查
+### 5. 健康检查
 - 提供 `  ` 端点进行健康状态检查
 - Docker 容器集成了健康检查配置

@@ -56,8 +62,9 @@ Ollama Proxy 是一个为 Ollama 服务设计的智能代理服务器，它提

 | 参数 | 环境变量 | 说明 | 默认值 |
 |------|----------|------|--------|
-| `--ollama-url` | `OLLAMA_URL` | Ollama服务器URL | http://localhost:11434 |
-| `--wake-url` | `WAKE_URL` | 唤醒服务器URL | http://localhost:11434/api/generate |
+| `--ollama-url` | `OLLAMA_URL` | Ollama服务器URL（与LMS_URL互斥） | http://localhost:11434 |
+| `--lms-url` | `LMS_URL` | LM Studio服务器URL（与OLLAMA_URL互斥） | - |
+| `--wake-url` | `WAKE_URL` | 唤醒服务器URL（可选） | - |
 | `--timeout` | `TIMEOUT_SECONDS` | 简单请求超时时间(秒) | 10 |
 | `--model-timeout` | `MODEL_TIMEOUT_SECONDS` | 模型推理请求超时时间(秒) | 30 |
 | `--port` | `PORT` | 代理服务器端口 | 11434 |
@@ -68,7 +75,16 @@ Ollama Proxy 是一个为 Ollama 服务设计的智能代理服务器，它提

 ### 使用 Docker Compose（推荐）

-1. 创建 `.env` 文件（可选）并配置环境变量
+1. 创建 `.env` 文件（可选）并配置环境变量：
+```bash
+# 选择以下其中一个配置：
+OLLAMA_URL=http://localhost:11434  # Ollama服务器
+LMS_URL=http://localhost:1234      # LM Studio服务器
+
+# 可选配置
+WAKE_URL=http://localhost:11434/api/generate
+```
+
 2. 使用以下命令启动服务：
 ```bash
 docker-compose up -d
@@ -77,6 +93,7 @@ docker-compose up -d
 ### 使用 Docker

 ```bash
+# 使用 Ollama 服务器
 docker run -d \
  -p 11434:11434 \
  -e OLLAMA_URL=http://localhost:11434 \
@@ -87,6 +104,17 @@ docker run -d \
  -e CACHE_DURATION=1440 \
  -e PORT=11434 \
  yshtcn/ollama-proxy:latest
+
+# 或使用 LM Studio 服务器
+docker run -d \
+  -p 11434:11434 \
+  -e LMS_URL=http://localhost:1234 \
+  -e TIMEOUT_SECONDS=10 \
+  -e MODEL_TIMEOUT_SECONDS=30 \
+  -e WAKE_INTERVAL=10 \
+  -e CACHE_DURATION=1440 \
+  -e PORT=11434 \
+  yshtcn/ollama-proxy:latest
 ```

 ### 手动部署
@@ -98,6 +126,7 @@ pip install -r requirements.txt

 2. 运行服务：
 ```bash
+# 使用 Ollama 服务器
 python ollama_proxy.py \
  --ollama-url http://localhost:11434 \
  --wake-url http://localhost:11434/api/generate \
@@ -106,6 +135,15 @@ python ollama_proxy.py \
  --wake-interval 10 \
  --cache-duration 1440 \
  --port 11434
+
+# 或使用 LM Studio 服务器
+python ollama_proxy.py \
+  --lms-url http://localhost:1234 \
+  --timeout 10 \
+  --model-timeout 30 \
+  --wake-interval 10 \
+  --cache-duration 1440 \
+  --port 11434
 ```

 ## 构建 Docker 镜像
@@ -128,26 +166,17 @@ python ollama_proxy.py \

 ## 注意事项

-1. 确保 Ollama 服务正在运行且可访问
-2. 配置正确的 OLLAMA_URL 和 WAKE_URL
-3. 根据网络环境调整超时时间
-4. Docker 部署时注意端口映射和网络配置
-5. 可以搭配 [WolGoWeb](https://github.com/xiaoxinpro/WolGoWeb) 项目使用，实现远程唤醒功能：
+1. 确保 Ollama 或 LM Studio 服务正在运行且可访问
+2. OLLAMA_URL 和 LMS_URL 不能同时配置，必须选择其中一个
+3. WAKE_URL 为可选配置，不配置则不启用自动唤醒功能
+4. 根据网络环境调整超时时间
+5. Docker 部署时注意端口映射和网络配置
+6. 可以搭配 [WolGoWeb](https://github.com/xiaoxinpro/WolGoWeb) 项目使用，实现远程唤醒功能：
   - WolGoWeb 提供了网络唤醒（WOL）功能
   - 可以通过 HTTP API 远程唤醒目标主机
   - 支持多种部署方式（Docker、直接部署等）
-   - 配置 WAKE_URL 为 WolGoWeb 的唤醒接口，即可实现远程唤醒 Ollama 服务器
+   - 配置 WAKE_URL 为 WolGoWeb 的唤醒接口，即可实现远程唤醒 Ollama 或 LM Studio 服务器

 ## 健康检查

-服务提供了 `/health` 端点，返回格式如下：
-```json
-{
-    "status": "healthy"
-}
-```
-
-Docker 容器配置了自动健康检查：
- 检查间隔：30秒
- 超时时间：10秒
- 重试次数：3次
+服务提供了 `/health`
--- a/ollama_proxy.py
+++ b/ollama_proxy.py
@@ -14,19 +14,21 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)

 # 解析命令行参数
-parser = argparse.ArgumentParser(description='Ollama代理服务器')
+parser = argparse.ArgumentParser(description='代理服务器')
 parser.add_argument('--ollama-url', help='Ollama服务器URL')
-parser.add_argument('--wake-url', help='唤醒服务器URL')
+parser.add_argument('--lms-url', help='LM Studio服务器URL')
+parser.add_argument('--wake-url', help='唤醒服务器URL（可选）')
 parser.add_argument('--timeout', type=int, help='简单请求的超时时间(秒)')
 parser.add_argument('--model-timeout', type=int, help='模型推理请求的超时时间(秒)')
 parser.add_argument('--port', type=int, help='代理服务器端口')
-parser.add_argument('--wake-interval', type=int, default=10, help='唤醒间隔时间(分钟)')
+parser.add_argument('--wake-interval', type=int, default=10, help='唤醒间隔时间(分钟)，仅在配置wake-url时有效')
 parser.add_argument('--cache-duration', type=int, help='模型列表缓存有效期(分钟)，默认1440分钟(1天)')

 args = parser.parse_args()

 # 配置常量，优先使用环境变量，其次使用命令行参数
 OLLAMA_URL = os.getenv('OLLAMA_URL') or args.ollama_url
+LMS_URL = os.getenv('LMS_URL') or args.lms_url
 WAKE_URL = os.getenv('WAKE_URL') or args.wake_url
 TIMEOUT_SECONDS = os.getenv('TIMEOUT_SECONDS') or args.timeout
 MODEL_TIMEOUT_SECONDS = int(os.getenv('MODEL_TIMEOUT_SECONDS') or args.model_timeout or 30)  # 默认30秒
@@ -34,12 +36,28 @@ PORT = os.getenv('PORT') or args.port
 WAKE_INTERVAL = int(os.getenv('WAKE_INTERVAL') or args.wake_interval)
 CACHE_DURATION = int(os.getenv('CACHE_DURATION') or args.cache_duration or 1440)  # 默认1天

-# 检查必要参数
+# 检查URL配置
+if OLLAMA_URL and LMS_URL:
+    logger.error("不能同时配置 OLLAMA_URL 和 LMS_URL，请只选择其中一个")
+    sys.exit(1)
+elif not (OLLAMA_URL or LMS_URL):
+    logger.error("必须配置 OLLAMA_URL 或 LMS_URL 其中之一")
+    sys.exit(1)
+
+# 设置服务器类型和基础URL
+if OLLAMA_URL:
+    server_type = 'ollama'
+    BASE_URL = OLLAMA_URL
+    MODEL_LIST_PATH = 'api/tags'
+    GENERATE_ENDPOINTS = ["api/generate", "api/chat"]
+else:
+    server_type = 'lmstudio'
+    BASE_URL = LMS_URL
+    MODEL_LIST_PATH = 'v1/models'
+    GENERATE_ENDPOINTS = ["v1/chat/completions"]
+
+# 检查其他必要参数
 missing_params = []
-if not OLLAMA_URL:
-    missing_params.append("OLLAMA_URL")
-if not WAKE_URL:
-    missing_params.append("WAKE_URL")
 if not TIMEOUT_SECONDS:
    missing_params.append("TIMEOUT_SECONDS")
 if not PORT:
@@ -67,13 +85,19 @@ models_cache_time = None

 async def should_wake():
    """检查是否需要发送唤醒请求"""
+    if not WAKE_URL:  # 如果没有配置WAKE_URL，永远不需要唤醒
+        return False
+    
    global last_wake_time
    if last_wake_time is None:
        return True
    return datetime.now() - last_wake_time > timedelta(minutes=WAKE_INTERVAL)

 async def wake_ollama():
-    """唤醒 Ollama 服务器"""
+    """唤醒服务器"""
+    if not WAKE_URL:  # 如果没有配置WAKE_URL，直接返回
+        return
+    
    global last_wake_time
    try:
        async with httpx.AsyncClient() as client:
@@ -99,16 +123,6 @@ async def update_models_cache(data):
    models_cache_time = datetime.now()
    logger.info("模型列表缓存已更新")

-# 输出当前配置
-logger.info(f"使用配置:")
-logger.info(f"OLLAMA_URL: {OLLAMA_URL}")
-logger.info(f"WAKE_URL: {WAKE_URL}")
-logger.info(f"TIMEOUT_SECONDS: {TIMEOUT_SECONDS}")
-logger.info(f"MODEL_TIMEOUT_SECONDS: {MODEL_TIMEOUT_SECONDS}")
-logger.info(f"PORT: {PORT}")
-logger.info(f"WAKE_INTERVAL: {WAKE_INTERVAL} minutes")
-logger.info(f"CACHE_DURATION: {CACHE_DURATION} minutes")
-
 app = FastAPI()

@app.get("/health")
@@ -124,7 +138,7 @@ async def list_models():
        
        async with httpx.AsyncClient() as client:
            response = await client.get(
-                f"{OLLAMA_URL}/api/tags",
+                f"{BASE_URL}/{MODEL_LIST_PATH}",
                timeout=TIMEOUT_SECONDS  # 使用较短的超时时间
            )
            # 更新缓存并返回最新数据
@@ -158,12 +172,12 @@ async def proxy(request: Request, path: str):
        return await health_check()
    
    # 其他请求的处理逻辑
-    if await should_wake():
+    if WAKE_URL and await should_wake():
        logger.info("距离上次唤醒已超过设定时间，发送预防性唤醒请求")
        await wake_ollama()
    
    try:
-        target_url = f"{OLLAMA_URL}/{path}"
+        target_url = f"{BASE_URL}/{path}"
        headers = dict(request.headers)
        headers.pop('host', None)
        headers.pop('connection', None)
@@ -172,10 +186,10 @@ async def proxy(request: Request, path: str):
        headers.pop('transfer-encoding', None)
        
        # 根据请求类型选择不同的超时时间
-        timeout = TIMEOUT_SECONDS if path == "api/tags" else MODEL_TIMEOUT_SECONDS
+        timeout = TIMEOUT_SECONDS if path == MODEL_LIST_PATH else MODEL_TIMEOUT_SECONDS

        # 检查是否为生成相关的端点
-        is_generate_endpoint = path in ["api/generate", "api/chat"]
+        is_generate_endpoint = path in GENERATE_ENDPOINTS
        
        if is_generate_endpoint and request.method == "POST":
            request_body = await request.json()
@@ -223,7 +237,7 @@ async def proxy(request: Request, path: str):
                )
                
                # 如果是标签列表请求且成功，更新缓存
-                if path == "api/tags" and request.method == "GET" and response.status_code == 200:
+                if path == MODEL_LIST_PATH and request.method == "GET" and response.status_code == 200:
                    await update_models_cache(response.json())
                
                return Response(
@@ -233,25 +247,31 @@ async def proxy(request: Request, path: str):
                )
        
    except httpx.TimeoutException:
-        logger.warning("Ollama服务器超时，发送唤醒请求")
-        # 如果是标签列表请求，尝试返回缓存
-        if path == "api/tags" and request.method == "GET":
-            cached_models = await get_models_from_cache()
-            if cached_models is not None:
-                logger.info("返回缓存的标签列表")
-                return JSONResponse(content=cached_models)
+        error_msg = "服务器超时"
+        if WAKE_URL:
+            error_msg += "，正在尝试唤醒"
+            logger.warning(f"{error_msg}")
+            # 如果是模型列表请求，尝试返回缓存
+            if path == MODEL_LIST_PATH and request.method == "GET":
+                cached_models = await get_models_from_cache()
+                if cached_models is not None:
+                    logger.info("返回缓存的模型列表")
+                    return JSONResponse(content=cached_models)
+            
+            # 直接异步发送唤醒请求，不等待结果
+            asyncio.create_task(wake_ollama())
+        else:
+            logger.warning(error_msg)
            
-        # 直接异步发送唤醒请求，不等待结果
-        asyncio.create_task(wake_ollama())
        return JSONResponse(
            status_code=503,
-            content={"message": "服务器正在唤醒中，请稍后重试"}
+            content={"message": f"{error_msg}，请稍后重试"}
        )
    
    except httpx.RequestError as e:
        logger.error(f"请求错误: {str(e)}")
        # 如果是标签列表请求，尝试返回缓存
-        if path == "api/tags" and request.method == "GET":
+        if path == MODEL_LIST_PATH and request.method == "GET":
            cached_models = await get_models_from_cache()
            if cached_models is not None:
                logger.info("返回缓存的标签列表")
@@ -259,7 +279,7 @@ async def proxy(request: Request, path: str):
                
        return JSONResponse(
            status_code=502,
-            content={"message": f"无法连接到Ollama服务器: {str(e)}"}
+            content={"message": f"无法连接到服务器: {str(e)}"}
        )
            
    except Exception as e:
@@ -269,6 +289,20 @@ async def proxy(request: Request, path: str):
            content={"message": f"代理请求失败: {str(e)}"}
        )

+# 输出当前配置
+logger.info(f"使用配置:")
+logger.info(f"服务器类型: {server_type}")
+logger.info(f"BASE_URL: {BASE_URL}")
+if WAKE_URL:
+    logger.info(f"WAKE_URL: {WAKE_URL}")
+    logger.info(f"WAKE_INTERVAL: {WAKE_INTERVAL} minutes")
+else:
+    logger.info("未配置唤醒功能")
+logger.info(f"TIMEOUT_SECONDS: {TIMEOUT_SECONDS}")
+logger.info(f"MODEL_TIMEOUT_SECONDS: {MODEL_TIMEOUT_SECONDS}")
+logger.info(f"PORT: {PORT}")
+logger.info(f"CACHE_DURATION: {CACHE_DURATION} minutes")
+
 if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=PORT) 
--- a/ollama_proxy_docker_TestVerBuilder.ps1
+++ b/ollama_proxy_docker_TestVerBuilder.ps1
@@ -0,0 +1,107 @@
+# Set-ExecutionPolicy RemoteSigned -Scope CurrentUser
+
+# 检查是否以管理员权限运行
+if (-NOT ([Security.Principal.WindowsPrincipal][Security.Principal.WindowsIdentity]::GetCurrent()).IsInRole([Security.Principal.WindowsBuiltInRole] "Administrator")) {
+    # 请求管理员权限
+    Start-Process powershell -ArgumentList "-NoProfile -ExecutionPolicy Bypass -File `"$PSCommandPath`"" -Verb RunAs
+    exit
+}
+
+# 检查 Docker 是否已安装并可用
+$dockerPath = Get-Command docker -ErrorAction SilentlyContinue
+if (-not $dockerPath) {
+    Write-Host "未找到 Docker 命令。请检查：" -ForegroundColor Red
+    Write-Host "1. Docker Desktop 是否已安装" -ForegroundColor Yellow
+    Write-Host "2. Docker Desktop 是否正在运行" -ForegroundColor Yellow
+    Write-Host "3. 环境变量是否正确设置" -ForegroundColor Yellow
+    Write-Host "`n典型的 Docker 安装路径为：C:\Program Files\Docker\Docker\resources\bin" -ForegroundColor Yellow
+    Write-Host "您可能需要将此路径添加到系统的 PATH 环境变量中" -ForegroundColor Yellow
+    
+    $response = Read-Host "是否要打开系统环境变量设置？(Y/N)"
+    if ($response -eq 'Y' -or $response -eq 'y') {
+        Start-Process "SystemPropertiesAdvanced.exe"
+    }
+    exit
+}
+
+# 检查 Docker 服务是否运行
+try {
+    $dockerVersion = docker version
+    if ($LASTEXITCODE -ne 0) {
+        throw "Docker 服务未运行"
+    }
+} catch {
+    Write-Host "Docker 服务似乎没有正常运行。请检查：" -ForegroundColor Red
+    Write-Host "1. Docker Desktop 是否已启动" -ForegroundColor Yellow
+    Write-Host "2. 等待 Docker Desktop 完全启动" -ForegroundColor Yellow
+    exit
+}
+
+# 切换到脚本所在目录
+Set-Location $PSScriptRoot
+Write-Host "当前目录已切换为脚本所在目录: $PSScriptRoot"
+
+# 获取当前日期和时间
+$dateTime = Get-Date -Format "yyyyMMdd"
+Write-Host "当前日期: $dateTime"
+
+# 提示输入并获取版本号最后一位
+$revision = Read-Host -Prompt "请输入Test版本号 ($dateTime,如果没有次数，请直接回车)"
+Write-Host "输入的版本号: $revision"
+
+# 构造版本号
+if ([string]::IsNullOrWhiteSpace($revision)) {
+    $version = "$dateTime"
+} else {
+    $version = "$dateTime" + "Test_$revision"
+}
+Write-Host "完整的版本号: $version"
+
+# 构建带完整版本号标签的 Docker 镜像
+Write-Host "正在构建 Docker 镜像..."
+$tempFileBuild = [System.IO.Path]::GetTempFileName()
+docker build -t yshtcn/ollama-proxy:$version . 2> $tempFileBuild
+
+if ($LASTEXITCODE -ne 0) {
+    Write-Host "Docker 镜像构建失败" -ForegroundColor Red
+    Write-Host (Get-Content $tempFileBuild) -ForegroundColor Red
+    Remove-Item $tempFileBuild
+    exit
+}
+Write-Host "Docker 镜像构建成功"
+Remove-Item $tempFileBuild
+
+# 推送带完整版本号标签的 Docker 镜像到 Docker Hub
+Write-Host "正在推送 Docker 镜像到 Docker Hub..."
+$tempFilePush = [System.IO.Path]::GetTempFileName()
+docker push yshtcn/ollama-proxy:$version 2> $tempFilePush
+
+if ($LASTEXITCODE -ne 0) {
+    Write-Host "Docker 镜像推送失败" -ForegroundColor Red
+    Write-Host (Get-Content $tempFilePush) -ForegroundColor Red
+    Remove-Item $tempFilePush
+    exit
+}
+Write-Host "Docker 镜像推送成功"
+Remove-Item $tempFilePush
+
+# 为镜像打上 'latest' 标签并推送
+Write-Host "正在为镜像打上 'test' 标签并推送..."
+$tempFilePushLatest = [System.IO.Path]::GetTempFileName()
+docker tag yshtcn/ollama-proxy:$version yshtcn/ollama-proxy:test
+docker push yshtcn/ollama-proxy:test 2> $tempFilePushLatest
+
+if ($LASTEXITCODE -ne 0) {
+    Write-Host "Docker 镜像 'test' 标签推送失败" -ForegroundColor Red
+    Write-Host (Get-Content $tempFilePushLatest) -ForegroundColor Red
+    Remove-Item $tempFilePushLatest
+    exit
+}
+Write-Host "Docker 镜像 'test' 标签推送成功"
+Remove-Item $tempFilePushLatest
+
+Write-Host "Docker 镜像构建和推送全部完成" 
+
+# 等待用户确认后再关闭
+Write-Host "`n按回车键退出..." -ForegroundColor Green
+$null = Read-Host