這篇文章將詳細介紹如何安裝和使用基於 Gradio 的 Browser-use Web UI。Browser-use 是一個旨在讓 AI 代理能夠存取網站的專案,而 Web UI 則提供了一個使用者友善的介面來與瀏覽器代理互動。
專案特色
- WebUI: 基於 Gradio 建構,支援 Browser-use 的大部分功能,提供使用者友善的介面。
- 擴展的 LLM 支援: 整合了多種大型語言模型 (LLM),包括 Google、OpenAI、Azure OpenAI、Anthropic、DeepSeek、Ollama 等,並計劃未來支援更多模型。
- 自訂瀏覽器支援: 允許使用自己的瀏覽器,無需重新登入網站或處理其他身份驗證問題。此功能還支援高畫質螢幕錄影。
- 持久性瀏覽器會話: 可以選擇在 AI 任務之間保持瀏覽器視窗開啟,以便查看 AI 互動的完整歷史記錄和狀態。
安裝指南
有兩種安裝 Browser-use Web UI 的方法:本地安裝和 Docker 安裝。
選項 1: 本地安裝
請參閱 快速入門指南 或按照以下步驟進行。
步驟 1: 克隆儲存庫
開啟終端機並執行以下命令:
git clone https://github.com/browser-use/web-ui.git
cd web-ui
步驟 2: 設定 Python 環境
建議使用 uv 來管理 Python 環境。
使用 uv (推薦):
uv venv --python 3.11
啟動虛擬環境:
- Windows (命令提示字元):
.venv\Scripts\activate
- Windows (PowerShell):
.\\.venv\\Scripts\\Activate.ps1
- macOS/Linux:
source .venv/bin/activate
步驟 3: 安裝依賴項
安裝 Python 套件:
uv pip install -r requirements.txt
在 playwright 中安裝瀏覽器。
playwright install --with-deps
或者您可以執行以下命令安裝特定的瀏覽器:
playwright install chromium --with-deps
步驟 4: 配置環境
- 複製範例環境檔案:
- Windows (命令提示字元):
copy .env.example .env
- macOS/Linux/Windows (PowerShell):
cp .env.example .env
- Windows (命令提示字元):
- 使用您偏好的文字編輯器開啟
.env
檔案,並新增您的 API 金鑰和其他設定。
步驟 5: 享受 web-ui
- 運行 WebUI:
python webui.py --ip 127.0.0.1 --port 7788
- 存取 WebUI: 開啟您的網頁瀏覽器並導航至
http://127.0.0.1:7788
。 - 使用您自己的瀏覽器 (可選):
- 將
BROWSER_PATH
設定為您瀏覽器的可執行檔路徑,將BROWSER_USER_DATA
設定為您瀏覽器的使用者資料目錄。如果您想使用本地使用者資料,請將BROWSER_USER_DATA
留空。- Windows
BROWSER_PATH="C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe" BROWSER_USER_DATA="C:\\Users\\YourUsername\\AppData\\Local\\Google\\Chrome\\User Data"
注意: 在 Windows 系統上,將
YourUsername
替換為您的實際 Windows 使用者名稱。 - Mac
BROWSER_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" BROWSER_USER_DATA="/Users/YourUsername/Library/Application Support/Google/Chrome"
- Windows
- 關閉所有 Chrome 視窗。
- 在非 Chrome 瀏覽器 (例如 Firefox 或 Edge) 中開啟 WebUI。這很重要,因為持久性瀏覽器上下文將在運行代理時使用 Chrome 資料。
- 在瀏覽器設定中勾選「使用自己的瀏覽器」選項。
- 將
選項 2: Docker 安裝
先決條件
- 已安裝 Docker 和 Docker Compose
- Docker Desktop (適用於 Windows/macOS)
- Docker Engine 和 Docker Compose (適用於 Linux)
步驟 1: 克隆儲存庫
開啟終端機並執行以下命令:
git clone https://github.com/browser-use/web-ui.git
cd web-ui
步驟 2: 配置環境
- 複製範例環境檔案:
- Windows (命令提示字元):
copy .env.example .env
- macOS/Linux/Windows (PowerShell):
cp .env.example .env
- Windows (命令提示字元):
- 使用您偏好的文字編輯器開啟
.env
檔案,並新增您的 API 金鑰和其他設定。
步驟 3: Docker 建置和運行
docker compose up --build
對於 ARM64 系統 (例如 Apple Silicon Macs),請運行以下命令:
TARGETPLATFORM=linux/arm64 docker compose up --build
步驟 4: 享受 web-ui 和 vnc
- Web-UI: 在您的瀏覽器中開啟
http://localhost:7788
- VNC Viewer (用於觀看瀏覽器互動): 開啟
http://localhost:6080/vnc.html
- 預設 VNC 密碼: “youvncpassword”
- 可以透過在
.env
檔案中設定VNC_PASSWORD
來更改
影片教學演示
感謝 @richard-devbot。發布了影片教學演示。