| # VoiceDialogue 安装指南 | |
| 本文档提供 VoiceDialogue 智能语音对话系统的详细安装说明。 | |
| ## 系统要求 | |
| 在开始安装之前,请确保您的系统满足以下要求: | |
| - **操作系统**: macOS 14+ (推荐) | |
| - **Python 版本**: 3.9 或更高版本 | |
| - **内存要求**: 至少 16GB RAM (推荐 32GB 用于大模型) | |
| - **存储空间**: 至少 20GB 可用空间 (用于模型文件) | |
| ## 安装步骤 | |
| ### 1. 克隆项目 | |
| ```bash | |
| git clone https://huggingface.co/MoYoYoTech/VoiceDialogue | |
| cd VoiceDialogue | |
| ``` | |
| ### 2. 创建并激活虚拟环境 | |
| 建议使用虚拟环境来避免依赖冲突: | |
| ```bash | |
| # 使用 uv (推荐) | |
| pip install uv | |
| uv venv | |
| source .venv/bin/activate | |
| # 或使用 conda | |
| conda create -n voicedialogue python=3.11 | |
| conda activate voicedialogue | |
| # 或使用 venv | |
| python -m venv voicedialogue | |
| source voicedialogue/bin/activate | |
| ``` | |
| ### 3. 安装项目依赖 | |
| ```bash | |
| # 使用 uv (推荐) | |
| WHISPER_COREML=1 CMAKE_ARGS="-DGGML_METAL=on" uv sync | |
| # 或使用 pip | |
| WHISPER_COREML=1 CMAKE_ARGS="-DGGML_METAL=on" pip install -r requirements.txt | |
| ``` | |
| ### 4. 安装音频处理工具 | |
| ```bash | |
| # macOS | |
| brew install ffmpeg | |
| ``` | |
| ### 5. 安装额外依赖 | |
| ```bash | |
| # 安装 kokoro-onnx | |
| uv pip install kokoro-onnx | |
| # 或 | |
| pip install kokoro-onnx | |
| # 重新安装指定版本的 numpy | |
| uv pip install numpy==1.26.4 | |
| # 或 | |
| pip install numpy==1.26.4 | |
| ``` | |
| ## 验证安装 | |
| 安装完成后,可以通过以下命令验证安装是否成功: | |
| ```bash | |
| # 查看帮助信息 | |
| python main.py --help | |
| # 启动系统(默认使用中文,沈逸角色) | |
| python main.py | |
| ``` | |
| 如果看到 "服务启动成功" 提示,说明安装成功。 | |
| ## 故障排除 | |
| ### 1. 模型下载失败 | |
| - **问题**: 网络连接超时或模型下载失败。 | |
| - **解决方案**: 设置 Hugging Face 镜像。 | |
| ```bash | |
| export HF_ENDPOINT=https://hf-mirror.com | |
| pip install -U huggingface_hub | |
| ``` | |
| ### 2. 音频设备问题 | |
| - **问题**: 找不到音频设备或权限被拒绝。 | |
| - **macOS 解决方案**: 系统设置 → 隐私与安全性 → 麦克风 → 启用你的终端应用 (如 iTerm, Terminal)。 | |
| ### 3. 内存不足错误 (OOM) | |
| - **问题**: `CUDA out of memory` 或 RAM 不足。 | |
| - **解决方案**: LLM 是主要的内存消耗者。你可以通过修改 `src/VoiceDialogue/services/text/generator.py` 来降低资源消耗: | |
| - **更换模型**: 将模型路径指向一个更小的模型(如 7B Q4 量化模型)。 | |
| - **减少批处理大小**: 减小模型参数中的 `n_batch` 值(如 `256`)。 | |
| - **减少上下文长度**: 减小 `n_ctx` 的值(如 `1024`)。 | |
| ### 4. 依赖包冲突 | |
| - **问题**: 包版本冲突或导入错误。 | |
| - **解决方案**: 强烈建议在虚拟环境中安装。如果遇到问题,尝试重建虚拟环境。 | |
| ```bash | |
| # 使用 conda | |
| conda deactivate | |
| conda env remove -n voicedialogue | |
| # 使用 uv | |
| rm -rf .venv | |
| uv venv | |
| ``` | |
| ### 5. FFmpeg 相关错误 | |
| - **问题**: 音频处理失败或编解码错误。 | |
| - **解决方案**: 确保正确安装 FFmpeg: | |
| ```bash | |
| # 检查 FFmpeg 安装 | |
| ffmpeg -version | |
| # 重新安装 FFmpeg | |
| # macOS | |
| brew reinstall ffmpeg | |
| ``` | |
| ### 6. Python 版本兼容性 | |
| - **问题**: Python 版本过低导致的兼容性问题。 | |
| - **解决方案**: 确保使用 Python 3.11+ 版本: | |
| ```bash | |
| python --version | |
| # 如果版本过低,请升级或使用虚拟环境 | |
| ``` | |
| ## 下一步 | |
| 安装完成后,您可以: | |
| 1. [查看使用指南](../README.md#🖥️-应用模式) 了解如何使用系统 | |
| 2. [查看配置选项](../README.md#⚙️-配置选项) 了解如何自定义配置 | |
| 3. [查看系统架构](../README.md#🔧-系统架构) 了解系统工作原理 | |
| 如果遇到其他问题,请查看 [完整故障排除指南](../README.md#🛠️-故障排除) 或提交 Issue。 |