DeepSeek 凭借其强大的逻辑推理和自然语言分析能力受到了众多用户的喜爱,有不少小伙伴好奇DeepSeek怎么开语音,遗憾的是DeepSeek本身不支持语音功能,我们需要通过一些妙的集成和工具的使用,使它具备简单的语音功能,一起来看看如何操作吧! 一、使用 VoiceWave Chrome 扩展 VoiceWave 是一款专为 DeepSeek 设计的 Chrome 扩展程序,它能够为 DeepSeek 赋予强大的语音功能,包括简单的对话。 1. 安装扩展程序:打开官方网站:https://voicewave.xyz/zh/voice-mode-for-deepseek/,选择对应您浏览器的版本下载并安装。 2. 配置语音模式设置:安装完成后,在 DeepSeek AI 输入字段附近找到 ⚙图标,点击进入配置界面。在这里,你可以设置语音识别语言、选择 TTS(文本转语音)语音,并自定义语音交互偏好。 3. 激活语音模式:要与 DeepSeek AI 开始语音聊天,可以通过点击图标或在输入字段外按 “X” 键来激活语音模式。完成讲话后释放键,DeepSeek AI 将使用你选择的文字转语音功能作出回应。 4. 重播特定消息 :当你需要重播或收听特定消息时,只需点击消息下方的扬声器 图标即可。 二、接入 Siri 实现语音输入与播报 如果你使用的是苹果设备,可以通过将 DeepSeek 接入 Siri 的方式,实现语音对话功能。 1. 创建快捷指令:在手机上打开 “快捷指令” APP,点击右上角的“+”新建快捷指令。在搜索框搜索“听写文本”,并将语言选择为中文。 2. 配置 API 请求:继续在搜索操作中选择“URL”,然后粘贴 DeepSeek 的官方 API 链接地址:https://api.deepseek.com/chat/completions 。接着在“获取 URL 内容”这一步,将方法由 GET 修改为 POST。 3. 设置头部信息:点击“头部”,添加新头部。键为Content-Type,文本为application/json 。再添加一个新头部,键为 Authorization,文本为Bearer + 之前复制的 DeepSeek 的 API Key(Bearer 和 API Key 之间有个空格)。 4. 构建请求体:在“获取 URL 内容”这一步的“请求体”下面,点击“添加新字段”,选择“数组”,键为 messages 。然后点击“0 项”,继续添加新字段,选择“词典”。在词典中,添加两个文本字段,键分别为role和content,role 的文本为user,content的文本为听写到的文本。 5. 指定模型:继续在“获取 URL 内容”这一步,点击“添加新字段”,选择“文本”,键为“model” ,文本为 “deepseek-chat`”。 6. 获取并播报回复 :搜索操作“获取词典值”,键为choices.1.message.content 。然后搜索操作“朗读文本”,最后点击右下方播放按钮进行测试,弹出的提示框中选择“始终允许”即可。 7. 添加快捷方式:长按刚才设置好的指令,选择“分享”可以编辑快捷指令的最终名称,自定图标的颜色图案,也可以选择照片,就比如我做了DeepSeek的图标,最后在桌面的效果看着就像个真的app。 8、使用方式:直接点击桌面的图标,然后说话;启动Siri,然后说“DeepSeek”(刚才设置的快捷指令名称),然后siri就会问你文本是什么?你就继续说你的问题,稍作等待,Siri就会DeepSeek返回的内容朗读出来。 三、本地部署语音对话系统 对于技术爱好者来说,还可以通过本地部署的方式来实现 DeepSeek 的语音对话功能。 1. 使用百聆开源助手 :百聆助手通过集成 FunASR 语音识别、DeepSeek-API 和 edge-tts 语音合成,实现了低延迟的语音对话。具体步骤包括:环境准备(克隆百聆项目代码并安装依赖包)、模型下载(下载 SenseVoice 语音识别模型)、安全配置(在配置文件中设置 DeepSeek API 密钥等信息)、启动服务(运行后端服务和语音交互脚本) 。 2. 使用 DeepSeek + 跨平台语音工具链 :此方案利用 Python 基础环境,通过 Vosk 离线语音识别引擎和 gTTS 语音合成工具,实现语音交互。具体步骤包括:安装依赖包(如 vosk、playsound 等)、初始化语音识别和 DeepSeek 客户端、实现语音输入和输出功能 。 四、使用第三方平台的语音播报功能 需要注意的是,目前第三方平台集成的DeepSeek暂时不支持语音对话功能,以下步骤仅为:打开语音输入,回答时自动播放答案。 1. 纳米AI搜索 下载安装:手机端、电脑端可直接通过浏览器搜索登录纳米AI搜索官网:https://www.n.cn/,进入页面后点击:深度思考按钮即可调用DeepSeek R1模型能力。 语音输入:点击聊天框内的“麦克风”按钮(电脑网页端)/点击聊天框左下角的“外放按钮”(手机APP端)即可语音输入。 语音播放:手机APP/电脑端提问后点击回答的左下角“朗读”按钮即可播放回答;手机APP端还可点击模型页面右上角的“播放按钮”,打开后会自动播放回答。 2. 腾讯元宝 下载安装:可以通过手机官方商店搜索腾讯元宝或通过浏览器打开腾讯元宝官网:https://yuanbao.tencent.com/下载腾讯元宝APP,注册登录后进入主界面。 语音输入:点击屏幕右下角“外放”按钮即可切换至语音输入,长按“按住说话”即可语音输入问题。 语音播放:点击屏幕左上角两条横杠/手机屏幕从左向右滑动即可打开边栏,点击边栏右下角的“设置”按钮,然后点击“自动播放语音”按钮,在输出答案时会自动播放。 通过以上几种方法,你就可以轻松地让 DeepSeek 实现语音对话功能,让你与人工智能的交互更加便捷和自然。 |