在 AI 时代,我们大量的交互对象都是 AI,询问 ChatGPT ,让 Gemini 3 生成图片,给 Claude Code 代码编写的说明等等,输入的速度已经成为了衡量工作效率的重要指标,在过去的几年当中,我也成功地将自己的输入习惯从全拼变成了双拼。而即使这样,传统的输入速度依然只有 40 到 60 字每分钟,即使受过专业训练,也很难达到每分钟 80 到 100 字。这样的输入速度显然达不到我们直接用语言交流沟通的速度,更比不上我们思考的速度。想象一下,当我们有了灵感,却要花费大量的时间来敲键盘,我想这可能是很多文字工作者都会面临的问题。

在过去的很多博客文章当中,我一直都在探寻一个比较好的语音输入的应用。我介绍过 Aqua VoiceSpokenlyVoicenotesEmoteDinoxWispr FlowWhispering 等等,还有好几个应用,我觉得已经介绍够多了。所以我自己在尝试之后感觉没有亮点也就没有编写文章分享。但今天要分享的这一款闪电说是在体验了上述所有的语音转文字应用之后还需要分享的。上面的大部分应用只有少部分使用了本地的离线 Whisper 模型,绝大部分还需要依赖于服务器。即使 Wispr Flow 宣传的时候就主打速度,但是在使用上也依然能感受到一点点延迟。而今天要介绍的闪电说,可以轻松的让我们每分钟的输入速度达到 200 字,并且凭借离线的 AI 模型,实现了毫秒级的响应。

什么是闪电说?

闪电说,在之前还有一个名字叫做代体,它主打的是一个离线的语音输入。本地模型使用了阿里巴巴达摩院发布的 [[SenseVoice]],它主要使用本地的语音输入和传统的基于云端的语音识别方案不同。闪电说,语音识别直接在用户设备上完成,响应时间仅需要 0.2 秒。而其他传统的语音转文字工具,输入之后可能通常需要耗时 1 到 3 秒。

这种看似细微的时间差异,实际上大大的提升了用户的体验,当说话声音还没有落下时,文字就已经出现在了屏幕上面,真正的做到了「即说即显」的体验。这种离线的模型还带来另外一个好处,就是在没有网络连接的环境下面,闪电说依然可以正常的工作。我觉得这一能力需要归功于阿里巴巴的本地模型。

闪电说另外一大重要的功能就是当用户使用口语化的说话方式时,闪电说可以配置 AI 引擎,自动理解语义,并且用户可以自定义提示词语音转文字之后,通过 AI 的总结,可以使得文字更加专业、更加准确。

安装

闪电说下载非常简单。访问官方网站,根据你的操作系统选择对应版本直接下载。 安装过程和任何其他软件一样简单直观。​

首次打开闪电说时,软件会自动下载一个 AI 语音识别模型。这个下载过程对于初次使用来说是必需的,但好处是一次下载之后,你可以完全离线使用这款工具,无需再次联网调用模型。

tEF3pgx-FG

下载完成之后,我们可以配置自己的语音输入快捷键。在默认的情况下面,闪电说可以使用 Fn 键作为启用语音转文字的快捷键。当我们需要语音转文字时,只需要按下 Fn 键就可以。

闪电说提供了两种输入模式,手动模式,可以按住快捷键说话,松开快捷键停止录音,并立即转成文字。另外一种方式是自由说话模式,启动之后可以连续说话,不用一直按住快捷键,特别适合需要输入大量文字的场景。

闪电说还提供了自定义词典功能,可以将一些常用的词条、专业术语或特定的名词添加到个人词典中。这样在后续的语音输入中,当收到词条时,闪电说能够正确的识别并输出相应的文字,大大的提高了识别准确率。

Lxu9xXBX2N

一些使用技巧

闪电说,最直接的应用场景就是日常办公,无论是在企业即时通讯软件中,还是在电子邮件编写邮件正文时,都可以非常快速的按下快捷键进行语音转文字。

另外,需要大量创建文本内容的工作,比如说撰写报告、文章、博客、闪电说都表现出了非常巨大的优势。当不再受限于键盘的输入速度时,你的思维就可以更流畅的进行表达。这对于文章编写新闻记者、技术文当撰写者来说,是一个生产力的巨大提升。

AI 编程和代码生成

在如今 AI 时代来说,我们可以直接在 Claude Code,Gemini CLI 或者是 Codex,ChatGPT 等 AI 编程工具当中结合使用。我们可以直接使用自然语言描述编成需求。闪电说会将我们的自然语言转换成文本指令。在面向这样一些编程工具的时候,我们可以像描述想法一样,向 AI 描述需求。

AI 文本纠错

闪电说还自带了一个 AI 文本纠错,在这里我们可以选择不同的 AI 模型对我们的文本内容进行纠错,比如火山引擎、OpenAI、智谱、DeepSeek、通义千问、Kimi(月之暗面)或者是 Ollama(本地模型)。我们只需要配置 1 个 API 密钥,就可以调用这些 AI 对我们的文字内容进行转写,从而进一步提升识别准确度。

crKzVRa_7s

整个 AI 纠错功能的实现流程是语音识别生成文字,然后闪电说会将生成的文本送给 AI 纠错,最终生成输出。

这个过程当中会自动识别以下的问题,语音识别中的错误、错别字缺失的标点符号、口语化表达的规范,句子结构等等。如果需要更具体的优化,我们可以自定义提示词。

所以这个地方也有一个小小的建议给闪电说,产品现在只能够自定义一段 prompt。但是如果我们有不同的场景需要使用语音转文本时,我们可以设置不同的提示词。比如说在一些商务邮件当中,我们可能需要我们的措辞更加正式。比如说在一些客服回复的场景,我们可能需要更口语化的表达。而现在的闪电说,我们只能够自定义一段提示词。

自动转成英文

正因为有了 AI 智能纠错的功能,我们可以自定义提示词。所以在有一些需要我们进行英文沟通的场景,比如说撰写英文的邮件,或者和外国的合作网伙伴聊天时,我们可以直接说中文,但是闪电说给我们自动输出英文来进一步提升输入效率。