Wispr Flow 是一款专为 Mac 设计的革命性 AI 语音听写工具,致力于彻底改变用户的文本输入方式。这款软件不仅仅是简单的语音转文字工具,更是一个智能化的语音助手,能够将用户的自然语音转化为高质量、格式完美的文本。自 2024 年 10 月发布 Mac 版本以来,Wispr Flow 已经展现出惊人的市场表现。

虽然我是最近才开始使用 Wispr Flow, 但是我查看了一下我自己的 Obsidian 笔记, 发现在 2024 年就已经写下了关于 Wispr Flow 相关的内容。

视频测评 Bilibili YouTube

核心功能

实时语音转文字

Wispr Flow 采用先进的 AI 技术,提供比传统打字快 4 倍的语音输入体验。通过按住 Fn 键即可启动语音输入功能,系统能够快速准确地将用户的语音转换为文本。目前产品已经实现 80%的”零编辑率”,这意味着大部分转录结果无需修改即可直接使用。

智能自动编辑功能

与传统语音识别软件不同,Wispr Flow 专注于理解用户的真实意图,而非机械地记录每个词汇。系统能够:

  • 自动去除填充词(如”嗯”、”呃”等)
  • 智能纠正语法和拼写错误
  • 根据上下文调整文本结构和格式
  • 处理语音中的临时修改,如”5 点见面,不,改为 6 点”

多语言支持

Wispr Flow 支持 100+种语言,其中英语占 40%的使用量,其余 60%涵盖西班牙语、法语、德语、荷兰语、印地语和中文等主要语种。系统提供自动语言检测功能,方便多语言用户无缝切换。

AI 命令模式

Pro 版本提供强大的 AI 命令模式,允许用户通过语音指令直接操作文档或查询信息。用户可以使用诸如”添加一行”、”删除该行”等语音命令进行文本编辑。

上下文感知技术

系统能够分析活动应用程序和屏幕内容的上下文,根据不同应用场景自动调整文本的语调和格式。例如,在邮件应用中会采用商务风格,在即时消息中则更加随意。

个性化词汇库

Wispr Flow 能够学习用户说话的习惯、专业术语和个人偏好,建立个人词典,提高识别准确度。 这种个性化的体现不仅体现在词汇的识别度上,更体现在写作风格的适应性上。

定价模式

Wispr Flow 采用分层订阅模式:

版本 价格 主要功能
Basic (基础版) 免费 每周 2000 字限制、快速语音输入、100+语言支持、个人词典
Pro (专业版) $12/月 无限字数、AI 命令模式、优先功能请求、新功能抢先体验
Teams (团队版) $10/月/人 包含 Pro 功能、最少 3 个席位、集中管理、共享词典
Enterprise (企业版) 定制报价 SOC2 Type II 合规、HIPAA 就绪、零数据保留

Wispr Flow 的技术创新主要体现在从传统的”单词错误率”优化转向”零编辑率”优化。不是机械转录用户说的每个词,而是理解用户的真实意图,生成可直接使用的高质量文本。

相比 OpenAI Whisper 等传统语音识别工具,Wispr Flow 在格式化输出和上下文理解方面表现更为出色。特别是在处理口语化表达转书面语、情境感知调整等方面显示出明显优势。

  • [[Spokenly]]
  • [[Whispering]]
  • [[superwhisper]]