也是时候给 AI 找个好嗓子了
最近我一直在折腾本地大模型,想给自己做一个语音助手。虽然 LLM 的回复已经很智能了,但一旦到了“开口说话”的环节,体验往往就断崖式下跌。我试过传统的 pyttsx3,也用过 Google 的 TTS,说实话,那种浓浓的“机器味”很容易让人出戏。
我一直想要这样一个工具:它的声音必须足够自然,要有呼吸感,不能像念经一样平铺直叙;其次,如果能复刻我自己的声音,或者某些特定的音色,那就更完美了。
前段时间刷 GitHub 偶然发现了 Fish Audio,体验了一下它的 Demo,当时就被惊艳到了。它不仅语调自然,而且反
Read more ...
screen.garden:让 Obsidian 拥有 Google Docs 般的实时协作体验
之前我介绍过 Fast Note Sync,这是一款开源的 Obsidian 笔记同步方案,可以实现多设备之间的笔记同步和实时协作。Fast Note Sync 的优势在于完全开源、数据自主可控,但它有一个门槛——你需要自己搭建和维护服务器。对于有技术背景并且享受折腾的朋友来说这不是问题,但如果你不想操心服务器的事情,或者团队里有非技术背景的成员,那么一个开箱即用的托管服务可能是更好的选择。这就是我今天要介绍的 screen.garden,一个为 Obsidian 设计的付费实时协作服务。
Clawdbot 深度调研:打造完全属于自己的全平台 AI 助手
最近在折腾各种 AI 工具的时候,发现了一个有意思的现象:市面上大部分 AI 助手要么被牢牢绑定在某个特定平台上(比如只能在 Discord 里用的机器人),要么就是完全依赖某家公司的 SaaS 服务,你的对话数据都在别人的服务器上。作为一个对隐私比较在意的人,我一直在想,能不能有一个完全由自己掌控、可以在所有常用聊天软件里使用的 AI 助手呢?直到我在 GitHub 上发现了 [[Clawdbot]] 这个项目,才发现原来真的有人在认真解决这个问题。
推荐我使用的 Agent Skills
随着 AI 编程助手的快速发展,[[Claude Code]]、[[Codex]]、[[Gemini CLI]] 等工具已经成为开发者日常工作中不可或缺的伙伴。然而,这些工具的默认功能往往只是冰山一角。通过安装和配置 Agent Skills,我们可以大幅扩展这些 AI 助手的能力,让它们更加智能、更加专业。
Antigravity Agent Skills 功能介绍与实战指南
2026 年 1 月 14 日,[[Google]] 为其 AI 驱动的开发工具 [[Antigravity]] 推出了 Agent Skills 功能。这个开放标准的技能系统让开发者可以将专业知识打包成可复用的技能包,极大地扩展了 AI 智能体的能力边界。