Fish Audio Python SDK 体验:下一代高质量 TTS 与声音克隆利器

也是时候给 AI 找个好嗓子了 最近我一直在折腾本地大模型,想给自己做一个语音助手。虽然 LLM 的回复已经很智能了,但一旦到了“开口说话”的环节,体验往往就断崖式下跌。我试过传统的 pyttsx3,也用过 Google 的 TTS,说实话,那种浓浓的“机器味”很容易让人出戏。 我一直想要这样一个工具:它的声音必须足够自然,要有呼吸感,不能像念经一样平铺直叙;其次,如果能复刻我自己的声音,或者某些特定的音色,那就更完美了。 前段时间刷 GitHub 偶然发现了 Fish Audio,体验了一下它的 Demo,当时就被惊艳到了。它不仅语调自然,而且反 Read more ...


Kubernetes 多集群管理指南:使用 kubectx 优雅切换 Kubeconfig

1. 哪怕只有两个集群,你也该换种活法 最近在整理我的 Kubernetes 运维环境,发现随着手头项目的增多,我需要管理的集群数量也在蹭蹭往上涨。 以前只有一个测试环境和一个生产环境时,我还在傻傻地用 kubectl --kubeconfig=./prod.yaml 这样的命令,或者在终端里疯狂地敲 export KUBECONFIG=...。 直到有一天,我在一次紧急排查问题时,因为忘记切换环境变量,差点把测试环境的配置应用到了生产环境(还好我是个胆小鬼,回车前多看了一眼)。那一刻我意识到,必须得有一个更安全、更直观、更高效的方式来管理这些“乱七 Read more ...


让 AI 联网:Serper 极速 Google 搜索 API 使用指南

最近我在折腾一个基于 LangChain 的 AI 助手时,遇到了一个老生常谈的问题:怎么让大模型获取最新的实时信息? 虽然 ChatGPT 已经很强大了,但它的知识库永远是滞后的。当你问它”昨天发布的 iPhone 16 也是 60Hz 屏幕吗?”(假设场景),它大概率会一本正经地告诉你它不知道。为了解决这个问题,我们需要给 AI 装上”眼睛”,也就是联网搜索的能力。 我之前一直用 SerpApi,功能确实强大,覆盖了各大搜索引擎。但是,当我开始构建需要频繁调用搜索的 Agent 时,SerpApi 的响应速度(有时候需要 3-5 秒)和价格让我开 Read more ...


CopilotKit:让你的 React 应用 10 分钟拥有上下文感知的 AI Copilot

最近我一直在思考一个问题:为什么我们现在的很多应用里的 AI “助手”还是那么”笨”? 你可能也有这种体验:你在一个 SaaS 平台上操作复杂的报表,遇到问题点开右下角的 AI 客服,问它”为什么我的数据对不上?”,它通常会礼貌地回复你一段通用的帮助文档,或者干脆让你去读手册。它不知道你当前看的是哪张表,不知道你选了什么筛选条件,更不知道你刚刚进行了什么操作。 这种割裂感让我非常难受。我们想要的不是一个挂在网页旁边的 ChatGPT 网页版,而是一个真正”住”在应用里的、能看见我所见、能帮我操作的 Copilot(副驾驶)。 前段时间我发现了一个非 Read more ...


Canon TS3330 打印机无法打印红色的修复经历

昨天下午,我正准备复印一下彩色的证件(在留卡),结果打印机吐出来的纸让我愣了一下——原本应该是鲜艳红色的印章和纹样部分全部变成了诡异的绿色,整个画面色调严重偏冷。我的第一反应是:难道墨水用完了? 但我明明记得刚换不久。这台 Canon TS3330 已经陪伴我有一段时间了,一直兢兢业业,这次的突发状况让我不得不停下来好好给它做个”体检”。经过一番搜索和折腾,问题终于解决了。我发现这似乎是喷墨打印机一个比较常见的问题,所以决定把这次的排查和修复过程记录下来,希望能帮到遇到同样问题的朋友。 为什么会出现”红去绿来”? 其实原理很简单。彩色打印机通常使用 Read more ...


Mintlify: 让文档像代码一样优雅

写代码久了,我发现一个有趣的现象:程序员最讨厌两件事,一是别人的代码没有文档,二是自己写文档。 这听起来像个段子,但确实是很多团队的痛点。我之前为了维护个人项目和开源工具的文档,折腾过不少方案。从最早的 Hexo/Jekyll 配合 GitHub Pages,到后来为了省事直接用 GitBook,再到为了定制化折腾 Docusaurus。虽然都能用,但总感觉缺了点什么——要么是配置太繁琐,写个文档得先学前端;要么是界面太陈旧,配不上精心写的代码。 直到最近,我遇到了 Mintlify。有一种”这就是我一直在找的那个工具”的感觉。现在很多开源项目使用的 Read more ...


Google Code Wiki:让 GitHub 仓库秒变代码百科全书

之前 Devin 团队推出了一款 DeepWiki 的网站,可以用来解释 GitHub 的代码仓库。今天偶然发现 Google 也推出了类似的产品,叫做 Code Wiki。 当我们去接受一个新的开源项目的时候,最痛苦的莫过于如何开始阅读代码和理解整个代码仓库的架构,对于一些 README 编写得比较好的仓库,我们可能还能手把手地将项目在本地跑起来。但是,如果对于一个文档缺失、变更严重滞后的一些开源项目,可能很大一部分的知识还停留在一些项目成员的大脑,或者是最初的落后的文档当中。那这个时候我们去阅读代码的时候,可能不知道如何下手。 DeepWiki Read more ...


Typeless: 又一款 macOS 上的 AI 语音输入利器

看过我博客的人会发现,我在这半年的时间里面体验了非常多的语音转文字工具,可以说,这样的工具极大地提升了我的生产效率。不仅搭配 Obsidian 可以更快地写笔记,搭配 Claude Code 等编程工具也可以让我更快地输入提示词。体验到后面,遇到类似的产品,我一般也不会单独地出一篇文章,但是今天体验完了 Typeless,我觉得它值得写一篇文章,单独介绍一下。 Typeless是一款专为 macOS 设计的 AI 语音输入工具,试用下来感觉非常不错。首先,Typeless 的新手入门流程,做的就是我所有体验过的产品当中最简洁、最完善的。一般来说,工具都 Read more ...

2025-12-04 AI , Mac , Dictation , Productivity , Tool

FlyClash:一款高颜值的 Clash Meta 安卓客户端新选择

也是为了”颜值”买单 自从 Clash for Android (CFA) 的原作者删库停更之后,Android 平台上的代理工具虽然没有到”至暗时刻”,但也确实经历了一段迷茫期。虽然我们都知道,内核才是关键,界面只是皮囊,但作为每天都要打开好几次的 App,谁不想让它长得更好看一点呢? 这半年多来,我主要在使用 Clash Meta for Android (CMFA)。它不仅继承了 CFA 的衣钵,更重要的是跟进使用了 Mihomo (原 Clash Meta) 内核,协议支持全,功能极其强大。但是,不得不说,CMFA 的界面设计还是充满了浓浓的 Read more ...


QM-MUSIC:打造属于你的私有云音乐服务器

QM-Music 是一个基于 Subsonic 协议构建的开源私有云音乐服务器,专为音乐爱好者设计。它以轻量、高效、全平台兼容为核心特点,让用户能够轻松搭建属于自己的音乐流媒体服务。 之前总结过一篇文章如何使用 Navidrome 搭建在线音乐库,我自己使用下来几年也非常稳定,但 Navidrome 的交互界面有一些老旧,并且我有一个挺常用的,网页随机播放功能支持不是很完善,今天刚好看到 QM Music,交互页面非常友好,所以安装用用。 我自己会在本地使用 Musiver 原名音流来串流音乐。 核心亮点 极致轻量与高性能: Read more ...

2025-12-03 music , server , self-hosted , docker , subsonic

最近文章

  • screen.garden:让 Obsidian 拥有 Google Docs 般的实时协作体验 之前我介绍过 Fast Note Sync,这是一款开源的 Obsidian 笔记同步方案,可以实现多设备之间的笔记同步和实时协作。Fast Note Sync 的优势在于完全开源、数据自主可控,但它有一个门槛——你需要自己搭建和维护服务器。对于有技术背景并且享受折腾的朋友来说这不是问题,但如果你不想操心服务器的事情,或者团队里有非技术背景的成员,那么一个开箱即用的托管服务可能是更好的选择。这就是我今天要介绍的 screen.garden,一个为 Obsidian 设计的付费实时协作服务。
  • Clawdbot 深度调研:打造完全属于自己的全平台 AI 助手 最近在折腾各种 AI 工具的时候,发现了一个有意思的现象:市面上大部分 AI 助手要么被牢牢绑定在某个特定平台上(比如只能在 Discord 里用的机器人),要么就是完全依赖某家公司的 SaaS 服务,你的对话数据都在别人的服务器上。作为一个对隐私比较在意的人,我一直在想,能不能有一个完全由自己掌控、可以在所有常用聊天软件里使用的 AI 助手呢?直到我在 GitHub 上发现了 [[Clawdbot]] 这个项目,才发现原来真的有人在认真解决这个问题。
  • 推荐我使用的 Agent Skills 随着 AI 编程助手的快速发展,[[Claude Code]]、[[Codex]]、[[Gemini CLI]] 等工具已经成为开发者日常工作中不可或缺的伙伴。然而,这些工具的默认功能往往只是冰山一角。通过安装和配置 Agent Skills,我们可以大幅扩展这些 AI 助手的能力,让它们更加智能、更加专业。
  • Antigravity Agent Skills 功能介绍与实战指南 2026 年 1 月 14 日,[[Google]] 为其 AI 驱动的开发工具 [[Antigravity]] 推出了 Agent Skills 功能。这个开放标准的技能系统让开发者可以将专业知识打包成可复用的技能包,极大地扩展了 AI 智能体的能力边界。
  • Gemini CLI Agent Skills 功能介绍与上手指南 [[Gemini CLI]] 最近推出了一个非常强大的新功能,名为 [[Agent Skills]]。这个功能极大地扩展了命令行 AI 助手的边界,允许用户根据自己的需求定制专业的技能包。