RAG 简介

什么是 RAG RAG 的全称是 Retrieval-Augmented Generation,中文通常翻译成「检索增强生成」,指的是对大语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源外的权威知识库。 RAG 是一种在大语言模型诞生之后为了提升大语言模型回答精确度的架构。 Retrieve,检索,用户 Query 调用搜索引擎 API, 获取搜索结果 Augmented,增强,设置提示词,将检索结果作为上下文 Generation 生成,大模型回答问题,标注引用来源 Generation 我们首先从 Genera Read more ...

2025-03-21 rag , llm , ai , vector-database , embedding , llm

Homerow 配置 macOS 全键盘操作

今天想要和大家分享一下一款非常有趣的应用,叫做 Homerow,他之前的名字叫做 vimac,是一款可以在 macOS 上实现全键盘操作的工具。 在 Chrome 里面,我一直在使用 Vimium,这一款插件几乎是 Chrome 的必备插件,它可以让我在完全没有鼠标的情况下浏览网页。 在之前我也介绍过一款叫做 Shortcat 的 macOS 效率工具,也是使用类似的概念,可以在 macOS 上实现所有元素的浮标,然后使用键盘来控制。更甚至之前我还尝试过 yabai 和 [[shkd]] 的方案,但是这些方案都或多或少存在一些问题,要不是就是比较卡, Read more ...


Exposed 学习笔记:表定义以及模式创建

之前的文章已经带领大家学习了解了 Exposed 是什么,有什么用途,本文将重点学习 Exposed 中如何定义数据表结构,并进行数据库 Schema 的创建和迁移。 文本将重点放在继承 Table 类来定义表,定义各种类型的列,以及相关的约束 primaryKey, unique, nullable 等,如何定义复合主键。 如何使用 SchemaUtils.create 来创建表,了解 SchemaUtils.drop 方法。 在生产环境,通常和 [[Flyway]] 或 [[Liquibase]] 等数据库迁移工具结合使用。 定义表 在 E Read more ...

2025-03-19 exposed , kotlin , orm , kotlin-orm , jetbrains

自动化运维工具 Puppet 介绍

Puppet 是一个开源的强大的基础设施配置管理工具,很早之前我介绍过一款 Python 编写的开源的自动化运维工具 Ansible,后面陆陆续续还分享过如何使用 Ansible 去管理 Contab,如何使用 Roles 来结构化并管理大量的 Ansible 配置。而今天要介绍的 Puppet 是另外一款运维自动化工具,被广泛用于自动化管理多个服务器配置。 相较于基于任务的 Ansible,Puppet 使用一种声明式描述语言,可以用来构建更复杂,更庞大的基础设施。 Puppet 使用客户端/服务器架构,使用 Master 和 Agent 架 Read more ...

2025-03-15 puppet , devops , ansible , terraform , linux

Gemini 2 的原生多模态图片生成

Google 今天发布了 Gemini 2.0 Flash 的多模态图像生成功能。 功能 文本到图像 生成一张东京塔和烟花的图像 文本到图像和文本 生成一份西班牙海鲜饭的图解食谱 文本和图像到文本和图像 带有一个装修房间的图像,什么颜色的沙发适合房间,更新图片 图片编辑 编辑图片,使其看上去更像日式卡通 猫的图像,枕头的图像,在这个枕头上创建猫的十字绣 Bilibil Read more ...


Helm 使用

Helm 是 [[Kubernetes]] 的一个包管理工具,用来简化 Kubernetes 应用的部署和管理。 通过使用使用 Helm 可以管理 Kubernetes manifest files、管理 Helm 安装包 Charts、基于 Chart 的 Kubernetes 应用分发。 Helm Chart 是用来封装 Kubernetes 原生应用程序的 YAML 文件。 Installation macOS 下安装 Helm brew install helm Linux 下安装 Helm curl https://baltoc Read more ...

2025-03-11 helm , kuberntes , k8s , rancher , k3s , cluster

K8s 部署 TiDB

TiDB 是由 PingCAP 开发的一款开源分布式 SQL 数据库,支持事务处理和实时分析。它与 Kubernetes 的结合使得数据库能够实现云原生化,具备弹性扩展、自动故障转移等特性。 TiDB 是一个分布式数据库系统,具有以下特点: HTAP 支持:同时支持事务处理(OLTP)和分析处理(OLAP)。 高可用性:通过 Raft 协议实现数据强一致性和容错。 云原生架构:适配 Kubernetes,支持自动化管理和弹性扩展。 MySQL 兼容:支持 MySQL 协议,易于迁移现有应用。 TiDB 的核心组件包括: Read more ...

2025-03-10 tidb , mysql , k8s , kubernetes

开源跨平台终端 XPipe

XPipe 是一款开源的跨平台终端应用,支持 SSH,Docker,还支持 Kubernetes 等多种环境。 功能 支持 SSH 连接,配置文件 Docker,Podman,LXD,incus 容器 Proxmox VE Hyper-V, KVM, VMware Player/Workstation/Fusion 虚拟机 Kubernetes 集群,pods,容器 Tailscale 和 Teleport 连接 Windows Subsystem for Linux,Cygwin,和 MSYS2 Powersh Read more ...

2025-03-06 xpipe , terminal , docker , ssh , proxmox , proxmox-ve , fusion

开源 Kotlin ORM 框架 Exposed 使用说明

Exposed 是 [[JetBrains]] 在数年前推出的轻量级 [[ORM]] 框架,Kotlin 编写,已经在 JetBrains 内部多个关键产品使用。 Exposed 是基于 JDBC 实现,屏蔽了底层建立数据库连接,编写 SQL,操作数据,关闭数据库连接的操作,只需要关心数据操作。 Exposed 提供了两种形式 API,面向 DSL 的 API 和面向对象的 API。如果想要使用轻量级的 ORM 可以使用 DAO 模式,如果想要使用类型安全的 SQL,推荐使用 DSL。1 特点 纯 Kotlin 实现,轻量级,模块化 类 Read more ...

2025-03-04 open-source , kotlin , java , orm , spring , spring-boot

Open WebUI 基于网页的大语言交互界面及联网搜索配置

之前的视频也介绍过,ChatWise,Cherry Studio,Chatbox 等大语言模型调用的本地客户端,虽然这些客户端都还是跨平台的,但是总还是需要占用本地的空间,今天我就来介绍一款基于网页的 LLM 交互客户端 Open WebUI,以及再介绍一下如何配置 Open WebUI 让其支持联网搜索。 Open WebUI 是什么 Open WebUI 是一个功能丰富,用户友好的自托管大语言模型 Web 交互界面。Open WebUI 提供了一个类似 ChatGPT 的界面,但是允许用户与这种类型的 AI 交互 完全离线 本地环境可 Read more ...

2025-03-03 open-webui , llm , openai , chatgpt , open-source , ollama , rag

最近文章

  • 我购买了一个 DJI Mic Mini 最近为了提升移动拍摄时的收音质量,我入手了 DJI Mic Mini。虽然大疆提供了带充电盒的套装,但我只购买了单机版本(发射器+接收器,2 TX 1 RX 版本),因为对于我日常的拍摄需求来说,本体的续航已经完全足够了。
  • Auto Claude:Vibe Kanban 的终极形态?让 AI 并行开发的“指挥中心”来了 在上一篇文章 《Vibe Kanban:当 AI 开始并行协作,我们的开发方式变了》 中,我分享了一种利用 [[Vibe Kanban]] 和 AI Agent 实现并行开发的工作流理念。我们可以利用 Vibe Kanban 来统一管理多个并行任务。
  • Vibe Kanban:当 AI 开始并行协作,我们的开发方式变了 在我之前的视频当中,我介绍过在 Claude Code 中使用子代理(Subagents)机制和 Git Worktree 来实现并行工作流。我们可以创建子代理来并行执行任务,但是 Subagents 的配置和使用都还需要我们在 Claude Code 中等待。那如果我们有完全独立的两个任务要执行呢,我们可以开两个 Claude Code 分别在两个 Claude Code 中提交任务,然后让 Claude Code 完成。此时我们依然会遇到一些问题,比如说两个 Claude Code 的代码可能产生冲突。并且如果我们有超过两个独立任务时,我们在管理 Claude Code 的成本就会指数级上升。
  • 终于还是入手了:Insta360 Go Ultra 初体验 每次想要拍摄,我得从口袋掏出手机,解锁,打开相机应用,切换到视频模式,然后举着它——这个过程在很多稍纵即逝的生活瞬间面前,显得太繁琐了。而且,当你举着手机拍摄时,你其实是在”观察”生活,而不是在”经历”生活。手机太”重”了,不是物理重量,而是心理负担。所以我想使用一个工具,可以帮我记录生活,但又不需要我刻意去”操作”它。于是,在观望了许久之后,我终于入手了这台 Insta360 Go Ultra。在 11.11 在天猫 2350 下单了 Insta360 Go Ultra,后来价格保护还退还了 260 块。
  • 奥卡姆剃刀:为何简单的往往就是最好的 最近我在整理我的 Obsidian 笔记库时,发现了一个有趣的现象。