Google Learn About 一款交互式 AI 学习产品

Google 最近可能受到了 OpenAI,[[Anthropic]] 的压力,不断地推出自己的 AI 产品,从之前的 Bard,到 Gemini,到 AI Studio,再到特定领域里面,给学术研究读论文制作的 [[NotebookLM]],到可以将文章生成播客的 [[Google Illuminate]],后面 NotebookLM 也提供了类似的功能,最近 Google 内部的团队又推出一项新的服务 [[Google Learn About]],这是一个新的学习工具。 具体来说 Learn About 可以工具用户提出的问题,给出详细的解释,并且 Read more ...

2024-11-02 google , learn-about , ai , perplexity , chatgpt

Wallabag 个人的网站收藏工具

Wallabag 是一款开源的 PHP 编写的稍后阅读应用,我自己使用了很多年了,但是忘记在博客里面记录一下了,虽然本地 Obsidian 中还有很多笔记,但是忘记整理发出来了,正好这两天分享发现的新一款稍候阅读和书签管理工具 hoarder,然后就顺带提到了 Wallabag。 在视频中也提到了目前 Wallabag 使用的过程中没有遇到任何的问题,唯一可能不满意的就是其百年不变的界面,但是这个对我而言不算是问题。 Wallabag 可以自托管,配置完了之后可以非常轻松地保存网页的内容,并且 Wallabag 允许将文字图片都离线备份下来,这样不管 Read more ...


iPhone 15 Pro Max 初始化及单手操作设置

虽然 iPhone 发售了 16,但是看了一圈测评,所以感觉并没有太大的必要升级,所以在大家换机的时候,收了一台二手的台版 iPhone 15 Pro Max 512GB,花了 13.5 万日元。这篇文章就记录一下初始化以及在大屏的 iPhone 上的一些方便单手操作的设置,因为之前一直使用都是小屏幕手机,所以一拿到之后,还感觉有一点陌生,6.7 英寸的屏幕在单手操作方面确实是有一点不方便,大部分情况都需要两手握持。 iPhone 初始化 因为所有的应用已经在之前的设备上安装了,所以在新设备上就直接通过「快速迁移」来初始化,但是我实际操作,以及对比了 Read more ...

2024-10-23 iphone , iphone15

JustRecap 将视频转成图文

今天分享一个特别有意思的项目 JustRecap,一句话来概括就是通过 AI 技术提取视频关键信息,直接生成摘要以及笔记。 功能 通过视频生成图文内容。 浏览结构化的视频摘要,包括章节、快照和全文转录。 视频摘要:利用 AI 技术自动分析视频内容,提炼关键信息,生成简洁而全面的摘要。 视频说明,Bilibili 和 YouTube。 优点 为什么要将 YouTube 视频变成图文格式?答案非常简单,就是快,我们阅读文字图片的速度要远远高于视频,及时我们以 2 倍速度播放视频,也不及我们阅读文字的速度,那么,如果视频可以变成 Read more ...


语言:思想的边界和桥梁

今天在浏览网页时,我偶然间被一句话深深震撼:”语言是思想的边界”。这句话引发了我对日常语言使用的深入思考。我们每天都在使用语言,接触无数信息,与他人交流,创造内容。然而,我们却很少关注自己用词的准确性,更少去思考语言与思想之间的紧密联系。 语言与世界观 进一步查阅资料后,我发现这句话源自哲学家维特根斯坦的名言:”语言的界限就是我的世界的界限”。这一观点揭示了语言对我们认知世界的深远影响。 不同语言系统中的独特特征为我们提供了生动的例证: 霍皮语缺乏表示时间的语法,导致霍皮人对时间的概念与印欧语系使用者大不相同。 爱斯基摩语中有多个词描述 Read more ...

2024-10-12 language , thinking , philosophy

Screenpipe 私人的 AI 助理 本地记录看到听到的一切

screenpipe 是一款开源的,记录在本地的,屏幕录制,以及全文检索应用,可以和 [[Ollama]] 一起使用,可以作为 [[Rewind]] 的开源代替。很早之前接触 Rewind 的时候就感觉非常的神奇,在不联网的情况下,可以完全在本地记录屏幕上的所有内容,并且可以非常快得在本地检索,所有屏幕中的内容,要实现这个功能我能想到的要突破的技术点一个就是存储,另外一个就是 OCR 识别以及检索。 根据 Rewind 的官方的记录只能在 macOS 下运行,可想应该是使用了 M 系列芯片的机器学习能力,但是今天介绍的 screenpipe 则是将原来 Read more ...


VideoLingo:一键自动将视频翻译成中文字幕

我之前的文章和视频中也介绍过好几款,或收费或开源的视频翻译工具,包括 收费的 MemoAI 收费的 YPlayer macOS 下的客户端 [[MacWhisper]] 开源的 pyVideoTrans 以及许许多多 Whisper 项目衍生 今天再介绍另一款开源的视频字幕自动翻译项目—- VideoLingo。 VideoLingo 是一款开源的视频自动翻译项目,可以将视频进行字幕切割,翻译,对齐,以及配音。 VideoLingo 可以接受 YouTube 链接或者本地视频,可以对视频进行自动转写,并且生成单词级别的转录 Read more ...


每天学习一个命令:wrk 单机性能测试工具

wrk 是一个使用 C 编写的 HTTP 压力测试工具,性能基准测试工具。可以在单机多核 CPU 的条件下,充分利用系统的高性能 IO,epoll,kqueue 等,通过多线程和事件,对目标机产生大量的负载。 wrk 采用了和 Redis 一样的 ae 异步事件驱动框架。 优势 轻量 安装简单 使用手册简单 自带高性能 IO,通过很少线程即可产生很大的并发量 缺点 目前只支持单机压测,设计的目的不是为了代替专业的 [[Apache JMeter]] 以及 [[LoadRunner]] 等测试工具。 wrk 比较适合于后端对 Read more ...


爱沙尼亚电子公民身份启动及邮件转发

今年 6 月份的时候申请 了爱沙尼亚电子居民卡,其实一个月左右就已经审批通过了,但是一直懒得没有去拿,直到 9 月底,终于抽出空来去了趟东京的爱沙尼亚大使馆,领取了实体卡片。 领取卡片 在申请审批通过之后会收到一封邮件,告诉卡片会寄往选择的大使馆,等到了大使馆之后,会再接受到一封通知邮件,在 6 个月之内去大使馆领取即可。在东京大使馆需要提前在网页预约,在预约的时候发现东京的大使馆竟然只在周一和周三上午 10:30 到 12:30 工作,大使的这一份工作也太轻松了,真正的每周工作 4 小时! 在预约的时间到大使馆之后,按门铃,说明来意,会有人接待并 Read more ...

2024-09-30 estonia , e-residency , e-id , id-card

使用 Tailscale Funnel 暴露本地服务

之前我介绍过 Tailscale,也介绍过如何使用 Tailscale 的出口节点功能配置流量出口,今天再介绍一个 Tailscale 的功能 Tailscale Funnel,可以将本地服务完全地暴露在互联网上。Tailscale Funnel 允许将运行在私有 Tailnet 上的 Web 服务与公共互联网共享,提供了一种简单的方式,无需配置复杂的网络。 因为最好正好有一个需求需要接收并处理一个 Webhook,想在本地代码调试,查看 Webhook 的内容,所以想到了使用内网穿透的工具,之前其实知道 [[ngrok]],frp 这样的工具,但是配 Read more ...

2024-09-28 tailscale , tailscale-funnel , frp , ngrok

最近文章

  • 将 Obsidian 配置成私人 AI 知识库 前两天介绍过腾讯推出的个人知识库工具 IMA.Copilot,但是熟悉我的人肯定知道我这几年了一直都是在使用 Obsidian 作为我个人的知识库的,在本地完全使用 Markdown 作为文档的存储格式,不依赖任何的外部工具,以及联网工具,只使用 Syncthing 作为同步。
  • 腾讯推出个人知识库产品 ima.copilot 前两天看到腾讯推出一个个人知识库产品 ima,融合了 DeepSeek,可以直接搜索知识库中的内容,还可以上传文档回答,所以今天就来体验一下这个新产品 ima。
  • 2025 苹果开发者帐号注册记录 最近开发了一款 Aki 日语词典想要上架 iOS,但是发现 Apple 开发者帐号注册却是比较麻烦,主要是我平时使用的 Apple ID 不在国区,手机一直使用的是美区帐号,还有一个日区的帐号用来下载日区的应用,所以导致 Apple ID 和绑定的手机号都非常混乱,我本来想注册美区的帐号,因为本来就是手机登录的帐号,但是过不去认证,所以想要去注册国区的帐号,可是我的 macOS 和手机没有一个有国区帐号的登录,利用网页版本注册的时候也发生了不明错误(We are unable to process your request. An unknown error occurred.),根本没有提供任何有效的信息,最后尝试用日区的 Apple 帐号注册,可是下载了 Developer 应用,登录日区帐号,Enroll 按钮显示灰色!这种错误也是第一次见到,不过好在这一次,我可以通过网页来联络客服,等了两天之后从客服那边获得了一点有效信息。
  • 国产大语言模型 DeepSeek 初识 之前的文章和视频里面介绍了很多国外公司发布的 AI 模型,从 OpenAI 发布的 GPT-3, GPT-3.5 Turbo,GPT-4 Turbo,GPT-o1,o1-mini,4o 等,到 Anthropic 发布的 Claude 3 Opus, Claude 3.5 Sonnet ,Claude 3.5 Haiku,再到 Google 发布的 Gemini 1.5 Pro,Gemini 2.0 Flash 等,以及在这些模型基础上开发出来的很多产品应用,ChatGPT,Claude,Gemini 等。但是最近有有一家国内创业公司接连发布了 DeepSeek V3 模型,DeepSeek R1 模型,这是一个可以媲美 OpenAI 和 Google 等公司最新 AI 模型的开源模型。
  • Google 发布的以图生图工具 Whisk 之前介绍过 Google 发布的在线笔记 NotebookLM ,也介绍过 Google 发布的知识学习 Learn About ,Google 虽然在 AI 上落后了 OpenAI 一节,但是内部的各个团队一直都在探索 AI 的不同能力。今天要介绍的就是 Google 刚推出的图片生成工具 Whisk,Whisk 和其他图片生成模型 [[DALL E3]]、 [[Stable Diffusion]] 、[[Midjourney]] 有所不同,抛弃了通过文字生成图片的模式,而是通过图片和图片组合,合成来生成新的图片。