Cactus: 运行在手机上的 Ollama!

Cactus: 运行在手机上的 Ollama!

你没看错,真的有一套“像 Ollama 一样强”的 AI 本地运行工具,可以跑在你的手机上,离线、不上传、不联网,还能跑 LLM、识图、语音合成!这个项目叫——Cactus

如果说 Ollama 是本地 AI 的“桌面大将军”,那 Cactus 就是“口袋 AI 武士”。它让你在 iPhone、安卓手机,甚至是树莓派等设备上本地运行大模型,彻底改变我们对“边缘设备只能做小事”的偏见。


🌵什么是 Cactus?

Cactus 是由 YC 2025 夏季创业营孵化的开源项目,全名叫 Cactus Compute,目标非常简单粗暴:

“让智能手机也能跑语言模型、图像识别、语音合成,离线、本地、快速。”

从 GitHub 可以看到,它不仅支持多模态模型(LLM + 图像 + 语音),还专为移动端深度优化。你甚至可以像用 Ollama 那样 cactus.chat(),只不过运行的不是 Mac,而是你手里那台安卓机。


🤖 它到底能干嘛?

✅ 本地大语言模型(LLM)

支持 Qwen、Gemma、Llama 等 GGUF 格式模型,本地运行无压力。比如:

  • Qwen 1.5 4B:在 iPhone 16 Pro 上能跑到 18 tokens/s
  • Gemma 1.1 2B:更快,达到 54 tokens/s

🖼 图文对话(VLM)

你可以用图+文字进行推理,比如让它看一张图问:“这是什么建筑?”或者“这张图里的人开心吗?”

🗣 本地语音合成(TTS)

直接在手机上生成语音,不用依赖云服务,适合做聊天机器人、语音播报等功能。

📎 各类系统工具接入

支持调用相册、相机、提醒、消息等本地 App 功能,这意味着你的 AI 助手真的可以提醒你喝水、拍照识物、自动回复短信!


🧠 Cactus 怎么和 Ollama 不一样?

功能 Ollama(桌面) Cactus(移动端)
是否本地运行 ✅ 是 ✅ 是
支持平台 macOS, Linux Android, iOS, 树莓派等
多模态支持 ❌ 仅限文本模型 ✅ 支持图像+语音
依赖网络 ❌ 无 ❌ 无(可选云回退)
接入系统功能 ❌ 无 ✅ 本地 API 可调用
社区活跃度 🔥 非常活跃 🌱 新兴但活跃

一句话总结:Ollama 是桌面端 AI,本地强者;Cactus 是移动端 Ollama,隐私卫士+多模态超人。


📊 性能表现实测

设备 模型 速度(tokens/s)
iPhone 16 Pro Qwen 4B 18
一加 13 Gemma 2B 43
Galaxy S24 Ultra Qwen 4B 14
Pixel 7 Qwen 4B 7

即使是中端机也能维持不错的推理速度,完全能满足日常对话、图片问答、语音生成需求。


🚀 怎么开始用?

只要你是 Flutter 或 React Native 开发者,用起来就跟调用一个 API 差不多:

final lm = await CactusLM.init(
    modelUrl: 'gguf://qwen-1.5-1b',
    contextSize: 2048,
);

final response = await lm.completion(
    [ChatMessage(role: 'user', content: '你好!')],
    maxTokens: 100,
);

C++ 开发者也有接口可用,未来还将支持 Kotlin 和 Swift。


🧩 模块化设计 + 云端备份(Optional)

  • 模块化结构:每个模型、API、系统接口都能按需引入,开发更灵活。
  • 云端降级模式:在本地推理失败时可回退到云 API,稳定性 +1。
  • 聊天模版系统:支持 Jinja2,自定义 Agent 非常容易。

📦 模型去哪找?

Cactus 提供了 Hugging Face 页面:https://huggingface.co/Cactus-Compute

支持各种预量化模型(Qwen、Gemma、LLaMA3、Phi3),都可以直接部署到手机。


💡 应用场景灵感

  • 私人语音助理(纯本地)
  • 旅行拍照识图助手
  • 离线中文聊天机器人
  • 本地搜索摘要引擎
  • 儿童故事讲述机器人
  • “不联网”的私密日记助手

🧃结语:手机也能做 AI 的事

别再以为“大模型只能跑在显卡上”。现在,你的手机,就可以是 Ollama 的继任者。Cactus 带来了真正“去中心化 AI 推理”的可能:没有 GPU、没有云、没有月费订阅,你的手机就是你的 AI 中心。

有趣的是,它还在快速进化中——如果你是开发者,不妨去 GitHub 看一眼;如果你是 AI 爱好者,不妨试着把它跑在你旧手机上,说不定你会发现一块宝藏:

👉 github.com/cactus-compute/cactus

Read more

当我不在时:一些预先的回答

当我不在时:一些预先的回答

关于死亡、告别、记忆与放下 Q1:你希望人们如何知道你去世了?你会留下什么样的通知? 我希望这件事由我的家人来通知大家,语气不需要太庄重,尽量轻松、低调一点。死亡虽然是一件大事,但也不必弄得太悲壮。我想在博客上发一个简短的告别帖,也可以同步到社交媒体上,让认识我的人知道。 我没有打算写一篇“生前讣告”,但我知道如果我走了,爱我的人一定会难过。其实,我也希望他们难过一点点,至少说明他们在意我、爱过我。只是别太久别太深,时间终究会带走很多,那是它的仁慈。 Q2:你对自己的“死后事”有什么安排?比如财产、社交账号、博客、作品? 我的博客、作品、文字,死后还是继续公开存在就好,不需要被接手、续命。人都已经走了,文字就当是留下的一点痕迹,能被看见也好,看不见也好,都无妨。 社交账号可以留着,作为一个纪念。也许有人会路过、翻到,也许不会。

By 王圆圆
悉达多:万物一体的觉悟

悉达多:万物一体的觉悟

赫尔曼·黑塞的《悉达多》不仅是一部讲述古印度灵性追寻的小说,更是一场跨越时空的心灵探险。主人公悉达多的生命历程——从婆罗门之子、沙门苦行者,到世俗商人、再到河边的摆渡人——如同一面镜子,映照出每个人内心深处对“合一”的渴望与追寻。本篇博文将带你重温这条通往“万物一体”觉悟的道路,分享其中的洞见与启示。 一、抛弃权威:怀疑传统教义的起点 悉达多出生在婆罗门世家,自幼接受严谨的宗教教育,却始终觉得内心空虚。他与好友乔达达一同加入苦行僧行列,用严酷的禁欲与苦修来试图突破自身的局限,却发现再严苛的肉体考验也无法触及灵魂深处的真实。 * 要点:传统教义和苦修只是外在形式,真正的觉醒必须来自内心的质疑与渴望。 * 启示:面对任何既定规则,我们都需要保有怀疑精神。唯有在“为什么”处发问,才可能找到属于自己的觉悟之路。 二、名为佛陀,实为指南:个人体验的价值 当悉达多与乔达达共同追随释迦牟尼(乔达摩)时,他们深受佛陀的智慧感染——四圣谛、八正道清晰指明了苦与解脱的真相。然而,悉达多渐渐意识到:再高深的教义也只是“

By 王圆圆
在旋转的镰刀下:服从与恶的深层悖论

在旋转的镰刀下:服从与恶的深层悖论

镰刀之下的沉默 想象一个广场,几十米高的旋转镰刀悬于空中。镰刀来回挥舞,尖锐的弧线划破空气。广场中央,成百上千的人跪着,不敢动弹。因为他们知道,一旦有人率先站起来,头颅就会被那把镰刀无情收割。久而久之,这种恐惧成为默契,服从成为生存策略。 你会站起来吗? 这个隐喻揭示的正是我们在权威、恐惧与道德冲突之间的真实处境:为什么大多数人在面对明显的恶时,会选择服从?为什么明明是“好人”的个体,却能在制度的机器中成为执行残酷命令的一环?这篇文章将带你走进心理学、社会结构与人性的交界,探索服从与恶的深层关系。 一、权威命令与责任转移 1961年,心理学家斯坦利·米尔格拉姆在耶鲁大学发起了一项著名实验。他让普通人对“学生”实施电击,实验设置中,参与者每次答错题就要提高电压,最终达到“致命”程度。结果出人意料:65%的人在权威人物的鼓励下,居然愿意将电压调到最高,即使听到学生痛苦尖叫。 米尔格拉姆指出,这些人并非出于恶意,而是在权威命令下“转移了责任”。他们说:“我只是照做。

By 王圆圆
新时代中国的制度优化与社会协商:从协商共治到归责透明

新时代中国的制度优化与社会协商:从协商共治到归责透明

摘要 在全球化深刻变革与国内结构调整交织的背景下,中国正进入制度完善与治理创新的关键时期。如何在巩固现有政治框架、确保社会稳定的前提下,推进制度协商、安全转型、司法修复与地方治理四大领域的深层改革,是实现“高质量发展、高水平治理”的必由之路。本文从四个维度切入,结合国内外先进经验与具体案例,提出可操作的制度设计与实施路径。 一、制度协商:多层次参与与议题共商 1.1 宪政协商平台:话题多元、公正公开 * 背景与意义 当前,全国人大是政治协商和立法的重要机构,但在实际操作中,不同领域的利益诉求和专业声音难以及时汇聚,导致政策出台后出现“水土不服”或“落地难”。引入“议题协商会”机制,能够在立法程序之前,让政策相关方先行对话,提高政策的科学性与可接受度。 * 实施路径 1. 议题选择:由人大常委会设立“年度议题库”,涵盖环保、教育、城乡融合、数字经济等十余个领域,所有议题均公开征集、优先由社会组织、行业协会和学者提出。

By 王圆圆