Cactus: 运行在手机上的 Ollama!

Cactus: 运行在手机上的 Ollama!

你没看错,真的有一套“像 Ollama 一样强”的 AI 本地运行工具,可以跑在你的手机上,离线、不上传、不联网,还能跑 LLM、识图、语音合成!这个项目叫——Cactus

如果说 Ollama 是本地 AI 的“桌面大将军”,那 Cactus 就是“口袋 AI 武士”。它让你在 iPhone、安卓手机,甚至是树莓派等设备上本地运行大模型,彻底改变我们对“边缘设备只能做小事”的偏见。


🌵什么是 Cactus?

Cactus 是由 YC 2025 夏季创业营孵化的开源项目,全名叫 Cactus Compute,目标非常简单粗暴:

“让智能手机也能跑语言模型、图像识别、语音合成,离线、本地、快速。”

从 GitHub 可以看到,它不仅支持多模态模型(LLM + 图像 + 语音),还专为移动端深度优化。你甚至可以像用 Ollama 那样 cactus.chat(),只不过运行的不是 Mac,而是你手里那台安卓机。


🤖 它到底能干嘛?

✅ 本地大语言模型(LLM)

支持 Qwen、Gemma、Llama 等 GGUF 格式模型,本地运行无压力。比如:

  • Qwen 1.5 4B:在 iPhone 16 Pro 上能跑到 18 tokens/s
  • Gemma 1.1 2B:更快,达到 54 tokens/s

🖼 图文对话(VLM)

你可以用图+文字进行推理,比如让它看一张图问:“这是什么建筑?”或者“这张图里的人开心吗?”

🗣 本地语音合成(TTS)

直接在手机上生成语音,不用依赖云服务,适合做聊天机器人、语音播报等功能。

📎 各类系统工具接入

支持调用相册、相机、提醒、消息等本地 App 功能,这意味着你的 AI 助手真的可以提醒你喝水、拍照识物、自动回复短信!


🧠 Cactus 怎么和 Ollama 不一样?

功能 Ollama(桌面) Cactus(移动端)
是否本地运行 ✅ 是 ✅ 是
支持平台 macOS, Linux Android, iOS, 树莓派等
多模态支持 ❌ 仅限文本模型 ✅ 支持图像+语音
依赖网络 ❌ 无 ❌ 无(可选云回退)
接入系统功能 ❌ 无 ✅ 本地 API 可调用
社区活跃度 🔥 非常活跃 🌱 新兴但活跃

一句话总结:Ollama 是桌面端 AI,本地强者;Cactus 是移动端 Ollama,隐私卫士+多模态超人。


📊 性能表现实测

设备 模型 速度(tokens/s)
iPhone 16 Pro Qwen 4B 18
一加 13 Gemma 2B 43
Galaxy S24 Ultra Qwen 4B 14
Pixel 7 Qwen 4B 7

即使是中端机也能维持不错的推理速度,完全能满足日常对话、图片问答、语音生成需求。


🚀 怎么开始用?

只要你是 Flutter 或 React Native 开发者,用起来就跟调用一个 API 差不多:

final lm = await CactusLM.init(
    modelUrl: 'gguf://qwen-1.5-1b',
    contextSize: 2048,
);

final response = await lm.completion(
    [ChatMessage(role: 'user', content: '你好!')],
    maxTokens: 100,
);

C++ 开发者也有接口可用,未来还将支持 Kotlin 和 Swift。


🧩 模块化设计 + 云端备份(Optional)

  • 模块化结构:每个模型、API、系统接口都能按需引入,开发更灵活。
  • 云端降级模式:在本地推理失败时可回退到云 API,稳定性 +1。
  • 聊天模版系统:支持 Jinja2,自定义 Agent 非常容易。

📦 模型去哪找?

Cactus 提供了 Hugging Face 页面:https://huggingface.co/Cactus-Compute

支持各种预量化模型(Qwen、Gemma、LLaMA3、Phi3),都可以直接部署到手机。


💡 应用场景灵感

  • 私人语音助理(纯本地)
  • 旅行拍照识图助手
  • 离线中文聊天机器人
  • 本地搜索摘要引擎
  • 儿童故事讲述机器人
  • “不联网”的私密日记助手

🧃结语:手机也能做 AI 的事

别再以为“大模型只能跑在显卡上”。现在,你的手机,就可以是 Ollama 的继任者。Cactus 带来了真正“去中心化 AI 推理”的可能:没有 GPU、没有云、没有月费订阅,你的手机就是你的 AI 中心。

有趣的是,它还在快速进化中——如果你是开发者,不妨去 GitHub 看一眼;如果你是 AI 爱好者,不妨试着把它跑在你旧手机上,说不定你会发现一块宝藏:

👉 github.com/cactus-compute/cactus

Read more

間

春节回家,我又见到了我干爹家的三儿子。 他生下来就带着残疾,不能说话,手脚不协调,走路一瘸一拐,嘴角总是挂着口水。小时候干爹干娘怕别人欺负他,教他见人就笑。所以这么多年,不管走到哪,他都是笑着的。 左脚脚尖点地,左手弯着伸不直,走路习惯性靠在路的最右边,紧贴着路沿。我有时候担心他会踩进沟里,想想又觉得,也许他自己知道,这样不容易被人撞到。 那天下午我一个人在村东边路上走,他跟了上来。脸上沾着灰,鼻子里有一团鼻垢,我下意识想帮他弄掉,他偏过头,自己扣了下来,然后转过脸,把手里点着的烟举了举,冲我笑。 他的手指黄黄的,染得很深。后来我知道,小时候有人逗他,教他抽烟,就这么上了瘾,又没有能力自己戒。烟瘾越来越大,有烟就一口气抽完,多的时候一天三包。这两年逢年过节,大家口袋里都装着烟,见面互让,他也学会了凑过去。村里谁家办红白喜事,他都去帮着搬凳子搬椅子,人家给他几根烟,他就高兴。我那半包苏烟,后来进了他的口袋。

折叠时间

折叠时间

上次坐地铁的时候,我盯着手机看了一眼时间:20:37。等反应过来抬起头,已经是20:52了。十五分钟,就这么没了。 但1月牙疼去看牙医,在椅子上躺着等医生准备器械,那三分钟感觉比一个小时还长。 同样是时间,为什么有时候像沙子一样从指缝溜走,有时候又像琥珀一样凝固住每一秒? 不同的星球,不同的时钟 物理学告诉我们,引力会让时间变慢。在靠近黑洞的地方过一小时,地球上可能已经过了好几年。就像不同重量的球压在一张网上,越重的球把网面压得越深,时间在那里流逝得就越慢。 这个画面一直让我着迷。 后来我想,其实我们每个人的内心世界也像是不同的星球。有些事情对你来说很重要,它就像一颗大质量的星球,把你的时间网压出很深的凹陷。你围绕着它打转,时间在那里变得又浓又稠。 恋爱的时候,一天能想对方好几百次。每一次心跳都被放大,每一个眼神都值得回味。楼下等她的那段时间好像特别"漫长"。 但也有些日子,你就是在重复。起床、上班、吃饭、睡觉。一天天像复制粘贴一样过去了,回头看,好像什么都没留下。 大象和蚂蚁的一秒钟

思考

思考

在你阅读这篇文章之前,先问自己一个问题:你上一次真正深度思考是什么时候? 我所说的"深度思考",是指遇到一个具体而困难的问题,然后花费好几天时间专注于解决它的那种状态。 你的答案是什么? * a) 经常如此 * b) 从来没有 * c) 介于两者之间 如果你的答案是 (a) 或 (b),这篇文章可能不适合你。但如果像我一样,你的答案是 (c),那么这篇文章或许能引起你的共鸣,至少让你知道,你并不孤单。 首先声明:这篇文章没有答案,甚至没有建议。它只是我最近几个月内心感受的一次宣泄。 建造者与思考者 我相信我的性格建立在两个主要特质之上: 1. 建造者(渴望创造、交付和务实) 2. 思考者(需要深度、持久的智力挑战) 建造者这一面很容易理解,它追求速度和实用性。这是我渴望将"想法"转化为"现实&