Cactus: 运行在手机上的 Ollama!

Cactus: 运行在手机上的 Ollama!

你没看错,真的有一套“像 Ollama 一样强”的 AI 本地运行工具,可以跑在你的手机上,离线、不上传、不联网,还能跑 LLM、识图、语音合成!这个项目叫——Cactus

如果说 Ollama 是本地 AI 的“桌面大将军”,那 Cactus 就是“口袋 AI 武士”。它让你在 iPhone、安卓手机,甚至是树莓派等设备上本地运行大模型,彻底改变我们对“边缘设备只能做小事”的偏见。


🌵什么是 Cactus?

Cactus 是由 YC 2025 夏季创业营孵化的开源项目,全名叫 Cactus Compute,目标非常简单粗暴:

“让智能手机也能跑语言模型、图像识别、语音合成,离线、本地、快速。”

从 GitHub 可以看到,它不仅支持多模态模型(LLM + 图像 + 语音),还专为移动端深度优化。你甚至可以像用 Ollama 那样 cactus.chat(),只不过运行的不是 Mac,而是你手里那台安卓机。


🤖 它到底能干嘛?

✅ 本地大语言模型(LLM)

支持 Qwen、Gemma、Llama 等 GGUF 格式模型,本地运行无压力。比如:

  • Qwen 1.5 4B:在 iPhone 16 Pro 上能跑到 18 tokens/s
  • Gemma 1.1 2B:更快,达到 54 tokens/s

🖼 图文对话(VLM)

你可以用图+文字进行推理,比如让它看一张图问:“这是什么建筑?”或者“这张图里的人开心吗?”

🗣 本地语音合成(TTS)

直接在手机上生成语音,不用依赖云服务,适合做聊天机器人、语音播报等功能。

📎 各类系统工具接入

支持调用相册、相机、提醒、消息等本地 App 功能,这意味着你的 AI 助手真的可以提醒你喝水、拍照识物、自动回复短信!


🧠 Cactus 怎么和 Ollama 不一样?

功能 Ollama(桌面) Cactus(移动端)
是否本地运行 ✅ 是 ✅ 是
支持平台 macOS, Linux Android, iOS, 树莓派等
多模态支持 ❌ 仅限文本模型 ✅ 支持图像+语音
依赖网络 ❌ 无 ❌ 无(可选云回退)
接入系统功能 ❌ 无 ✅ 本地 API 可调用
社区活跃度 🔥 非常活跃 🌱 新兴但活跃

一句话总结:Ollama 是桌面端 AI,本地强者;Cactus 是移动端 Ollama,隐私卫士+多模态超人。


📊 性能表现实测

设备 模型 速度(tokens/s)
iPhone 16 Pro Qwen 4B 18
一加 13 Gemma 2B 43
Galaxy S24 Ultra Qwen 4B 14
Pixel 7 Qwen 4B 7

即使是中端机也能维持不错的推理速度,完全能满足日常对话、图片问答、语音生成需求。


🚀 怎么开始用?

只要你是 Flutter 或 React Native 开发者,用起来就跟调用一个 API 差不多:

final lm = await CactusLM.init(
    modelUrl: 'gguf://qwen-1.5-1b',
    contextSize: 2048,
);

final response = await lm.completion(
    [ChatMessage(role: 'user', content: '你好!')],
    maxTokens: 100,
);

C++ 开发者也有接口可用,未来还将支持 Kotlin 和 Swift。


🧩 模块化设计 + 云端备份(Optional)

  • 模块化结构:每个模型、API、系统接口都能按需引入,开发更灵活。
  • 云端降级模式:在本地推理失败时可回退到云 API,稳定性 +1。
  • 聊天模版系统:支持 Jinja2,自定义 Agent 非常容易。

📦 模型去哪找?

Cactus 提供了 Hugging Face 页面:https://huggingface.co/Cactus-Compute

支持各种预量化模型(Qwen、Gemma、LLaMA3、Phi3),都可以直接部署到手机。


💡 应用场景灵感

  • 私人语音助理(纯本地)
  • 旅行拍照识图助手
  • 离线中文聊天机器人
  • 本地搜索摘要引擎
  • 儿童故事讲述机器人
  • “不联网”的私密日记助手

🧃结语:手机也能做 AI 的事

别再以为“大模型只能跑在显卡上”。现在,你的手机,就可以是 Ollama 的继任者。Cactus 带来了真正“去中心化 AI 推理”的可能:没有 GPU、没有云、没有月费订阅,你的手机就是你的 AI 中心。

有趣的是,它还在快速进化中——如果你是开发者,不妨去 GitHub 看一眼;如果你是 AI 爱好者,不妨试着把它跑在你旧手机上,说不定你会发现一块宝藏:

👉 github.com/cactus-compute/cactus

Read more

心智难民

心智难民

心智,按照牛津词典的定义,是获取和运用知识的能力。 互联网是一场技术革命,给每个人提供了机会。社会是由阶层组成的,每一场技术革命都促使了不同阶层的重新洗牌,或者说阶层分化。网络世界的阶层分化是什么样的呢?大概可以分为两个大的阶层:一类是接受高质量信息的精英阶层,另外一类是消费网络上的垃圾信息、接受劣质信息的乌合之众。 当然,这里说的“免费”是打引号的。因为它不仅不免费,而且一点也不便宜。 人们喜欢免费的东西。但是世界上除了阳光和空气,没什么是真正免费的东西,只是支付的方式不一样——有的直接用钱付,有的间接用钱付;有些用生活质量付,有些用人生的潜力和机会付。 You must pay for everything in this world, one way or another. Nothing is free. 你终究会以不同的方式付费,天下没有免费的午餐。 如果一个人只接受网上“免费”的信息,就像是只吃劣质食品一样,结果就是精神世界的劣质化。因为接受信息质量的差异,

By 王圆圆
Crazy World

Crazy World

by Jeff Daniels 译文 我看见一个年轻女孩笑了, 因为他刚说的话。 我看着他坠入她那双美丽的眼睛里, 脸红的像玫瑰。 我看见一位老人在走路, 妻子陪在他身旁。 我看着他俯身握住她的手, 天啊,我竟然哭了。 这疯狂的世界越来越疯狂, 我有什么资格评判呢? 但值得庆幸的是, 在这个充满仇恨的世界里, 还有人在用心相爱着。 我看见狗摇着尾巴, 看见孩子在奔跑。 我也曾在无数个日落里, 对着夕阳唱着歌。 我看见有人为别人扶着门, 看见陌生人握手寒暄。 我看见她和那个曾经错过的旧情人拥吻, 时间比计划中的更长了一些。 这个疯狂的世界继续疯狂着, 但我能说什么? 好在这个充满恨的世界里, 还有人在用心相爱着。 我看见祈祷被回应, 看见了六月里的新娘。 我骄傲地说,我当时见到了银河, 对着月光下的人们闪烁。 我看见送出的一打玫瑰, 见过她满心的欢喜藏不住, 我见过的已经足够, 让我明白我所知道的, 也坚信我依然相信的。 这疯狂的世界越来越疯狂, 我能说什么? 但值得庆幸的是, 在这个充满仇恨的世界里, 还有人相爱着。 原文 I’ve seen a

By 王圆圆
人是能被改变的吗?

人是能被改变的吗?

想改变别人基本上是在浪费时间。这个话题听起来简单,但仔细想想,我们生活中有太多时候都在做这种徒劳的事。 生活中的人大概可以分成三类: 喜欢的人 - 这些人即使有缺点你也能接受。你们相处舒服,他们做什么你都能理解,就算偶尔看不惯,也不会想着要去改造他们。 无所谓的人 - 占了我们生活中的大多数。同事、路人、网上的陌生人,他们怎么生活、怎么思考,其实跟你一点关系都没有。 讨厌的人 - 那些让你感到不舒服的人。可能是价值观完全相反,可能是行为方式你无法忍受。 既然人际关系本来就是这样,为什么还要费劲去改变谁呢?尤其是那些无所谓的人和讨厌的人,你花时间去说服他们、纠正他们,最后累的是自己。有这个功夫,不如多看两本书,学点新东西,改变一下自己。 美国人教小孩一个词:Walk Away。意思就是遇到麻烦的人、不讲理的人,转身走就完了,不用纠缠。 这听起来好像是逃避,但其实是一种很成熟的处理方式。你不是害怕对方,而是知道跟这种人浪费时间没有意义。 有个作家Charles Portis说过一句话挺有意思的:"

By 王圆圆
留守的代价

留守的代价

我有一个90后的朋友,她的故事让我久久无法平静。 她13岁那年,初中还没读完就辍学了,跟着同乡去了南方打工。六年后,在家人的安排下,她嫁给了邻村一个老实人家的儿子。没有恋爱,没有了解,只有两个家庭觉得"差不多,能过"的判断。 婚后他们一起在宁波工作,陆续有了两个女儿。按理说,一家四口,日子虽苦但也算完整。但我们那个地方,重男轻女的观念像一只看不见的手,推着她生下了第三个孩子——终于是个儿子。 三个孩子陆续到了上学的年龄,他们却一直在外打工。孩子成了留守儿童,跟着爷爷奶奶在老家,一年见父母一两次。视频通话里,孩子越来越沉默,成绩越来越差,老师反映性格也出现了问题。 她做了一个决定:回家照顾孩子。 他继续在外地送快递。从此,这个家庭被一分为二——一边是她独自面对三个问题儿童的混乱和辛苦,一边是他在城市里每天十几个小时的奔波劳累。 本来就没什么感情基础的两个人,在这种分离中,最后那点维系也消磨殆尽了。 最近两年,他给家里的生活费越来越少。后来她才知道,他在外面有了别人,赚的钱不多,都花在了新欢身上。

By 王圆圆