ArchGW:让 AI 秒懂你的“中间人”

ArchGW:让 AI 秒懂你的“中间人”

在你要做一个“能听懂人话、自动帮你执行任务”的 AI 应用时,通常需要写一大堆代码来完成这些步骤:

  1. 把用户说的话翻译成机器能懂的指令;
  2. 根据指令选择合适的 AI 模型或后端服务;
  3. 给模型或服务传参、再把结果返回给用户;
  4. 处理越权或危险操作,记录日志、监控性能……

ArchGW 就是专门为这种场景准备的“中间人”。它把上面那一串复杂流程全部打包好了,你只要简单配置,就能立刻使用。


虽然 ArchGW 和像 ChatGPT、Gemini 这样的通用人工智能(LLM)都能理解自然语言,但它们的角色完全不同:

通用 AI 更像是一个“聪明的大脑”,善于回答问题、写文章、做总结;而 ArchGW 是一个“智能调度中心”,负责识别用户的意图、调用合适的模型或系统、并执行具体任务。它不产生内容,而是帮你把 LLM 变成真正能“动手”的智能应用。

👉 比如你说:“帮我把这篇文章发到公司博客上。”

  • ChatGPT 可能会回你:“你可以登录博客后台,把内容粘贴进去。”
  • 而 ArchGW 会识别你的任务是“发布博客”,提取文章标题与内容,自动调用你配置好的 API(比如 Ghost、Notion、WordPress),直接完成发布操作,就像一个自动执行命令的智能助理。

简单说:LLM 负责“想”,ArchGW 负责“做”。


为什么需要 ArchGW?

  • 省心又高效:不用自己从零写意图识别、函数调用、日志监控这些“胶水”代码。
  • 随时切换 AI:想用 OpenAI、Ollama 还是别家的模型,一行配置就搞定,避免被单一厂商锁定。
  • 安全有保障:统一的“Guardrails”规则,自动拦截危险命令,比如“删除所有用户数据”这种操作会被拒绝并提示确认。
  • 性能可观测:自带 OpenTelemetry 和链路追踪,能把每一步请求的耗时、状态码、错误信息都丢到 Jaeger、Signoz、Honeycomb 里,随时排查问题。

核心功能

  1. “听懂”用户的意图
    • 用户:“给我查一下明天北京的天气?”
    • ArchGW:先把这句话丢给内置的小模型,迅速分辨出“这是要查天气”,并且提取出“北京”“明天”这两个关键词。
  2. 自动调用对应服务
    • ArchGW 根据你预先写好的配置,把“北京”“明天”带到天气接口里,一口气把结果拿回来。
    • 你根本不用动代码,只要在配置文件里写好“weather_api 接口地址”就行。
  3. 多轮对话 & 函数调用
    • 用户:“下周一下午三点帮我给 Alice 安排个会议。”
    • ArchGW 会先把“下周一下午三点”解析成具体日期,组装成“创建日历事件”的接口请求,再调用你的日历服务。
    • 完全不用写一行 glue 代码,配置一次后面就自动跑。
  4. 统一监控 & 安全拦截
    • 所有请求——无论是天气查询、建会、下单还是别的操作——都在同一个面板里可视化。
    • 如果检测到“删除所有用户数据”这种敏感请求,按你的规则直接拦截并返回“你确定要这么干吗?”的提示。

典型应用场景

  • 智能客服:一套对话系统同时支撑查订单、改密码、投诉反馈等多种任务,后端接口各不相同,ArchGW 一条龙搞定。
  • 运维自动化“帮我重启一下数据库”“生成今天的流量报告发给我”……对话一出,自动调用相应脚本或 API。
  • SaaS 系统集成:一个聊天入口打通 Slack、Jira、Notion、Salesforce,权限校验和日志记录都由 ArchGW 管。

怎么开始用?

发请求试试
http://localhost:10000/v1/chat/completions 发送:

{"role":"user","content":"明天下午北京天气怎么样?"}

你就能马上拿到结构化的天气数据。

启动网关

archgw build
archgw download-models
archgw up --service archgw --foreground

写配置文件arch_config.yaml

listeners:
  ingress:
    address: 0.0.0.0
    port: 10000

llm_providers:
  - model: openai/gpt-4o
    access_key: $OPENAI_API_KEY

prompt_guards:
  input_guards:
    jailbreak:
      on_exception:
        message: "该操作有风险,请确认权限。"

prompt_targets:
  - name: get_weather
    description: "查询天气"
    parameters:
      - name: location
        required: true
    endpoint:
      name: weather_api
      path: /forecast?city={location}&date={date}

endpoints:
  weather_api:
    endpoint: api.weather.com:443
    protocol: https

安装命令行工具

pip install archgw==0.3.4

小结

  • ArchGW 不仅是个简单的代理,它是 AI 应用里的“智慧中枢”,负责“听懂 → 决策 → 执行 → 监控”整套流程。
  • 从零搭建流程化、可观测又安全的自然语言接口,从此一键搞定。
  • 想让你的团队更专注业务创新,而不是把时间都花在写胶水代码?试试 ArchGW 吧!

🔗 GitHubhttps://github.com/katanemo/archgw
🔗 官网文档https://www.archgw.com/

Read more

間

春节回家,我又见到了我干爹家的三儿子。 他生下来就带着残疾,不能说话,手脚不协调,走路一瘸一拐,嘴角总是挂着口水。小时候干爹干娘怕别人欺负他,教他见人就笑。所以这么多年,不管走到哪,他都是笑着的。 左脚脚尖点地,左手弯着伸不直,走路习惯性靠在路的最右边,紧贴着路沿。我有时候担心他会踩进沟里,想想又觉得,也许他自己知道,这样不容易被人撞到。 那天下午我一个人在村东边路上走,他跟了上来。脸上沾着灰,鼻子里有一团鼻垢,我下意识想帮他弄掉,他偏过头,自己扣了下来,然后转过脸,把手里点着的烟举了举,冲我笑。 他的手指黄黄的,染得很深。后来我知道,小时候有人逗他,教他抽烟,就这么上了瘾,又没有能力自己戒。烟瘾越来越大,有烟就一口气抽完,多的时候一天三包。这两年逢年过节,大家口袋里都装着烟,见面互让,他也学会了凑过去。村里谁家办红白喜事,他都去帮着搬凳子搬椅子,人家给他几根烟,他就高兴。我那半包苏烟,后来进了他的口袋。

折叠时间

折叠时间

上次坐地铁的时候,我盯着手机看了一眼时间:20:37。等反应过来抬起头,已经是20:52了。十五分钟,就这么没了。 但1月牙疼去看牙医,在椅子上躺着等医生准备器械,那三分钟感觉比一个小时还长。 同样是时间,为什么有时候像沙子一样从指缝溜走,有时候又像琥珀一样凝固住每一秒? 不同的星球,不同的时钟 物理学告诉我们,引力会让时间变慢。在靠近黑洞的地方过一小时,地球上可能已经过了好几年。就像不同重量的球压在一张网上,越重的球把网面压得越深,时间在那里流逝得就越慢。 这个画面一直让我着迷。 后来我想,其实我们每个人的内心世界也像是不同的星球。有些事情对你来说很重要,它就像一颗大质量的星球,把你的时间网压出很深的凹陷。你围绕着它打转,时间在那里变得又浓又稠。 恋爱的时候,一天能想对方好几百次。每一次心跳都被放大,每一个眼神都值得回味。楼下等她的那段时间好像特别"漫长"。 但也有些日子,你就是在重复。起床、上班、吃饭、睡觉。一天天像复制粘贴一样过去了,回头看,好像什么都没留下。 大象和蚂蚁的一秒钟

思考

思考

在你阅读这篇文章之前,先问自己一个问题:你上一次真正深度思考是什么时候? 我所说的"深度思考",是指遇到一个具体而困难的问题,然后花费好几天时间专注于解决它的那种状态。 你的答案是什么? * a) 经常如此 * b) 从来没有 * c) 介于两者之间 如果你的答案是 (a) 或 (b),这篇文章可能不适合你。但如果像我一样,你的答案是 (c),那么这篇文章或许能引起你的共鸣,至少让你知道,你并不孤单。 首先声明:这篇文章没有答案,甚至没有建议。它只是我最近几个月内心感受的一次宣泄。 建造者与思考者 我相信我的性格建立在两个主要特质之上: 1. 建造者(渴望创造、交付和务实) 2. 思考者(需要深度、持久的智力挑战) 建造者这一面很容易理解,它追求速度和实用性。这是我渴望将"想法"转化为"现实&