Our Location
304 North Cardinal St.
Dorchester Center, MA 02124
IBM推出Granite4.0Nano系列小型AI模型,专为本地和边缘推理设计,含8个模型,分350M和1B两种规模。采用混合SSM 与变换器架构,支持基础和指令模式,基于Apache2.0开源许可,兼容vLLM等流行运行时,提升企业控制力。

IBM 正式推出全新的 Granite 4.0 Nano 系列小型人工智能模型,面向本地与边缘推理场景,聚焦高效、低功耗与易部署。该系列共含 8 个模型,提供 350M 与 1B 两种参量规模,兼顾轻量性能与推理精度。
Granite 4.0 Nano 采用 SSM + Transformer 的混合架构:SSM 在长序列与流式任务上具备更高的计算与内存效率,Transformer 则在语义建模与生成质量方面表现稳定。两者结合,使模型在语义理解、文本生成与实时响应之间取得平衡。
在生态上,系列模型以 Apache 2.0 开源许可发布,便于企业自定义与商用集成;并与 vLLM 等流行运行时兼容,可无缝融入现有推理基础设施,降低部署成本与迁移门槛。
| 项目 | Granite 4.0 Nano 350M | Granite 4.0 Nano 1B |
|---|---|---|
| 模型数量 | 共 8 个(覆盖基础/指令模式等变体) | |
| 核心架构 | 混合 SSM + Transformer | |
| 运行时兼容 | vLLM 等主流推理运行时 | |
| 许可协议 | Apache 2.0 | |
| 部署形态 | 本地/边缘优先,支持离线与内网环境 | |
| 模式 | 基础模式 & 指令模式 | |
随着数据安全与合规要求提升,企业需要在本地与边缘侧运行智能模型。Granite 4.0 Nano 通过轻量化与高效推理,帮助组织在不牺牲隐私与控制力的前提下,获得可靠的生成式 AI 能力。