对不起,在图书馆,我的键盘可以退休了。

最新AI落地实操,点击了解:https://qimuai.cn/
你还在用键盘“吭哧吭哧”码字吗?尤其在办公室、图书馆,想语音输入又怕打扰别人,只能默默敲键盘?
今天,有个新工具可能彻底改变你和电脑的对话方式。
智谱AI最近干了件大事:不仅开源了新一代语音识别模型GLM-ASR系列,还同步推出了一个“王炸”应用——智谱AI输入法(桌面端)。这不仅仅是个输入法,更像是一个藏在电脑里的智能语音助手。
先说背后的“硬核引擎”:GLM-ASR模型
这次开源的模型有两个亮点:
- GLM-ASR-2512:云端大模型,识别准确率做到了行业顶尖水平。官方数据,字符错误率低至0.0717%。简单说,就是它“耳朵”极灵,杂音、口音、多语种环境下,依然能听得清、认得准。
- GLM-ASR-Nano-2512:一个可以在你本地电脑上运行的“小钢炮”模型。1.5B参数,体积小但能力强,关键是完全在本地处理你的语音,隐私零担忧,延迟几乎无感。开源语音识别模型中,它已经达到了SOTA(最优水平),甚至比一些闭源模型还强。
模型开源,意味着技术透明,整个行业都能在此基础上迭代。但对我们普通用户来说,更直接的好处是——
一个“能动口就绝不动手”的智能输入法,真的来了。
智谱AI输入法,就是把上述顶尖的语音识别能力,和大模型的“大脑”结合在了一起。它解决了几个实实在在的痛点:
- “耳语模式”是神器:在办公室、会议室、图书馆,你只需要像说悄悄话一样对着麦克风低语,它就能精准捕捉。再也不用担心语音输入会社死,真正实现了“无声胜有声”的输入自由。
- “语音即指令”:你说的话,不只是变成文字。你可以直接命令它:“翻译成英文”、“把这段话改得更正式”、“用幽默的语气重写”。它集成了大模型能力,就像一个随时待命的文案助理。
- “热词配置”超实用:做项目汇报、写专业论文,总有一堆拗口的专业术语、人名、代号。你可以提前把这些词一键导入,从此它对你的“行话”了如指掌,识别准确率飙升。
这意味着什么?
意味着你的电脑交互方式,正在从“手动键盘+鼠标”,向“自然语音+智能指令”平滑演进。写作、沟通、信息处理,效率的瓶颈很可能被“说”破。
智谱AI这一步,不仅放出了强大的开源模型,更提供了一个触手可及的落地产品。技术不再悬浮于论文中,而是变成了你电脑右下角一个实实在在的图标。
现在,它的桌面版已经开放使用。无论是想体验“窃窃私语”就能打字的黑科技,还是想拥有一个语音直达的智能文本助手,都可以去试试。
毕竟,所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。
文章目录
扫描二维码,在手机上阅读