Tag: llm

All the articles with the tag "llm".

8.0

Latent Space AINews：Agent Harness 正成为真正产品核心，LLM 本身已非瓶颈
Web

13 Mar, 2026

Latent Space AINews 3/11-12 期综述：多篇文章汇聚到同一观点——模型质量不再是上限，周边 Harness、工具、内存和运行时才是竞争关键。
→ 原文链接
7.5

Sarvam AI 开源 30B/105B 印地语推理模型，印度主权 AI 战略开始兑现
Web

13 Mar, 2026

印度 AI 创业公司 Sarvam AI 开源 Sarvam 30B 和 Sarvam 105B 两个推理模型，支持 22 种印度语言，但开发者采用仍面临工具链和生态系统摩擦。
→ 原文链接
8.5

LLM 作为计算机——在 Transformer 内部执行程序，推理速度指数级提升
HN

13 Mar, 2026

Percepta AI 提出全新架构：将程序直接编码进 Transformer 权重中执行，无需传统计算硬件，推理速度可达指数级加速。Hacker News 排名第一。
→ 原文链接
8.0

2026 年后训练技术全景：GRPO、DAPO、RLVR 如何取代 RLHF
Web

13 Mar, 2026

深度综述 GRPO、DAPO、RLVR 等后训练方法如何成为主流，以及合成自博弈数据为何让 RLHF 退出历史舞台。
→ 原文链接
7.5

SWE-Bench 上 LLM 的 PR 合并率没有提高
HN

13 Mar, 2026

研究发现尽管 SWE-Bench 基准分数持续上升，LLM 生成的 PR 实际被合并进主分支的比例并未改善，暗示评测与现实脱节。
→ 原文链接
7.0

RAG 文档投毒攻击：攻击者如何悄悄腐蚀 AI 的知识源
HN

13 Mar, 2026

深度解析针对 RAG 系统的文档投毒攻击手法，包括语义隐藏、延迟触发和跨文档污染等高级技术。
→ 原文链接
6.5

Show HN：Axe，12MB 二进制文件取代你的 AI 框架
HN

13 Mar, 2026

Axe 是一个用 Rust 编写的极简 AI 推理框架，单个 12MB 二进制文件，无外部依赖，声称可取代 LangChain 等重量级框架。
→ 原文链接
7.5

研究人员攻破麦肯锡 AI 平台：暴露 LLM 系统的系统性安全漏洞
HN

12 Mar, 2026

安全研究人员成功入侵麦肯锡内部 AI 平台，发现提示注入、权限越界等多重漏洞，揭示企业级 AI 部署的严峻安全形势。
→ 原文链接
8.5

智谱 GLM-5：744B 参数开源 MoE 大模型，MIT 许可，SWE-bench 达 77.8%
Web

12 Mar, 2026

智谱 AI 发布 GLM-5，一个 744B 参数的混合专家（MoE）开源模型，基于华为昇腾芯片训练，MIT 许可证，SWE-bench Verified 达 77.8%，开源阵营中排名第三。
→ 原文链接
6.5

NousResearch/hermes-agent：与你一同成长的开源 AI 代理框架
GitHub

12 Mar, 2026

NousResearch 发布 hermes-agent，定位为「随用户成长的代理」，1234 stars 今日新增，是 GitHub 热榜上又一个面向个性化 AI 代理的开源框架。
→ 原文链接

Tag: llm

Latent Space AINews：Agent Harness 正成为真正产品核心，LLM 本身已非瓶颈

Sarvam AI 开源 30B/105B 印地语推理模型，印度主权 AI 战略开始兑现

LLM 作为计算机——在 Transformer 内部执行程序，推理速度指数级提升

2026 年后训练技术全景：GRPO、DAPO、RLVR 如何取代 RLHF

SWE-Bench 上 LLM 的 PR 合并率没有提高

RAG 文档投毒攻击：攻击者如何悄悄腐蚀 AI 的知识源

Show HN：Axe，12MB 二进制文件取代你的 AI 框架

研究人员攻破麦肯锡 AI 平台：暴露 LLM 系统的系统性安全漏洞

智谱 GLM-5：744B 参数开源 MoE 大模型，MIT 许可，SWE-bench 达 77.8%

NousResearch/hermes-agent：与你一同成长的开源 AI 代理框架