Tag: llm
All the articles with the tag "llm".
-
8.0 Latent Space AINews 3/11-12 期综述:多篇文章汇聚到同一观点——模型质量不再是上限,周边 Harness、工具、内存和运行时才是竞争关键。
→ 原文链接
-
7.5 印度 AI 创业公司 Sarvam AI 开源 Sarvam 30B 和 Sarvam 105B 两个推理模型,支持 22 种印度语言,但开发者采用仍面临工具链和生态系统摩擦。
→ 原文链接
-
8.5 Percepta AI 提出全新架构:将程序直接编码进 Transformer 权重中执行,无需传统计算硬件,推理速度可达指数级加速。Hacker News 排名第一。
→ 原文链接
-
8.0 深度综述 GRPO、DAPO、RLVR 等后训练方法如何成为主流,以及合成自博弈数据为何让 RLHF 退出历史舞台。
→ 原文链接
-
7.5 研究发现尽管 SWE-Bench 基准分数持续上升,LLM 生成的 PR 实际被合并进主分支的比例并未改善,暗示评测与现实脱节。
→ 原文链接
-
7.0 深度解析针对 RAG 系统的文档投毒攻击手法,包括语义隐藏、延迟触发和跨文档污染等高级技术。
→ 原文链接
-
6.5 Axe 是一个用 Rust 编写的极简 AI 推理框架,单个 12MB 二进制文件,无外部依赖,声称可取代 LangChain 等重量级框架。
→ 原文链接
-
7.5 安全研究人员成功入侵麦肯锡内部 AI 平台,发现提示注入、权限越界等多重漏洞,揭示企业级 AI 部署的严峻安全形势。
→ 原文链接
-
8.5 智谱 AI 发布 GLM-5,一个 744B 参数的混合专家(MoE)开源模型,基于华为昇腾芯片训练,MIT 许可证,SWE-bench Verified 达 77.8%,开源阵营中排名第三。
→ 原文链接
-
6.5 NousResearch 发布 hermes-agent,定位为「随用户成长的代理」,1234 stars 今日新增,是 GitHub 热榜上又一个面向个性化 AI 代理的开源框架。
→ 原文链接