AI头条
- AI头条 多模态大模型空间推理存在词汇偏差:添加空间关系词即诱导选择 06-03
- AI头条 BAGEN提出预算感知智能体:将预算从被动成本转为主动控制信号 06-03
- AI头条 LLMs在具体政策投票中不延续抽象问卷左倾偏见 06-03
- AI头条 SimSD让扩散语言模型支持token级推测解码加速 06-03
- AI头条 DECK分类法:依一致性×置信度标记LLM幻觉的可检测性 06-03
- AI头条 社会工程攻击高效窃取前沿AI代理的用户PII数据 06-03
- AI头条 Pramana借助Navya-Nyaya微调大模型提升认知推理能力 06-03
- AI头条 成本感知RAG:付费知识环境下预算受限的证据选择方法 06-03
- AI头条 SentGuard:句子级流式护栏实现大模型实时安全干预 06-03
- AI头条 ProbeScale 通过探测分析优化神经缩放定律,加速小模型推理 06-03
- AI头条 质量-多样性进化框架发现大模型安全攻击多样性 06-03
- AI头条 Grokers:写入时智能驱动的类型知识图谱归纳理解架构 06-03
- AI头条 PaSBench-Video 发布流视频主动安全预警基准测试 06-03
- AI头条 TVIR 提出文本-视觉交错报告生成基准及深度研究代理构建 06-03
- AI头条 LayerRoute:基于LoRA的自适应层跳过方法降低智能体模型推理成本 06-03
- AI头条 块级引导生成:现成LLM作为数学推理过程评分器 06-03
- AI头条 招商局狮子山AI实验室用LiOS打通具身智能全链路 06-03
- AI头条 DataShield:高效过滤LLM良性微调中的安全降级数据 06-03
- AI头条 CART 提出参数高效循环Transformer,交叉注意冻结KV实现稳定训练 06-03
- AI头条 PEFT规模化:万亿参数基础模型上的百万个性化模型 06-03
- AI头条 RoboTrustBench:四类场景评估机器人操作视频世界模型可信度 06-03
- AI头条 Sympatheia:基于连续情感调节的自适应语音助手 06-03
- AI头条 OpenWebRL 以在线多轮强化学习缓解视觉网页代理数据依赖 06-03
- AI头条 BenchEvolver通过解为中心演化合成前沿基准任务 06-03
- AI头条 EuroBERT:面向欧洲语言的多语言编码器规模化扩展 06-03
- AI头条 AgentRedBench:针对SaaS集成的LLM代理动态红队与集成感知防御 06-03
- AI头条 大语言模型奖励模型仍存长度、谄媚和过度自信三大偏见 06-03
- AI头条 BranPO用可扩展对比分支采样解决大模型长期代理强化学习难题 06-03
- AI头条 Med-V1以3B参数小模型实现零样本生物医学证据归因 06-03
- AI头条 ADRA-Bank:评估学术深度研究代理的模块化基准 06-03
- AI头条 COMAP实现语言代理世界模型与策略的共同进化 06-03
- AI头条 Agent-R1:面向智能体强化学习的统一模块化框架 06-03
- AI头条 WAON:大规模日语图文数据集增强视觉语言模型文化适应能力 06-03
- AI头条 PaperVoyager 用视觉语言模型将论文转为交互式网页 06-03
- AI头条 Global PIQA:覆盖100+语言文化的常识推理评估基准 06-03
- AI头条 SmartThinker 提出渐进式链式思考长度校准提升推理效率 06-03
- AI头条 SWE-rebench V2 发布大规模语言无关软件工程任务集 06-03
- AI头条 语音语言模型自我意识对齐弥合语义理解与声学表达鸿沟 06-03
- AI头条 Code2Math:利用代码执行环境自动演化数学难题以突破LLM瓶颈 06-03
- AI头条 TIGER:基于图证据路由的可追踪推理缓解多模态生成幻觉 06-03
- AI头条 LLM利用密集反馈替代标量奖励合成多智能体策略 06-03
- AI头条 大语言模型赋能交通系统管理运营:从文本推理到多模态决策支持 06-03
- AI头条 弱批评者蒸馏:用弱模型指导强模型的可扩展监督方法 06-03
- AI头条 MindClaw:闭环具身心智状态推理实现精准干预 06-03
- AI头条 DeLask:通过跳过深层解码器层缓解大语言模型幻觉 06-03
- AI头条 Ryze自动从生物医学论文提取证据并合成训练数据 06-03
- AI头条 StreamingVLM:面向无限视频流的实时理解模型 06-03
- AI头条 LFTutor用LLM教普通人识别逻辑谬误,从源头打击错误信息 06-03
- AI头条 Qwen3弱模型偏好差异与LoRA合并训练强语言模型 06-03
- AI头条 CAREAgent:结构化推理与工具集成的临床医嘱生成智能体 06-03
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10