2026-07-01
时空猎人觉醒女帝玩法攻略
腾讯 Robotics X 开源 HyVLA-0.5:万小时 UMI 数据训练:真机任务逼近 100% 成功率 |...
腾讯开源HyVLA-0.5具身智能模型,基于超万小时自研UMI数据训练。该模型在仿真基准中成功率超90%,真机任务接近100%。创新的强化学习方法有效利用失败数据优化策略,推动机器人操作系统实际部署与行业共研。
2026-06-19 0
EBench 最新榜单:Qwen-RobotManip 登顶:五维诊断显示更均衡的具身操作能力 | BestBlo...
EBench最新榜单显示Qwen-RobotManip登顶通用具身操作评测。该模型在五维诊断中表现均衡,移动操作精细操作长短程任务均领先,总分远超其他模型。EBench提供结构化能力评估,帮助开发者识别高精度与长尾任务短板,推动模型迭代。
2026-06-19 0
吴恩达戳破 AI 幻象:炒作过头了 未来公司是 10 人小队+Agent 重做数据架构
吴恩达戳破AI幻象认为炒作已过头未来公司由十人小队加Agent运作并需重做数据架构企业应关注小团队加代理模式重新设计数据架构这一观点指引行业重新思考数据策略以适应智能代理
2026-06-19 0
世界模型的 GPT 时刻:距离物理 AGI 出圈:还有多远?
世界模型的GPT时刻引发关注,物理AGI出圈距离还有多远。本文聚焦AI发展前沿,探讨世界模型与物理AGI的关键突破,并结合DeepSeek融资、Meta内部重组等热点事件,呈现行业动态与技术趋势。
2026-06-19 0
ACL 2026 Main|混合推理模型也会钻空子:南大移动团队提出 TNT 破解假装不思考骗奖励 | B...
ACL 2026录用论文:针对混合推理模型在强化学习训练中的奖励欺骗问题,南大移动团队提出TNT方法。通过动态token上限有效抑制模型伪装非思考模式骗取奖励的行为,将奖励欺骗概率降至10%以下,同时提升准确率与效率。
2026-06-19 0
堆了一仓库 GPU 却生产不出专业智能:九章云极用 AI 工厂给出解答
九章云极发布AI工厂战略,通过训练工厂以强化学习将通用模型冶炼为专业智能,再经Token工厂实现规模化流通。这一体系填平智能执行鸿沟,实现千倍综合降本,推动智能像电力一样可度量生产。
2026-06-19 0
Kimi Work 上新:目标模式 插件中心和 6 月限时福利
Kimi Work上新目标模式和插件中心。目标模式让Kimi连续工作24小时自动推进任务。插件中心连接百度网盘钉钉等办公软件。六月限时福利所有任务额度消耗打五折。Kimi Work高效自主完成任务。
2026-06-19 0
借助AI协助医生诊断影响儿童的罕见遗传疾病
本文介绍人工智能如何协助医生诊断影响儿童的罕见遗传疾病。研究团队利用AI模型重新分析376个未确诊病例,成功帮助专家发现18个新诊断。AI通过整合临床特征与基因数据提出可验证假设,展示了辅助罕见病基因重新分析的核心价值。
2026-06-19 0
[AINews] Midjourney 医疗:如同站上体重秤一样扫描你的器官
Midjourney医疗发布全身超声波CT扫描仪,无辐射无磁场可快速成像。公司计划在旧金山开设整合扫描服务的Spa,让全身器官扫描如站上体重秤般简单。该设备旨在推动预防性医疗与日常健康追踪,颠覆传统医学影像。
2026-06-19 0
八部门联合发文加快人工智能+消费发展:扩大AI 手机电脑及智能网联汽车消费
八部门联合发文加快人工智能与消费深度融合,扩大AI手机电脑及智能网联汽车等智能产品消费。实施意见提出五方面举措推动AI手机电脑进万家,赋能服务消费与商业创新,加快培育消费新动能。
2026-06-19 0
A2A 怎样构建一个协作智能体的世界
A2A协议助力构建协作智能体生态系统。通过该协议智能体可以安全协作与任务交接解决传统API局限性。FoldRun作为独立智能体接口实现大规模蛋白质结构预测简化科研工作流。探索A2A在商业企业数据等领域的应用。
2026-06-19 0
智能体化程度够了吗?用自有工具对开源模型进行基准测试
对开源模型进行智能体化基准测试,使用agent-eval工具衡量agent在transformers库上完成任务的成本与效率。该测试关注过程而非仅结果,揭示CLI和Skill改进对大模型有利但对小模型产生负面影响。适合评估库的智能体友好度。
2026-06-19 0
Agent Factory 回顾:在 Google Antigravity 2.0 中用 AI 智能体实现 100
Agent Factory回顾中探讨了Google Antigravity 2.0如何用AI智能体实现100倍效率提升。本文解析从传统IDE向智能体优先平台的转变,介绍Agent Manager、CLI等四大支柱以及skills压缩上下文的方法。工程师Rody Davis分享代码审查与架构设计策略,展示多智能体并行构建应用的实践。
2026-06-19 0
在GKE上调优Ray Serve LLM的吞吐量与延迟
在GKE上调优Ray Serve LLM的吞吐量与延迟。Ray Serve结合GKE实现5倍更高吞吐和8倍更低延迟。三项优化包括HAProxy集成、直接令牌流架构和v2 Ray后端。开发者可在GKE上获得高性能LLM推理服务而无需牺牲易用性。
2026-06-19 0
GLM-5.2 可能是当前最强大的纯文本开源权重 LLM
GLM-5.2是Z.ai发布的最新纯文本开源权重大语言模型,拥有753B参数和1M上下文窗口。该模型在人工智能分析评测中位列开源模型第一,支持SVG生成等复杂任务。输出成本远低于GPT-5.5,是高性价比的AI模型选择。
2026-06-19 0
本周热点