xiaohack's Blog: FACTS 基准测试套件问世,用于评估大型语言模型的事实准确性FACTS基准测试套件发布,这是一个旨在系统性评估大型语言模型事实准确性的全新行业基准。该套件由 FACTS 团队与 Kaggle 联合开发,扩展了早期事实基础研究相关的工作,并引入了一个更广泛...最新博文1天前000
xiaohack's Blog: 谷歌发布 Gemma Scope 2,深化对 LLM 行为的理解Gemma Scope 2 是一套旨在解释 Gemini 3 模型行为的工具,使研究人员能够分析模型的突发行为,审核和调试 AI 代理,并针对越狱、幻觉和阿谀奉承等安全问题制定缓解策略。 可解释...最新博文1天前000
xiaohack's Blog: 首个智能体商业信任协议来了!支付宝携手千问 App、淘宝闪购等发布 AI 商业协议 ACT1 月 16 日,支付宝联合千问 App、淘宝闪购、Rokid、大麦、阿里云百炼等伙伴,正式发布 ACT 协议(Agentic Commerce Trust Protocol,智能体商业信任协议...最新博文1天前000
xiaohack's Blog: Apple Pay 公布 2025 年成绩单,迎来入华十周年大更新自 2014 年推出以来,Apple Pay 已经从最初替代实体钱包的电子支付体验,发展成为了如今覆盖商品交易、身份认证、出行场景的电子钱包服务平台。除了基础的交易功能,我们可以用 Home K...最新博文1天前000
xiaohack's Blog: 科普 | 高帧率、好画质的「光追」是如何实现的?除了与赛博朋克、公司殖民主义、边缘行者等名词高度绑定,现在当我们提起《赛博朋克 2077》这款游戏,出现在很多人还脑海里的自然也有 CDPR 借助光线追踪、DLSS 等技术在其 RED 引擎中所...最新博文1天前000
xiaohack's Blog: 新玩意 233|少数派的编辑们最近买了啥?很多读者都会好奇少数派的编辑们到底平时都「买了啥」。我们希望通过「编辑部的新玩意」介绍编辑部成员们最近在用的新奇产品,让他们自己来谈谈这些新玩意的使用体验究竟如何。内容声明:《新玩意》栏目如含有...最新博文1天前000
xiaohack's Blog: 派早报:iQOO 发布 iQOO Z11 Turbo 手机、大疆发布 DJI RS 5 轻量商拍稳定器等iQOO 发布 iQOO Z11 Turbo 手机1 月 15 日,iQOO 正式发布 iQOO Z11 Turbo 手机,起售价 2699 元,国补后到手价 2039.15 元起。屏幕方面,i...最新博文1天前000
xiaohack's Blog: TimeGPT:一套科学的时间精力待办管理系统利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)Matrix 首页推荐 Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 ...最新博文1天前000
xiaohack's Blog: 科技爱好者周刊(第 381 期):中国 AI 大模型领导者在想什么这里记录每周值得分享的科技内容,周五发布。本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系([email protected])。封面图刚刚运营的北京通州站位于地下...最新博文1天前000
xiaohack's Blog: 面向临床的心电图AI,上智院、复旦等提出CLEAR面向临床的心电图AI,上智院、复旦等提出CLEAR-HUG框架实现诊断性能与可解释性双突破0%展开列表面向临床的心电图AI,上智院、复旦等提出CLEAR-HUG框架实现诊断性能与可解释性双突破今...最新博文1天前000
xiaohack's Blog: KrebsOnSecurity.com 十六周年快乐!KrebsOnSecurity.com 于今日迎来十六周年纪念!衷心感谢所有读者——无论是新朋友、老读者,还是匆匆路过的批评者。过去一年里,各位的积极参与令人惊叹,也确实为一些阴郁的日子带来了慰...最新博文1天前000
xiaohack's Blog: Kimwolf僵尸网络正在窥探您的本地网络您正在阅读的报道是一系列独家新闻,它们嵌套在一份更为紧迫的全球互联网安全公告之中。所讨论的漏洞已被利用数月之久,现在是时候让更多人意识到这一威胁了。简而言之,您过去对互联网路由器后方内部网络安全...最新博文1天前000