天天 AI-20250219

官宣！OpenAI 前 CTO 新公司：北大校友翁荔加盟，创始 29 人 2/3 来自 OpenAI
前 OpenAI 首席技术官 Mira Murati 宣布成立新公司 ——Thinking Machines Lab。该团队由 29 名成员组成，其中三分之二来自 OpenAI，包括前研究副总裁 Barret Zoph 和联合创始人 John Schulman。Mira Murati 担任 CEO，团队的目标是帮助人们调整 AI 系统以满足特定需求，开发强大的基础模型，并培养开放的科学文化。Thinking Machines Lab 旨在构建一个人人都能获得知识和工具的未来，让 AI 能够为人类的独特需求服务。该团队强调科学共享的重要性，计划定期发布技术博客和论文，以促进研究文化的改善。
来源原文

ChatGPT 后训练方法被 OpenAI 离职联创公开，PPT 全网转～
离开 OpenAI 的 John Schulman 和 Barret Zoph 公开了 ChatGPT 后训练方法的 PPT，分享了他们在斯坦福的演讲内容。后训练阶段是模型开发的最后一步，旨在让模型更像助手，确保其适合实际生产环境。PPT 中详细介绍了后训练的三个主要组成部分：监督微调、奖励模型训练和强化学习。两位前高管回顾了 ChatGPT 的早期发展历程，强调了在功能扩展和公司规模增长背景下，如何通过主线模型设置来整合变化并降低风险。这一分享为 AI 开发者提供了宝贵的经验和见解。
来源原文

全球首测！OpenAI 开源 SWELancer，大模型冲击 100 万年薪
OpenAI 推出了新的评估大模型代码能力的基准 ——SWE-Lancer，包含 1488 个真实开发任务，价值高达 100 万美元。SWE-Lancer 采用端到端测试方法，模拟真实用户的工作流程，验证应用程序的完整行为。与传统的单元测试不同，SWE-Lancer 能够更全面地评估模型的解决方案。测试结果显示，当前主流模型在面对这些复杂任务时表现不佳，尤其是在高价值任务中，模型的通过率普遍低于 30%。这一基准测试为 AI 模型的实际应用提供了重要参考。
来源原文

清华、中南开源 3D 交互实体 AI Agent LEGENT
清华大学和中南大学的研究团队联合开源了一款可视化 3D 交互实体 AI Agent 模型 ——LEGENT。该模型允许用户在 3D 虚拟空间中与实体 AI 代理进行互动，具有高度的交互性和灵活性。LEGENT 的场景模块通过实时物理模拟，为智能体的学习和决策提供了逼真的环境。该模型不仅支持用户与 AI 的直接交互，还允许开发人员导入自定义的 3D 对象，适用于多种业务场景。LEGENT 的推出标志着 AI Agent 技术向更高层次的进化。
来源原文

生成式 AI 营销平台 Tofu，获 1200 万美元 A 轮融资
生成式 AI 平台 Tofu 宣布获得 1200 万美元的 A 轮融资，由 SignalFire 领投，HubSpot Ventures 等多家投资机构参与。Tofu 致力于为营销团队提供个性化的 AI 工具，能够根据特定的人物角色或行业定制营销内容。该平台在过去一年实现了爆发式增长，收入增长了 12 倍，用户涵盖各种规模的营销团队。Tofu 的成功反映了生成式 AI 在营销领域的巨大潜力。
来源原文

从黑盒到透明：AI Agent 运行监控实战！
为了提高 AI Agent 的透明度，监控其运行过程变得至关重要。传统的对话系统难以追踪决策过程，而 AI Agent 则需要实时监控其性能指标、决策链路和输入输出。通过使用 OpenTelemetry 等工具，可以实现对 AI Agent 的全面监控，帮助开发者快速定位问题并优化性能。监控的关键在于保持适当的粒度，确保能够及时发现问题，同时不增加系统负担。
来源原文

雷军：决心把 AI 用到手机汽车和智能家居上
小米科技董事长雷军表示，小米将致力于将 AI 技术应用于手机、汽车和智能家居等多个领域，以提升消费者的生活质量。雷军强调，AI 技术的落地将为用户带来更好的体验，并提升中国产品在全球市场的影响力。
来源原文

20 万卡吞金兽 Grok 3 炸裂登场，卡帕西大神亲测：性能超过 DeepSeek R1！马斯克：短期不开源
xAI 发布了新一代 AI 模型 Grok 3，声称其性能超过 DeepSeek R1。Grok 3 的训练依赖于 20 万张 GPU，结合了推理能力，能够在数学、科学和编码任务中表现优异。马斯克表示，Grok 3 将用于 SpaceX 的火星任务计算，并预测其将实现诺贝尔级别的突破。尽管 Grok 3 在性能上表现出色，但其开源计划尚未确定。
来源原文

重估中国科技股：“十姐妹” 呼之欲出
进入 2025 年，全球科技公司的境遇发生了显著变化。中国科技股在 DeepSeek 的推动下表现出色，阿里巴巴、比亚迪、小米、拼多多、网易、京东、腾讯等公司股价大幅上涨。DeepSeek-R1 推理模型的发布进一步助推了恒生科技指数的上涨，引发了华尔街投资者对美国科技股的恐慌情绪。美国科技股市值蒸发 1 万亿美元，而中国科技股则迎来了重估。德意志银行和美国银行的报告指出，DeepSeek 的推出是中国经济的 “斯普特尼克时刻”，将推动中国科技股的价值重估。
来源原文

短期高估、长期低估 —— 微信接入 DeepSeek 的冷思考
微信接入 DeepSeek 引发了广泛关注，但其产品层面的准备显得仓促。微信搜索接入 DeepSeek 后，用户体验增量被夸大，许多功能尚未完善，如历史记录、上下文联动、文件上传等。微信团队的初衷可能是低调练兵，快速获得用户反馈。微信选择搜索作为切入点，是因为搜索在心智上属于 “短平快”，用户更倾向于搜完即走，从而节省 Token 成本。
来源原文

DeepSeek 行情，后续怎么看？
DeepSeek 宣布推出 NSA（Native Sparse Attention）技术，这是一种硬件对齐且原生可训练的稀疏注意力机制，用于超快速长上下文训练与推理。NSA 技术显著优化了 AI 模型的训练和推理过程，提升了长上下文的推理能力，并有效降低了预训练成本。DeepSeek 的 NSA 技术使 AI 模型训练更加降本增效，推动了 AI 应用的普及。
来源原文

(责任编辑：IT)

搜索

热门标签:

天天 AI-20250219