Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/www.klnwj.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/www.klnwj.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/www.klnwj.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/www.klnwj.com/inc/func.php on line 1454
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红_米乐平台客户端
米乐客户端
技术文章

联系我们

您所在的位置:首页 > 技术及服务 > 技术文章

AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红

更新时间:2025-01-11 作者:米乐客户端

  以下是我们第 2 期 AI 月报,欢迎各位在留言区补充我们没提到的重要进展。

  技术|10 亿美元没训出 GPT-5,新版 Scaling Laws 初步证明可行,多款世界模型亮相

  OpenAI 训练 GPT-5(代号 Orion)遇阻,是大模型能力提升放缓的重要证据。12 月,多家媒体提供了更多的细节:

  2023 年 4 月推出 GPT-4 后,OpenAI 一直在开发 GPT-5,已经持续 20 个月。OpenAI 看到过乐观信号:24 年 4 月,OpenAI CEO 山姆·阿尔特曼(Sam Altman)在斯坦福大学的演讲中说,GPT-5 将比当时的模型聪明得多;5 月,他在企业内部也发表了类似的看法;OpenAI 最大的投资方微软预计年中能看到 GPT-5。

  阿尔特曼当时在企业内部说,虽然(应该是第二遍训练)GPT-5 的训练过程只完成了 20%,但它回答问题、达成目标等能力已经与 GPT-4 相当。但从那之后,GPT-5 的性能提升放缓,最后并没有超出 GPT-4 太多。而 OpenAI 一直希望 GPT-5 能到博士生水平。

  到 12 月,OpenAI 至少从头训练了两遍 GPT-5,都未达到预期。OpenAI 内部和行业人士估计,OpenAI 训练一遍 GPT-5,算力成本就有 5 亿美元。

  OpenAI 训练 GPT-5 的麻烦是缺少多样化、高质量的数据。此前,OpenAI 几乎抓了网络上所有公开的优质数据,并尽可能购买大量版权数据,还是不够。

  OpenAI 的处理方法是,用大模型生成数据训练模型。这种方法存在问题,大模型本身就是它训练数据的压缩,所以 AI 生成的数据质量通常较差。OpenAI 的科学家们认为,他们的新模型 o1 能够尽可能的防止这些问题。

  OpenAI 也在雇佣一批人写数据。他们不再是在经济落后区域做数据标注或审查内容的工人,而是软件工程师、数学家、物理学家等。OpenAI 让他们编写复杂题目、给出答案,把最高效的解题过程写下来。一部分研究者还认为,代码数据能帮大模型解决尚未遇到的问题。

  但这个过程比较缓慢。假设 1 人 1 天写 5000 字,1000 人要 200 天才能生产 100 亿字的数据,而 GPT-4 训练的数据量超过 10 万亿字。

  此外,还有另一个数据证明,更多人工能提升大模型能力。12 月,AI 软件基础设施公司 LangChain 发布年度报告,用他们工具的大模型应用开发者,拿人类反馈提升大模型能力的次数增长了 18 倍。

  一位中国云计算平台企业 AI 应用负责人告诉我们,基于人类反馈的强化学习,现在已经成为他们为大型客户提供 AI 服务的标配。

  2024 年 9 月,OpenAI 发布 o1 模型,称模型花更多时间、更多算力回答问题(test-time compute),能力会持续提升。那时,大模型训练有了陷入瓶颈的迹象——增加数据、算力,扩大模型参数规模,但性能提升缓慢。

  3 个月后,OpenAI 正式放出 o1,用实际能力证明它解决数学题或编程问题时,的确比 GPT-4o 等模型更强。比如它几乎每一次都能判断 9.9 比 9.11 大,GPT-4o 现在不行。

  12 月亮相的新模型 o3,证明 OpenAI 从 o1 中看到的规律——回答问题时花更多算力的 o3,在顶尖编程竞赛 CodeForces 中,得分比 o1 提升 44%,超过 OpenAI 首席科学家,排进人类前 200;在前沿数学测试基准 EpochAI 中解决 25.2% 的问题,其他模型都没有超过 2%。

  “当山姆和我们的研究人员说 AGI 即将到来,不是为了推销每月订阅费达到 2000 美元的服务,也不是诱骗投资。”OpenAI 的研究员约翰·霍尔曼(John Hallman)说。

  此外,o3 成本高昂,高性能模式算一次上千美元。而且和 o1 一样,o3 在数学、编程等理科场景表现突出,在处理文本方面大概率跟 GPT-4o 没太大差别。

  OpenAI 还公布了一种针对 o 系列模型的微调方法,称为 RFT(Reinforcement Fine-Tuning),开发者能用强化学习的方法提高 o 系列模型解决特定任务的能力。训练 o 系列模型时,OpenAI 就用了强化学习。他们最新的动作表明,强化学习在大模型领域会越来越重要。

  Google 这两款模型,指向大模型更广泛应用时的迭代方向:降低成本、提高 Agent 能力。

  正如 Meta CEO 马克·扎克伯格(Mark Zuckerberg)所说,“即使大模型不再改进,在现有技术上开发消费和企业产品,也有很大的空间。”

  微软早就看准这个方向,这个月推出第四代 Phi 大模型,只有 140 亿参数,但数学题推理等任务上要强过 Google 的 Gemini Pro 1.5 等参数更大、算力消耗更多的模型。

  Google 推出 Gemini 2.0 Flash 时,还强调它专为 “Agent” 开发。与其他大模型不同,Google 训练模型时,就尝试提升模型调用 Google 搜索、代码执行和第三方定义函数等工具的能力。推出模型时,Google 也发布了用于科研、编程等的多款 Agent 应用。

  我们在上期月报中提到,Agent 是当前大模型行业的新趋势,从 Google 到微软等大公司,OpenAI 到 Anthropic 等明星 AI 创业公司,以及新出现的创业公司都在探索这个方向。

  硅谷孵化器 YC 的合伙人们认为,Agent 会是新时代的 SaaS,市场空间要比当前的 SaaS 大 10 倍。

  OpenAI 终于发布视频生成模型 Sora,底层技术没有太大的更新,决定了它一发布就陷入包围圈。10 个月过去,在 OpenAI 带队训练 Sora 的研究者之一蒂姆·布鲁克斯(Tim Brooks)都被 Google 挖走了。

  Sora 放开后不久,Google 就推出了新的视频生成模型 Veo 2,称它可以生成分辨率高达 4K、长度超过 2 分钟的视频,都超过 Sora。不过 Google Veo 2 还是期货,就像当时的 Sora。

  OpenAI 在这一方向上面临的压力不止于此。他们在 2 月介绍 Sora,说沿着视频生成模型扩展,是开发物理世界模拟器的一条有前途的路径。

  现在已经有了多个团队取得了成果,跟 OpenAI 没太大关系。以色列创业公司 Decart 用大模型生成了名叫 Oasis 的开放世界游戏,就像 “我的世界” 那样,已经吸引上百万用户。这个月,还有三个团队发布新成果:

  DeepMind 推出 Genie 2 模型,宣称可以生成不同视角的、连贯的虚拟世界,大多数情况持续 10~20 秒,最长可以达到一分钟。比如用户输入 “森林中的可爱人形机器人”,模型可以生成一个包含机器人角色、可以探索的动态场景。用户可以用键盘或鼠标操作角色在场景中行动、跳跃、游泳等。

  知名 AI 科学家李飞飞创办的公司 World Labs 推出首个项目,根据一张 AI 生成的图片,加上提示词,就可以生成类似 3D 游戏中的场景。他们有 Genie 2 模型那种可以交互的能力,并强调可以修改场景。

  CMU、英伟达、北大等 19 个机构的团队发布 Genesis,称其是一种新的开源计算机模拟系统,机器人可以在其中模拟、学习要在现实中执行的任务,比如捡东西、走路、操作设备等,速度比现实世界快 43 万倍。他们展示了机器人迅速在 Genesis 环境中学会后空翻,用到机器狗上的情况。他们在研究生成 “4D 动态世界” 的能力,然后利用 Genesis 的能力创建世界。

  DeepMind 没有把所有的团队都押注在大模型上,还在持续研究怎么用 AI 研究量子计算、生物、核聚变、天气预报等。

  这个月,DeepMind 发布新款的天气预报模型 GenCast,用 40 年的天气数据训练,宣称只用一块 TPU ,就能在 8 分钟内生成 15 天的天气预报,现有的天气预报系统用超级计算机需要数个小时,准确率还不高。

  差别在于,传统的方法是计算复杂的物理公式,而 DeepMind 的方法是从海量数据中寻找规律。DeepMind 在《自然》杂志发表的论文中写道,他们的 AI 预测飓风的前进路径的准确度,始终强过欧洲天气预报中心,会有助于减少灾害造成的损失。

  相比各个公司发布模型时强调的 MMLU、GPQA 等基础测试,Chatbot Arena 让用户对匿名的大模型回答评分,更偏向用户实际感受。

  2023 年 4 月,加州大学伯克利分校的两名研究者推出 Chatbot Arena 以来,OpenAI 的模型长期在榜首。如果被挤下来,OpenAI 也会更新模型冲上去。

  过去这个月,OpenAI 推出了正式版 o1,但在聊天机器人这个大模型最主流的应用场景中,它的评分还比不上 GPT-4o,以及 Google 发布的同类模型 Gemini 2.0 Flash Thinking。

  9 月,Google 推出更新版的 NotebookLM,用户可以根据上传的文档等资料,与大模型自由问答,甚至生成播客内容,引发了好评。再加上这个月的进展,Google 终于有了一种支棱起来的感觉。半年前,它还因为自己的大模型建议人吃石头、在披萨上涂胶水受到嘲笑。

  据媒体报道,2024 年 Google CEO 桑达尔·皮查伊用了多种方法提升员工的战斗力:

  与员工交流时,经常提到两位创始人,提醒创业艰难。两位创始人目前在 Google 活跃,参与 AI 研究;

  把 AI 团队正在研发中的大模型技术放开给一些员工,让他们提前开发合适的产品。两年前,Google 还会担心这些技术会带来负面影响,迟迟不愿发布;

  亲自参加 AI 研发团队的会议,推动员工快速推出类似 NotebookLM 这样的产品等,简化公司组织架构,比如裁掉 10% 的中层。

  Google 的 2025 年战略会议上,皮查伊提出新目标:确立 Gemini 的领导地位,重点是扩大 Gemini 的用户规模——这也是 OpenAI 关注的焦点。

  DeepSeek 是中国量化私募基金公司孵化、支持的 AI 公司。相关论文显示,他们只用 578 万美元——这是 Meta 训练 Llama 3.1 不到 1/10 的 GPU 资源——就取得了更好的效果,多个基准评测得分逼近大模型 GPT-4o、Claude 3.5 Sonnet,迅速走红。

  “资源受限条件下令人印象深刻的研究和工程工作。”OpenAI 创始成员、特斯拉前自动驾驶负责人安德烈·卡帕斯 (Andrej Karpathy) 说。

  “因为在 AI 开源中取得了领先地位,中国将在 2025 年开始引领 AI 竞争。”AI 社区 Hugging Face CEO 克莱门特·德兰格 (Clement Delangue) 预测。他 12 月在一档播客节目中说,要警惕中国的开源大模型,“不应该有任何一个或两个国家的 AI 模型比其他国家强大得多”。

  用 OpenAI 等公司的模型生成数据,拿去训练大模型,在大模型行业中已经是公开秘密。

  有媒体报道,截至 2024 年 3 月,字节跳动还通过 TikTok 找微软调用 OpenAI 的模型,每个月花费 2000 万美元。比如用户问 DeepSeek 最新的模型自己是谁,它会说自己是 OpenAI 开发的大模型。

  随着 OpenAI 发布 o1 模型,许多公司也换了基础设施,改用它生成数据训练模型。

  虽然 OpenAI 在公开版本中隐藏 o1 的思维链(思考如何解题的过程),这并没有难倒其他公司的开发者:他们拿着 o1 吐出来的答案,让其他大模型预测 o1 回答问题的原始思维链,然后再拿这些数据训练模型。

  因为 OpenAI 也在用 o1 等模型生成数据训练模型,这意味着其他公司与 OpenAI 的差距,或许比之前更小了一些。

  12 月,芯片公司博通公布 2024 年的 AI 收入,增长 220% 达到 122 亿美元。在这个消息的推动下,博通的股价一天上涨超过 24%,成为芯片行业第三家市值突破万亿美元的公司。之前两家分别是英伟达和台积电。

  博通市值上涨的推力和英伟达一样,都是大型科技公司大力投资 AI 算力中心。区别在于,英伟达出售 GPU,博通出售自研 AI 芯片方案,正帮助 Google、Meta、字节跳动、苹果、OpenAI 等公司开发 AI 芯片,以摆脱对英伟达的依赖。字节跳动曾否认与博通合作。

  博通 CEO 陈福阳(Hock Tan)接受媒体采访说,他们在硅谷的客户正在匆忙地制定未来 3、5 年的 AI 基础设施投资计划,到 2027 年会有客户建设百万 AI 芯片的集群。

  博通 2024 年的市值涨幅还是比不上英伟达,它涨了 110%, 英伟达是 171%。

  12 月,英伟达也没有停下来。根据 SemiAnalysis 报告,随着 OpenAI 在 3 个月内接连发布 o1、o3 推理模型,英伟达跟着推出 GPU B300,适应最新的风向。此时距离英伟达推出 B200 不过半年。

  与 B200 相比,B300 的算力、显存分别提高 50%,功率也上涨到 1.2 kW,消耗的更多的电力,可以减少 o1 这类推理模型的延迟和计算成本,也能支持更长的思维链。目前,许多公司已经把原本采购的 B200 订单换成 B300。

  马斯克旗下 xAI 宣布,很快就要把原本 122 天建成的 10 万张 H100 算力中心拓展到 20 万张。马斯克说,未来会增加到 100 万张。

  媒体报道,字节创始人张一鸣与东南亚等地区的数据中心运营商谈判,以便明年投入 70 亿美元租用英伟达 Blackwell 系列 GPU 的算力。

  媒体报道,Google、Meta 各自订购了超过 40 万个预计 2025 年交付的 GB200 芯片,包括服务器在内的投入可能超过 100 亿美元。

  借着 o1 模型和 Sora 正式发布,OpenAI 把 ChatGPT 订阅费用推高到了每月 200 美元,他们还打算用 o3 推高到每月数千美元,在 ChatGPT 中加广告。

  OpenAI 在 12 月的发布活动,大都是围绕 ChatGPT 这个周活用户突破 3 亿的超级应用,给它增加新功能、降低它的使用门槛或者吸引更多用户花更多钱买会员:

  第一天,正式推出 o1。每月付 20 美元的 ChatGPT 用户,可以限量使用新模型 o1;如果每月付 200 美元,可以 “无限” 使用 o1 和 GPT-4o,还能用一个版的 o1,能调更多算力解决复杂问题。

  第三天,正式推出 Sora。每月付 20 美元的 ChatGPT 用户,每个月只能生成 50 个分辨率 480p 或数量更少的 720p 视频;每月付 200 美元的用户,用量扩大 10 倍,可以生成 1080p 分辨率、20 秒的视频,还能去掉视频水印。

  第四天,正式推出 ChatGPT 的 Canvas 功能。它可以编辑审阅文档,批注修改意见,也可以帮助程序员写代码、找 bug 等。所有的 ChatGPT 用户(包括免费用户)都可以使用,差别在于付费的用户可以调用更多次数的 GPT-4o 或 o1 模型。

  第五天,宣布把 ChatGPT 集成到苹果的系统中。苹果用户可以通过 Apple Intelligence 功能直接调用 ChatGPT。这一合作在 2024 年 6 月的 WWDC 上就已经宣布。

  第六天,升级 ChatGPT 的语音功能。部分地区的 ChatGPT 的付费用户可以使用,用户将手机摄像头对准物体或人,ChatGPT 可以近乎实时地给出反馈。ChatGPT 还可以读取屏幕上的内容,实时与用户交互。

  第七天,推出 ChatGPT 的 Projects 功能。它可以帮用户整理与 ChatGPT 交互情况,比如其中涉及的文件和数据等,目前只给付费的用户使用。此前 OpenAI 的竞争对手 Anthropic 已经在 Claude 中上线了类似的功能。

  第八天,拓展 ChatGPT 的搜索功能。免费的用户也可以使用,并提升了响应速度。

  第十天,把 ChatGPT 接入电话网络和 WhatsAPP。美国用户拨打 1- 可以与 ChatGPT 通线 分钟免费通话时间。全球用户可以通过 WhatsApp 使用这一号码与 ChatGPT 交流(仅限文字)。

  第十一天,把电脑版 ChatGPT 集成到编程等生产力工具中。只有付费用户可以使用。ChatGPT 与 Warp(文件共享应用)、XCode(编程应用)、Notion(笔记应用)等打通。这并不是一个全新功能,我们在 11 月的 AI 月报中就介绍过。

  举办 12 场发布活动之前,OpenAI 在官网发布一篇文章,介绍他们拓展企业客户时的合作伙伴,让外界有机会更进一步了解其如何运作。和微软一样,这些公司也帮 OpenAI 销售模型的 API、ChatGPT Enterprise、ChatGPT Edu、ChatGPT Team 等企业服务,只是环节不同:

  除了这些合作商,OpenAI 还与美国国防创业公司 Anduril 和 Palantir 谈判,要一起组建财团,竞标国防合同。

  不论是吸引更多个人消费者用 ChatGPT,还是开拓企业客户,OpenAI 的方法有一个共性:嵌入到已有的行业生态中去。这个月,我们也看到在已有的行业生态中占据优势地位的公司采取积极行动。

  贝尼奥夫还顺口评价了一下微软,在他们网站上,“你是找不到(AI 软件)的”。在企业服务市场上,他们是竞争对手。

  微软在这个月也提出了一个推广大模型应用的新口号:“如果你使用它们(AI),你就不需要雇那么多人了。” 他们也在用自研的大模型和第三方大模型驱动核心产品 365 Copilot,目标是减少对 OpenAI 的依赖,降低成本。

  还有创业公司与这些大公司们竞争,比如 AI 语音公司 ElevenLabs 推出对标 NotebookLM 的播客生成功能。目前 Google 的 NotebookLM 只能生成英文播客,而 ElevenLabs 宣称支持 32 种语言。上个月,这家 AI 公司以 30 亿美元的估值融资 2 亿美元。

  苹果机器学习和 AI 策略高级副总裁约翰·吉安南德雷(John Giannandrea)本月接受采访,谈到苹果开发 Apple Intelligence 的策略:首要目标是改进产品体验,就像此前把人脸识别技术用来解锁 iPhone 中那样。他说,苹果对 AGI 不感兴趣,认为 AGI 不切实际,甚至有些 “荒谬”。

  12 月,行业对 AI 硬件的探索还在继续。靠着与雷朋眼镜合作推出 Ray-Ban AI 眼镜的 Meta,计划 2025 年在这款产品上增加屏幕,用于显示 Meta AI 助手的通知或回复。

  这样与 AI 的交互形式,在此前的 AI 硬件探索中都已经存在。比如 2024 年初正式发售的 AI Pin 想用激光投影当屏幕,Rabbit R1 干脆是造了个带屏幕的硬件。但它们都没有说服用户,为什么一定要再买个新产品,而不是用手机。Meta 用 Ray-Ban AI 眼镜验证了市场需求,现在希望更进一步。

  Ray-Ban AI 眼镜的火热,也刺激了中国 AI 眼镜市场。我们在 12 月发布的一篇 AI 眼镜报道中写道,2025 年会是 AI 眼镜元年,会有近百个品牌发布产品,掀起 “百镜大战”。

  AI 硬件的探索也不只在消费者市场。临近月底,有媒体报道,OpenAI 重新组建了四年前解散的机器人软件团队,考虑开发一款人形机器人。在此之前,OpenAI 已经投资 Figure、1X 两家人形机器人公司和研发机器人 AI 模型的 Physical Intelligence。

  OpenAI 在 12 月正式启动转型成一家营利公司的计划,把原来监督、控制 OpenAI 的非营利机构变成一个股东,理由是方便融资,研发 “造福人类的 AGI”。

  之前,他们在官网上公布创始团队早期与马斯克沟通的邮件,论证转型合理。加上马斯克公布的邮件,我们整理、翻译了 75 封 OpenAI 内部邮件,你可以在这里看到。

  许多公司的融资消息上月就已经被媒体报道。比如马斯克旗下的 xAI 融资 60 亿美元;AI 搜索产品 Perplexity 以 90 亿美元估值筹到 5 亿美元;AI 编程应用 Cursor 拿到 1 亿美元融资等,这个月不再重复提到。

  在本月获得大额融资的 AI 公司中,大多数都在 ChatGPT 上线前已经成立,尤其是应用公司,它们长期针对一个行业提供 AI 解决方案。

  智谱 AI 融到 30 亿元,估值达到 200 亿元人民币。智谱称,2024 年公司的商业化收入增长超过 100%,新资金将会用于研发解决复杂推理、多模态任务的基础大模型。

  阶跃星辰完成一轮融资,总融资额达数亿美元。主要用于基础模型研发,提高模型多模态和复杂推理能力——跟智谱一样。但阶跃星辰也想扩大 C 端产品的用户规模,与月之暗面接近。

  SandboxAQ 融资超过 3 亿美元,估值超过 56 亿美元。SandboxAQ 之前是 Google 母公司 Alphabet 旗下的公司,2022 年分拆独立。它专门为生物、医学、化学、材料等领域开发 “大型定量模型”。他们用传感器中获得数据或者根据方程生成的数据训练模型,宣称精确到 “一个分子的一亿次微小的改变”。他们计划未来不只用 GPU 跑模型,也会引入量子芯片。

  Liquid AI 融资 2.5 亿美元,估值超过 20 亿美元。它成立于 2023 年,开发一种从蠕虫大脑结构发现的 “液态神经网络”(LNN)架构,宣称与 Transformer 架构相比,新架构需要的数据和算力都更少。Liquid AI 说,他们正在把技术用到消费电子和金融服务行业。

  爱诗科技(PixVerse)融资 3 亿元人民币,它成立于 2023 年,开发对标 Sora 的文生视频模型。新一轮的投资方主要是蚂蚁集团、北京市人工智能产业投资基金、国科投资及光源资本。

  12 月还有至少 9 家 AI 模型公司获得超 1000 万美元融资,中国开发多模态大模型的智象未来、开发端侧大模型的面壁智能、开发具身智能模型的穹彻智能等都宣布获得数亿元人民币融资。

  Databricks 计划单轮融资 100 亿美元,估值达到 620 亿美元。它成立于 2013 年,主要业务是为企业提供数据和 AI 云服务。目前 Databricks 已融到 86 亿美元。Databricks 称,他们计划将这笔资金用于 AI 产品研发、收购公司以及国际扩张。Databricks 预计 2024 年四季度收入将突破 30 亿美元,自由现金流转正。

  Tenstorrent 融资 7 亿美元,估值达到 26 亿美元。它成立于 2016 年,基于 RISC-V 架构开发 AI 芯片,是市场上少有的挑战英伟达的创业公司。创始人是半导体先驱吉姆·凯勒 (Jim Keller) ,此前在苹果、特斯拉、AMD 工作,给这些公司的芯片业务打下基础。

  Nebius 融资 7 亿美元。它前身是俄罗斯搜索引擎公司 Yandex,2024 年转型为 AI 云服务供应商,利用专有的云软件架构和内部设计的硬件,为 AI 开发者提供算力、存储和托管服务。

  Crusoe 融资 6 亿美元。它成立于 2018 年,之前主要用被浪费的天然气为挖矿的数据中心供电,现在转型给 AI 算力中心供电,已经与甲骨文、微软和 OpenAI 建立合作。

  Vultr 融资 3.33 亿美元,估值 35 亿美元。它成立于 2014 年,可以按小时出租 GPU 算力。这轮投资方主要是 AMD。AMD 也开始像英伟达那样扶持一批 AI 云公司。

  Ayar Labs 融资 1.55 亿美元,估值 10 亿美元。它成立于 2015 年,开发利用光传输数据的方案,这轮的投资方是 AMD、英特尔、英伟达三家芯片公司。

  Axiado 融资 6000 万美元。它成立于 2017 年,开发一个名为 TCU 的安全芯片,用于防范针对云数据中心、5G 网络和关键基础设施的网络攻击。

  12 月,还有两家 AI 基础设施公司获得超过 1000 万美元融资。一家是 Stainless,把 OpenAI 、 Anthropic 和 Meta 等公司模型的 API 自动生成 SDK,简化应用程序的开发速度;另一个家是 Cake,把开源 AI 技术整合成一个可以投入使用的工具。

  Zest AI 融资 2 亿美元。它成立于 2009 年,原本叫 Zest Finance,主要为金融机构提供大数据和机器学习信用评分方案,2019 年改名为 Zest AI。之前百度、京东都投资过它,在自家业务中引入其技术。

  Tractian 融资 1.2 亿美元。它成立于 2019 年,利用传感器、边缘计算硬件和 AI 模型监控工业设备,预测可能的故障,减少停机时间。

  Aiwyn 融资 1.13 亿美元。它成立于 2019 年,用 AI 技术把会计的工作自动化,主要的客户是注册会计师事务所。

  Cleerly 融资 1.06 亿美元。它成立于 2017 年,最新的动向是用 AI 技术分析心脏 CT 影像识别早期冠状动脉疾病等。

  AMP Robotics 融资 9100 万美元。它成立于 2014 年,开发了机器人分拣系统,用 AI 识别、分类垃圾和回收物。

  Speak 融资 7800 万美元,估值 10 亿美元。它成立于 2016 年,主要用 AI 帮人学习新语言。它不像多邻国那样把学习过程变得游戏化,而是强调培养用户真实场景中的口语能力。Speak 宣称,目前公司收入达到千万美元级别。

  Sublime Security 融资 6000 万美元。它成立于 2019 年,聚焦电子邮件安全防御场景,用 AI 技术检测和防御网络钓鱼、恶意软件等电子邮件攻击,客户有 Spotify、Reddit 等。

  Anybotics 融资 6000 万美元。它成立于 2016 年,是苏黎世联邦理工学院(ETH Zurich)孵化出来的公司,主要开发用于工业巡检的机器狗 ANYmal。

  9fin 融资 5000 万美元。它成立于 2016 年,原本用 AI 分析债务资本市场情报数据,现在用大模型技术搜索最新的数据。

  12 月,还有 24 家 AI 公司拿到了超过千万美元的融资,他们的特征与上述公司类似:ChatGPT 火热之前就已经成立,把 AI 技术用到特定行业的场景中,比如客服、物流、律师、会计、运维、市场调研、制药等。

  大模型一直存在 “幻觉” 问题,即一本正经地胡说八道,给出不符合事实的信息。能不能避免这一些错误,也成为衡量一家公司大模型好坏的指标。Google 就因为大模型给出的回复不对劲,市值一度下挫千亿美元。

  这个月,AWS 推出了一个工具对抗大模型幻觉,主要原理是,大模型给出答案前,工具会调用客户提前上传的资料交叉验证是否准确。此前微软、Google 都推出过类似的功能。

  但幻觉并不是一无是处。NYT 发布的一篇报道采访了多位使用大模型的科学家提供了另一种视角:

  计算机科学家艾米·麦戈文 (Amy McGovern)说:“它实际上给科学家带来了新的想法。让他们有机会探索原本可能不会想到的点子。”

  麻省理工学院教授詹姆斯·柯林斯(James J. Collins)说,他要求模型提出全新的分子,“幻觉” 加速了他们研究新型抗生素。因为 AI,科学领域曾经要花费多年时间解决的事情,现在几天、几小时和几分钟内就可以完成。

  华盛顿大学的生物学家戴维·贝克 (David Baker),因为快速创建自然界中未发现的全新蛋白质种类,获得了 2024 年的诺贝尔化学奖。贝克将 AI 的想象力爆发视为自己从头开始制造蛋白质的核心。他说这项技术已帮他的实验室获得了大约 100 项专利。

  他们认为,大模型的想法不虚幻,反而会有前瞻性——有一定的机会实现。他们将其比作科学研究早期阶段的猜想,认为 “幻觉” 这个词并不准确,会避开使用它。

  目前都是在讲的应用。从理论上应该把深度学习黑盒模型的可视化,总结出自回归模型如何在其中发挥作用的规律。

  这就是人间不公!731部队细菌战犯逃回日本后,很多人在医院、学校等公立机构担任要职

  731部队是日本军国主义者在第二次世界大战期间下令组建的细菌战秘密部队之一。1931年到1945年期间,731部队进行骇人听闻的人体实验和细菌战等,在中国犯下滔天罪行。数千名中国、苏联、朝鲜战俘和中国平民被用于人体细菌和毒气实验。

  今天一大早,杭州一位比亚迪车主告诉橙柿互动,一早出门打开手机,结果发现比亚迪的App始终没有办法连接,导致他无法开启车门,早高峰出行计划全部被打乱,他被迫步行上班。橙柿互动记者在社交平台上看到,多位网友也发帖表示,比亚迪App疑似崩溃。

  美媒:美国多地出现“神秘大雾”,部分当地民众怀疑美军在秘密进行“生物战实验”

  据英国《每日邮报》6日报道,自2024年12月以来,美国多地出现“神秘大雾”,不少人自称接触后不久就发烧咳嗽。

  潮新闻政治骗子冒充国学大师弟子中石油干部坠入其迷魂局徐文荣,中国石油原党组副书记、副总经理。他平时就信奉圈子文化,热衷于组局吃喝,通过饭局攒人脉拉关系。

  手机电量还剩多少,对现代社会的许多人而言,都是一个“性命攸关”的问题。人们对手机充电的强烈需求,也让市面上催生出了许多噱头:无线充电,二倍速充电,以及能连着用一周的高能充电宝。乱花渐欲迷人眼,但到底什么才是手机充电的正确姿势呢?手机一定要满充满放吗?

  1月9日,李明德发文宣布退圈:从今天开始,不会再发任何有关剧组的事宜,交给法律,一切判罚结果我独自承担!另:我只想回归普通人的生活,做一个普普通通的,活着的人!靠自己的双手养活自己!不要再批判我了!我也需要生存,我已经不是“明星”了,我现在是北漂小李!望周知!!

  79岁的袁大爷自从自己的妻子去世后,始终没再找一个伴侣,用袁大爷的话说,自己有生理需求了就去外面找,结果袁大爷一不小心得了艾滋病,大家都了解这一个艾滋病一般都是通过血液或者是发生性关系传播的,当别人问到袁大爷怎么不采取防御措施时,袁大爷振振有词的回道:“她又不会怀孕,我用啥避孕套

  声明:本文内容均是根据权威资料,结合个人自己的观点撰写的原创内容,文未已标注文献来源及截图,请知悉。