乌鸦AI日报:OpenAI o3o4-mini「幻觉」情况更严重;首个人形机器人半马完赛_欧宝体育在线登录入口官网-app客户端最新版下载
欧宝体育在线登录入口官网

乌鸦AI日报:OpenAI o3o4-mini「幻觉」情况更严重;首个人形机器人半马完赛

来源:欧宝体育在线登录入口官网    发布时间:2025-06-15 06:53:17

  据 The Crunch 报道,OpenAI 近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

  全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

  据TheCrunch报道,OpenAI近日推出的o3/o4-mini虽然在多方面有了不小的进步,然而新模型在「幻觉」内容(虚构的内容)方面,相较于旧模型会产生更多。

  报道指出,据OpenAI的内部测试,o3和o4-mini两款新模型比OpenAI此前的推理模型(o1、o1-mini、o3-mini)以及传统的非推理模型,都更容易产生幻觉。

  报道还表示,更令人担忧的是连ChatGPT的研发人员都不知道为何会这样:OpenAI在o3/o4-mini的技术报告中表示,需要更加多的研究内容来了解为什么随着推理模型的发展,反而幻觉情况反而更糟糕这一问题。

  昆仑万维的SkyReels团队推出了SkyReels-V2,这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术,明显提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破,还拓展了应用场景,包括故事生成和图生视频等,展现了其在创意内容制作领域的广泛潜力。

  科大讯飞于4月21日推出了其最新的人工智能模型——讯飞星火X1,旨在与OpenAI的o1和DeepSeek R1竞争。该模型在多个领域表现出色,尤其是在教育、医疗和司法等行业。尽管其模型参数较小,但整体效果与行业领先者相当。此外,讯飞星火X1的“快思考、慢思考”统一模型为用户更好的提供了灵活的思考方式,降低了企业使用AI的门槛。

  谷歌近期推出了Gemma3系列的新版本,特别是经过量化感知训练(QAT)优化的Gemma327B模型,明显降低了内存需求,使得用户能在消费级GPU上本地运行大型模型。QAT技术通过在训练过程中融入量化操作,减少了性能损失,提升了模型在小型设备上的运行效果。

  5)字节跳动研究开源 ChatTS-14B:原生理解并跟着时间的推移进行推理

  字节跳动研究团队推出了ChatTS-14B,这是一款专为时间序列数据设计的140亿参数大型语言模型,旨在通过自然语言接口降低时间序列分析的使用门槛。该模型的开源引发了广泛关注,标志着时间序列分析与生成式AI结合的重大进展。ChatTS-14B不仅提供了模型权重,还包括详细的使用文档和代码库,助力开发者在金融、医疗等领域的应用。

  全球首届人形机器人半程马拉松昨日在北京开跑。北京人形机器人创新中心研发的天工 Ultra凭借 2 时 40 分 42 秒的成绩获得冠军,松延动力 N2 机器人夺得亚军,上海卓益得机器人有限公司旗下行者二号机器人获得季军。

  但根据网络流传的视频,宇树科技 G1 人形机器人在跑步过程中摔倒,此后站起继续比赛。随后,宇树科技对此发布声明回应:最近绝对没参与任何比赛,主要忙着准备人形机器人的格斗直播。

  宇树科技将在2025年举办全球首场人形机器人格斗大赛,展示尖端技术与机器人格斗的魅力。参赛的G1人形机器人经过高强度训练,展现出卓越的灵活性和强大的战斗能力,尤其是在被击倒后能迅速恢复战斗,令人印象非常深刻。这场赛事不仅是技术的盛会,更将推动AI和机器人技术的发展,吸引全球科学技术爱好者的关注。

  Hugging Face通过收购Pollen Robotics推出开源人形机器人Reachy2,标志着人形机器人与生成式AI结合的重要里程碑。Reachy2以其友好的外观、先进的传感器和开源特性,迅速成为全世界顶尖实验室的关注焦点。该机器人不仅推动了机器人技术的主流化,也为AI和机器人研究提供了低成本的创新机会,展现了未来人形机器人市场的巨大潜力。

  字节跳动的全新AI协同办公平台“扣子空间”已进入内测阶段,旨在提升用户与AI Agent的协作效率。该平台具备自动分析客户的真实需求、拆解任务、调用工具等多项创新功能,能够生成完整的结果报告。此外,平台引入了专家Agent生态,用户可选择不相同的领域的专家进行深度分析,帮助获取更多洞察。

  Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,标志着在推动生成式 AI 技术普及和社区协作方面的重要一步。AI Playground 是一款专为 Intel Arc GPU 和集成显卡优化的工具,支持多种生成式 AI 模型,允许用户在本地生成 AI 图像并确保数据隐私。

  Figma正积极布局AI领域,计划推出一款AI应用程序制作器和Figma Sites网站创建工具。这些新工具旨在通过自然语言和现有设计资源快速生成应用程序和网站,降低开发门槛,使非技术背景的设计师也能轻松构建功能性应用。Figma的这一系列创新不仅提升了设计与开发的智能化水平,还可能重新定义行业协作模式,尽管面临来自Webflow和Wix等平台的竞争。

  据彭博社报道,大模型竞技场 Chatbot Arena 正式公开宣布转型为商业公司 LMArena。Chatbot Arena 创立于 2023 年初,最初是加州大学伯克利分校天空计算实验室(Sky Computing Lab)的一个学术研究项目,如今每月吸引超过一百万访客,已发展成为 AI 基准测试领域的权威指标。

  LMArena 目前发布了新网站的早期版本,但尚未确定具体的商业模式。一种可能性是向希望能够通过该网站测试 AI 模型的公司收费。创始人 Ion Stoica 表示,公司计划筹集资金支持未来发展,但拒绝透露更多融资细节。

  PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  洛杉矶移民抓捕 引发全美怒火! 特朗普政策或让 美经济损失1.7万亿美元

  发现一个奇怪的现象:现在的农村,不炫耀彩礼收了几十万,不炫耀女儿嫁到大城市,就炫耀女儿嫁给了公务员

  以色列军方:已确认伊朗在生产核弹的武器零部件方面取得具体进展,表明伊朗政权正在接近无法回头的地步

  江苏两地中考作文曝光!省教育厅官宣:今天开始!江苏各地进入“中考时间”!

  黄仁勋亲笔签名版 RTX 5090 镀金显卡以 24200 美元达成慈善拍卖