• t04d9839e9a1aa82d67
    1.5 MoE架构的核心优势在于,它通过动态专家调用+稀疏化计算,在保持稠密模型推理深度的同时,显著降低了计算资源的消耗,实现了高精度与高效率的完美平衡
    1.5 MoE架构的核心优势在于,它通过动态专家调用+稀疏化计算,在保持稠密模型推理深度的同时,显著降低了计算资源的消耗,实现了高精度与高效率的完美平衡
    1.5 MoE架构的核心优势在于,它通过动态专家调用+稀疏化计算,在保...
  • 2026-01-02_160432_739
    1.2 该系统被业界广泛视为迈向生产级图像生成的关键一步,不仅在画质分辨率和编辑能力方面实现突破,还通过开放权重open-weights策略推动开源生态的发展
    1.2 该系统被业界广泛视为迈向生产级图像生成的关键一步,不仅在画质分辨率和编辑能力方面实现突破,还通过开放权重open-weights策略推动开源生态的发展
    1.2 该系统被业界广泛视为迈向生产级图像生成的关键一步,不仅在画质分...
  • 2025-12-31_220933_835
    12.31 该模型聚焦**更真实的人物质感更细腻的自然纹理更复杂的文字渲染**三大核心能力升级,显著降低生成图像的AI感,推动AI图像生成向真实世界无限逼近
    12.31 该模型聚焦**更真实的人物质感更细腻的自然纹理更复杂的文字渲染**三大核心能力升级,显著降低生成图像的AI感,推动AI图像生成向真实世界无限逼近
    12.31 该模型聚焦**更真实的人物质感更细腻的自然纹理更复杂的文字...
  • 2025-12-30_160742_925
    12.30 全球科技界迎来一则重磅消息美国科技巨头MetaPlatforms原Facebook宣布以数十亿美元对价闪电收购AI智能体平台Manus,此举被广泛视为Meta在通用人工智能AGI赛道上的关键落子,也标志着中美技术交融与竞争背景下一次罕见的高调跨国并购
    12.30 全球科技界迎来一则重磅消息美国科技巨头MetaPlatforms原Facebook宣布以数十亿美元对价闪电收购AI智能体平台Manus,此举被广泛视为Meta在通用人工智能AGI赛道上的关...
    12.30 全球科技界迎来一则重磅消息美国科技巨头MetaPlatfo...
  • 2025-12-29_142323_654
    12.29 整个流程始于一个结构化的分镜脚本storyscript,系统首先用文本到视频T2V模型生成故事的开场镜头,并将其关键帧存入记忆库
    12.29 整个流程始于一个结构化的分镜脚本storyscript,系统首先用文本到视频T2V模型生成故事的开场镜头,并将其关键帧存入记忆库
    12.29 整个流程始于一个结构化的分镜脚本storyscript,系...
  • 2025122501
    12.25 不同于过往以牺牲画质换取速度的方案,TurboDiffusion在几乎不损视觉质量的前提下,实现了**100至200倍**的端到端推理加速,将原本动辄数十分钟的视频生成任务压缩至**数秒内完成**,真正意义上推动AI视频创作走向实时化
    12.25 不同于过往以牺牲画质换取速度的方案,TurboDiffusion在几乎不损视觉质量的前提下,实现了**100至200倍**的端到端推理加速,将原本动辄数十分钟的视频生成任务压缩至**数秒内...
    12.25 不同于过往以牺牲画质换取速度的方案,TurboDiffus...
  • 2025122405
    12.24 这款仅2.7亿参数的轻量级模型专为函数调用FunctionCalling设计,可在手机浏览器乃至IoT设备上高效运行,无需依赖云端连接,为开发者带来低延迟高隐私低成本的AI交互新范式
    12.24 这款仅2.7亿参数的轻量级模型专为函数调用FunctionCalling设计,可在手机浏览器乃至IoT设备上高效运行,无需依赖云端连接,为开发者带来低延迟高隐私低成本的AI交互新范式
    12.24 这款仅2.7亿参数的轻量级模型专为函数调用Function...
  • 2025122401
    12.24 Cline平台称其已成为平台上最受欢迎的模型之一,而Fireworks平台联合创始人BennyChen表示M2.1在复杂指令遵循重排序和分类任务上表现优异,尤其是在电商场景中
    12.24 Cline平台称其已成为平台上最受欢迎的模型之一,而Fireworks平台联合创始人BennyChen表示M2.1在复杂指令遵循重排序和分类任务上表现优异,尤其是在电商场景中
    12.24 Cline平台称其已成为平台上最受欢迎的模型之一,而Fir...
  • 2025-12-23_150554_431
    12.23 与以往单纯聚焦大参数或多模态的路线不同,GLM-4.7以智能体化能力为核心,系统性重构了模型的推理编码与工具协同机制,被业内称为最像程序员的开源大模型
    12.23 与以往单纯聚焦大参数或多模态的路线不同,GLM-4.7以智能体化能力为核心,系统性重构了模型的推理编码与工具协同机制,被业内称为最像程序员的开源大模型
    12.23 与以往单纯聚焦大参数或多模态的路线不同,GLM-4.7以智...
  • 2025-12-19_160051_611
    12.19 传统视觉AI系统通常将图像识别文本生成图像text-to-image以及图像编辑如局部替换风格迁移视为独立任务,需调用不同模型训练不同参数,不仅资源消耗大,而且任务间的语义断层限制了整体表现
    12.19 传统视觉AI系统通常将图像识别文本生成图像text-to-image以及图像编辑如局部替换风格迁移视为独立任务,需调用不同模型训练不同参数,不仅资源消耗大,而且任务间的语义断层限制了整体表...
    12.19 传统视觉AI系统通常将图像识别文本生成图像text-to-...
  • 2025121904
    12.19 这款基于GPT-5.2架构深度优化的智能体,被官方定义为迄今最先进的智能体编程模型,其目标直指复杂现实场景中的软件工程全流程自动化,标志着AI编程能力从辅助工具迈向智能协作者的关键一步
    12.19 这款基于GPT-5.2架构深度优化的智能体,被官方定义为迄今最先进的智能体编程模型,其目标直指复杂现实场景中的软件工程全流程自动化,标志着AI编程能力从辅助工具迈向智能协作者的关键一步
    12.19 这款基于GPT-5.2架构深度优化的智能体,被官方定义为迄...
  • 2025121801
    12.18 用户只需输入出发地目的地及当前剩余续航里程,系统即可自动规划包含充电站点的最优路线,并综合考虑充电桩空闲状态充电速度排队情况等实时数据,实现边走边充的无缝体验
    12.18 用户只需输入出发地目的地及当前剩余续航里程,系统即可自动规划包含充电站点的最优路线,并综合考虑充电桩空闲状态充电速度排队情况等实时数据,实现边走边充的无缝体验
    12.18 用户只需输入出发地目的地及当前剩余续航里程,系统即可自动规...
  • 2025-12-18_094057_274
    12.18 近日,苹果开源了一款名为SHARPSharpMonocularViewSynthesisinLessThanaSecond的AI模型,该模型能够仅凭一张普通的2D照片,在不到一秒钟内生成具有真实物理尺度的高质量3D场景,为ARVR移动端内容创作乃至未来空间互联网应用打开了新的大门
    12.18 近日,苹果开源了一款名为SHARPSharpMonocularViewSynthesisinLessThanaSecond的AI模型,该模型能够仅凭一张普通的2D照片,在不到一秒钟内生成具...
    12.18 近日,苹果开源了一款名为SHARPSharpMonocul...
  • 2025121702
    12.17 OpenAI此次不仅开放模型使用,还同步在ChatGPT网页端侧边栏新增Images专属入口,内置艺术风格模板热门提示词库及一键滤镜,大幅降低非技术用户的操作难度
    12.17 OpenAI此次不仅开放模型使用,还同步在ChatGPT网页端侧边栏新增Images专属入口,内置艺术风格模板热门提示词库及一键滤镜,大幅降低非技术用户的操作难度
    12.17 OpenAI此次不仅开放模型使用,还同步在ChatGPT网...
  • 2025-12-17_171148_460
    12.17 与以往仅能生成静态图像或短视频的AI不同,WorldPlay首次实现了用户可**实时漫游交互并记住空间结构**的AI生成3D世界,标志着AI内容生成从片段式迈向持续性世界的关键转折
    12.17 与以往仅能生成静态图像或短视频的AI不同,WorldPlay首次实现了用户可**实时漫游交互并记住空间结构**的AI生成3D世界,标志着AI内容生成从片段式迈向持续性世界的关键转折
    12.17 与以往仅能生成静态图像或短视频的AI不同,WorldPla...
  • 2025-12-16_220912_482
    12.16 Seedance1.5Pro不再是先生成画面再配音的拼接式方案,而是从底层模型架构出发,同步生成匹配语音口型语调与节奏的音视频内容
    12.16 Seedance1.5Pro不再是先生成画面再配音的拼接式方案,而是从底层模型架构出发,同步生成匹配语音口型语调与节奏的音视频内容
    12.16 Seedance1.5Pro不再是先生成画面再配音的拼接式...
  • 2025-12-16_142336_669
    12.16 作为全球首个实现创编一体支持多剧集连续生成的AI智能体,Seko2.0被定位为面向短剧与漫剧创作者的全栈式创作平台,目标直指让一人剧组成为现实
    12.16 作为全球首个实现创编一体支持多剧集连续生成的AI智能体,Seko2.0被定位为面向短剧与漫剧创作者的全栈式创作平台,目标直指让一人剧组成为现实
    12.16 作为全球首个实现创编一体支持多剧集连续生成的AI智能体,S...
  • 2025-12-16_141033_660
    12.16 作为国内首个集成角色扮演能力的视频生成模型,万相2.6不仅支持基于文本或音频驱动的视频创作,还能在15秒内生成包含多镜头多角色音画同步的连贯叙事内容,被官方称为当前全球功能最全面的视频生成模型
    12.16 作为国内首个集成角色扮演能力的视频生成模型,万相2.6不仅支持基于文本或音频驱动的视频创作,还能在15秒内生成包含多镜头多角色音画同步的连贯叙事内容,被官方称为当前全球功能最全面的视频生成...
    12.16 作为国内首个集成角色扮演能力的视频生成模型,万相2.6不仅...
  • 2025121502
    12.15 英语母语者可学习德语,而孟加拉语荷兰语印地语意大利语罗马尼亚语瑞典语等母语者则可练习英语
    12.15 英语母语者可学习德语,而孟加拉语荷兰语印地语意大利语罗马尼亚语瑞典语等母语者则可练习英语
    12.15 英语母语者可学习德语,而孟加拉语荷兰语印地语意大利语罗马尼...
  • 2025-12-12_212403_607
    12.12 画面中,八位当今AI时代的建筑工人包括马斯克TeslaX黄仁勋NVIDIA萨姆奥尔特曼OpenAI马克扎克伯格Meta苏姿丰AMD杰米斯哈萨比斯GoogleDeepMind达里奥阿莫迪Anthropic以及AI先驱李飞飞WorldLabs并肩坐在高耸入云的钢梁之上,既是对大工业时代的致敬...
    12.12 画面中,八位当今AI时代的建筑工人包括马斯克TeslaX黄仁勋NVIDIA萨姆奥尔特曼OpenAI马克扎克伯格Meta苏姿丰AMD杰米斯哈萨比斯GoogleDeepMind达里奥阿莫迪An...
    12.12 画面中,八位当今AI时代的建筑工人包括马斯克TeslaX黄...
  • 2025-12-12_164441_275
    12.12 与仅生成视觉内容的传统视频模型不同,世界模型旨在理解quot动作-结果quot链,例如物体在重力环境下的运动轨迹流体动力学响应及刚体碰撞行为
    12.12 与仅生成视觉内容的传统视频模型不同,世界模型旨在理解quot动作-结果quot链,例如物体在重力环境下的运动轨迹流体动力学响应及刚体碰撞行为
    12.12 与仅生成视觉内容的传统视频模型不同,世界模型旨在理解quo...
  • 2025-12-12_094926_685
    12.12 如果一个金融公司能用十分之一的成本完成尽职调查的早期信息收集,或者一个生物技术团队能以更低预算处理药物毒性预测的文献分析,这种经济效应会很快转化为市场选择
    12.12 如果一个金融公司能用十分之一的成本完成尽职调查的早期信息收集,或者一个生物技术团队能以更低预算处理药物毒性预测的文献分析,这种经济效应会很快转化为市场选择
    12.12 如果一个金融公司能用十分之一的成本完成尽职调查的早期信息收...
  • 2025121201
    12.12 OpenAI研究主管AidanClark表示,GPT-5.2在代码生成数学推理科学问题视觉理解长文本推理及工具调用等基准测试中创下新纪录,quot这种数学能力本质上是多步骤逻辑一致性的体现,对金融建模数据分析等实际工作负载至关重要quot
    12.12 OpenAI研究主管AidanClark表示,GPT-5.2在代码生成数学推理科学问题视觉理解长文本推理及工具调用等基准测试中创下新纪录,quot这种数学能力本质上是多步骤逻辑一致性的体现...
    12.12 OpenAI研究主管AidanClark表示,GPT-5....
  • 2025121103
    12.11 这款多剧集AI视频Agent,仅需用户输入一句创意描述,即可自动生成最多100集剧情连贯人物形象与世界观高度一致的动画短剧,成本低至一杯奶茶钱,并已面向公众开放测试
    12.11 这款多剧集AI视频Agent,仅需用户输入一句创意描述,即可自动生成最多100集剧情连贯人物形象与世界观高度一致的动画短剧,成本低至一杯奶茶钱,并已面向公众开放测试
    12.11 这款多剧集AI视频Agent,仅需用户输入一句创意描述,即...
  • 2025121101
    12.11 模型不仅能即时理解这些复杂的混合输入,更能以实时流式real-timestreaming的方式同步输出高质量的文本与自然语音,极大地缩短了响应延迟,提升了交互的连贯性和沉浸感
    12.11 模型不仅能即时理解这些复杂的混合输入,更能以实时流式real-timestreaming的方式同步输出高质量的文本与自然语音,极大地缩短了响应延迟,提升了交互的连贯性和沉浸感
    12.11 模型不仅能即时理解这些复杂的混合输入,更能以实时流式rea...
  • 2025-12-10_143111_137
    12.10 该工具采用Apache2.0协议开源,支持自定义编程和主题切换,个人和商业场景均可免费使用
    12.10 该工具采用Apache2.0协议开源,支持自定义编程和主题切换,个人和商业场景均可免费使用
    12.10 该工具采用Apache2.0协议开源,支持自定义编程和主题...
  • 2025120905
    12.9 稳定性改进体现在内存安全机制的实体化20MB安全缓冲限制被写入核心逻辑,配合Windows编码兼容修复和ripgrep检测增强,跨平台可靠性得到验证
    12.9 稳定性改进体现在内存安全机制的实体化20MB安全缓冲限制被写入核心逻辑,配合Windows编码兼容修复和ripgrep检测增强,跨平台可靠性得到验证
    12.9 稳定性改进体现在内存安全机制的实体化20MB安全缓冲限制被写...
  • 2025-12-09_143454_009
    12.9 GLM-4.6V则以图像即参数,结果即上下文为核心理念,支持直接将图像截图或文档页面作为工具调用的输入参数,并能对工具返回的图表商品图片等视觉结果进行二次理解,无缝融入后续推理流程
    12.9 GLM-4.6V则以图像即参数,结果即上下文为核心理念,支持直接将图像截图或文档页面作为工具调用的输入参数,并能对工具返回的图表商品图片等视觉结果进行二次理解,无缝融入后续推理流程
    12.9 GLM-4.6V则以图像即参数,结果即上下文为核心理念,支持...
  • 2025-12-09_142514_848
    12.9 蚂蚁集团旗下全模态通用AI助手灵光正式推出网页版,用户现可通过浏览器直接访问,体验灵光对话与灵光闪应用等核心功能,标志着其多端生态布局再进一步
    12.9 蚂蚁集团旗下全模态通用AI助手灵光正式推出网页版,用户现可通过浏览器直接访问,体验灵光对话与灵光闪应用等核心功能,标志着其多端生态布局再进一步
    12.9 蚂蚁集团旗下全模态通用AI助手灵光正式推出网页版,用户现可通...
  • 2025120805
    12.8 英伟达团队利用开源大模型GPT-OSS-120B,从现有数据集中提取并组合问题,生成了数百万个高质量高难度的合成谜题
    12.8 英伟达团队利用开源大模型GPT-OSS-120B,从现有数据集中提取并组合问题,生成了数百万个高质量高难度的合成谜题
    12.8 英伟达团队利用开源大模型GPT-OSS-120B,从现有数据...