markdown { articleTitle: AI日报:腾讯、字节、谷歌齐发力,多模态大模型与AI使用加快落地, articleContent: 欢迎来到【AI日报】栏目!今天的AI国际精彩纷呈,多家科技巨子发布重磅产品与技能更新,预示着
腾讯混元团队推出的Hunyuan-GameCraft,是一款根据HunyuanVideo底模的高动态交互式游戏视频生成结构。它答使用户经过输入一张图、文字描述和动作指令,就能生成高质量的游戏视频,显着降低了游戏内容制造的门槛。这款东西的发布,有望处理传统游戏内容生产中动作生硬、场景静态和本钱昂扬的问题。Hunyuan-GameCraft 支撑自在流通的动作操控,并适用于消费级硬件,这无疑降低了游戏开发的门槛,加快了游戏视频的创造功率。
字节跳动也展现了其在AI范畴的立异实力,开源了M3-Agent-Control。这是一个根据Qwen332B练习的Agent专用模型,具有328亿参数,选用BF16张量类型,以提高模型响应速度和功率。字节跳动经过开放源代码,加快了人工智能技能的开展,为开发者供给了更多探究和立异的时机。该模型的发布,也预示着AI Agent在未来将扮演逐步重要的人物。
在图画修改范畴,Nano-Banana模型表现出色,尤其在人物复原、场景重构和图画交融方面逾越了FLUXKontext模型。它能够精准保存图画中人物人物的细节特征,在处理杂乱的布景替换或场景转化使命时,也能生成天然连接的画面作用。此外,Nano-Banana在处理多元素交融场景时,能够在必定程度上完结滑润过渡,简直消除不同元素之间的违和感。这表现了在图画生成与修改范畴,模型正在向着愈加精细化和智能化的方向开展。
谷歌为 Slides 和 Vids 引入了全新的 AI 图画修改功用,根据 Gemini 的这两项功用,用户都能够经过文本提示快速替换和扩展图片布景,提高创造功率。此外,苹果智能家居中心设备因技能问题推延至2026年中期发布,但根据大型言语模型的全新 Siri 将成为其中心功用。阿里1688渠道将推出全新商家会员产品——‘诚信通AI版’,并晋级免费AI数字职工功用,助力商家高效获客与运营。
全球AI独角兽数量激增至498家,总值达2.7万亿美元,这表明AI职业正以惊人的速度增加。万兴科技成功接入 OpenAI 的 GPT-5 模型,也预示着AI技能在所有的范畴的加快浸透。
昆仑万维发布 SkyworkDeepResearchAgentv2,显着地增强了天工超级智能体的中心引擎,引入了多模态深度调研和浏览器智能体,提高了信息处理才能和用户体会。
这些动态一起描绘出一幅朝气蓬勃的 AI 开展蓝图。你以为在多模态和AI Agent技能不断打破的布景下,哪些使用场景会首先迎来迸发?欢迎在谈论区共享你的观点。