Ai日报 - 智汇宝库

首页 > Ai资讯 > Ai日报

Generative OmniMatte：Google开发出像Photoshop一样能将视频分解成多个图层的视频编辑技术

Generative OmniMatte：Google开发出像Photoshop一样能将视频分解成多个图层的视频编辑技术

Google DeepMind 开发了一种创新的的视频编辑技术方法：Generative OmniMatte […]

Anthropic 发布了「模型上下文协议」MCP 无缝连接本地和远程数据源

Anthropic 发布了「模型上下文协议」MCP 无缝连接本地和远程数据源

Anthropic 发布了 Model Context Protocol (MCP)，一个旨在将 AI 助手与 […]

OminiControl：基于FLUX.1的通用的控制框架通过参考图像来控制图像生成的结果

OminiControl：基于FLUX.1的通用的控制框架通过参考图像来控制图像生成的结果

OminiControl 是一个为 FLUX.1 模型设计的简单而通用的控制框架，由新加坡国立大学的学习与视 […]

NVIDIA 发布一款音乐生成模型：Fugatto 可以对声音生成与转换进行精细化控制

NVIDIA 发布一款音乐生成模型：Fugatto 可以对声音生成与转换进行精细化控制

NVIDIA 发布了一款音乐生成人工智能模型：Fugatto。通过简单的文本提示或音频输入，用户可以创作全新的 […]

PicMenu：利用AI可视化你的菜单你只需拍一下菜单即可将你的菜名生成对应的图片

PicMenu：利用AI可视化你的菜单你只需拍一下菜单即可将你的菜名生成对应的图片

PicMenu 是一个利用 AI 快速将餐厅菜单可视化的工具。通过拍摄菜单图片，PicMenu 可以为每道菜生 […]

SP-MangaEditor：一个完全免费的集成 AI 的网页漫画创作编辑工具

SP-MangaEditor：一个完全免费的集成 AI 的网页漫画创作编辑工具

SP-MangaEditor 是一个专门用来制作漫画的网页应用，可运行在你的浏览器里。它提供了很多专业工具，比 […]

SAMURAI：无需训练能够在实时动态、复杂的视频场景中跟踪目标的模型

SAMURAI：无需训练能够在实时动态、复杂的视频场景中跟踪目标的模型

SAMURAI：基于Segment Anything Model 2 (SAM 2) 改进的视觉对象跟踪模型， […]

Runway 推出了全新的图像生成模型 Frames 能够生成统一美学的多样化变体图像

Runway 推出了全新的图像生成模型 Frames 能够生成统一美学的多样化变体图像

Runway 推出了最新的图像生成模型 Frames，该模型以卓越的风格一致性和视觉真实感为特色，为创作者提供 […]

OOTDiffusion：支持半身、全身的开源的高分辨率虚拟试穿模型

OOTDiffusion：支持半身、全身的开源的高分辨率虚拟试穿模型

OOTDiffusion 是一个基于扩散模型（Latent Diffusion）的虚拟试穿系统。它使用先进的服 […]

支付宝发布 EchoMimicV2 ：从数字脸扩展到数字人可以通过图片+音频生成半身动画视频

支付宝发布 EchoMimicV2 ：从数字脸扩展到数字人可以通过图片+音频生成半身动画视频

支付宝发布 EchoMimicV2 ，从仅支持头部驱动的动画扩展到半身动画（包括头部、手势和上身动作）。支 […]

Runway 推出视频扩展工具：Expand Video 可以无缝的为视频扩展画面

Runway 推出视频扩展工具：Expand Video 可以无缝的为视频扩展画面

Runway 推出的一项创新视频编辑工具：Expand Video 。能够无缝转换横向视频为竖向视频，反之亦然 […]

MagicQuill：AI 驱动的图像编辑系统只需在图像上画几笔即可轻松编辑图像

MagicQuill：AI 驱动的图像编辑系统只需在图像上画几笔即可轻松编辑图像

MagicQuill 是由支付宝和香港大学联合开发的一个功能强大的智能互动图像编辑系统，通过直观的界面和 AI […]

Comfyui_Object_Migration：一致性换衣模型和工作流实物衣服一键穿上

Comfyui_Object_Migration：一致性换衣模型和工作流实物衣服一键穿上

通过 Stable Diffusion 和相关工具实现一致性穿衣模型与工作流的创新方法，可以将实物服装精确地迁 […]

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的

GetPickle AI是一款革新虚拟会议的AI工具让你的替身帮你开会你去干别的

GetPickle.ai 是一款致力于革新虚拟会议体验的AI工具，其核心技术通过提供高度逼真的AI克隆化身，使 […]

Stripe 推出 Stripe Agent Toolkit：让 AI 代理能自动进行支付帮你购物、订机票等

Stripe 推出 Stripe Agent Toolkit：让 AI 代理能自动进行支付帮你购物、订机票等

Stripe Agent Toolkit 是专为将财务功能集成到 AI 代理中的 SDK。它允许开发者通过函数 […]

ElevenLabs 推出构建语言对话AI代理的功能可使用其语音模型接入AI模型

ElevenLabs 推出构建语言对话AI代理的功能可使用其语音模型接入AI模型

ElevenLabs 宣布其开发者平台新增了创建对话式AI代理的功能。这项新功能允许开发者平台上构建对话式A […]

FLUX 1.1 Pro Ultra 发布支持高达 4 兆像素的分辨率每张图片仅需约 10 秒

FLUX 1.1 Pro Ultra 发布支持高达 4 兆像素的分辨率每张图片仅需约 10 秒

FLUX 1.1 Pro Ultra 发布，支持高达 4 兆像素的分辨率，并具有快速生成速度，每张图片仅需约 […]

X-Portrait 2：由字节跳动开发可将任意视频角色的表情和动作转移到任意对象的技术

X-Portrait 2：由字节跳动开发可将任意视频角色的表情和动作转移到任意对象的技术

上周Runway 推出了一款生成式角色表演工具，可以把视频转换成任意风格虚拟角色动画，并且保持表情语音口型同步 […]

苹果正式推出集成 Siri 和 Apple Intelligence新框架 Siri可以实时读取你屏幕信息并执行操作

苹果正式推出集成 Siri 和 Apple Intelligence新框架 Siri可以实时读取你屏幕信息并执行操作

苹果正式推出集成Siri 和 Apple Intelligence新框架：App Intents ，允许开发者 […]

Magentic-One：微软发布用于解决复杂任务通用多智能体可自行编写和执行代码并进行人机交互

Magentic-One：微软发布用于解决复杂任务通用多智能体可自行编写和执行代码并进行人机交互

微软研究团队推出了 Magentic-One，一个通用的多智能体系统，具备在不同领域中处理开放性任务的能力。该 […]

Google 正式推出 Gemini AI 驱动的视频演示应用 Vids 通过简单提示即可生成视频演示

Google 正式推出 Gemini AI 驱动的视频演示应用 Vids 通过简单提示即可生成视频演示

Google 正式推出了其 Gemini AI 驱动的视频演示应用程序 Vids，用户可以通过简单的提示生成视 […]

NVIDIA 推出的 AI Blueprint：可以帮你观看数小时的视频并提供摘要总结和问答

NVIDIA 推出的 AI Blueprint：可以帮你观看数小时的视频并提供摘要总结和问答

NVIDIA 推出的 AI Blueprint ，这是一套用于构建视觉AI代理的框架，帮助开发者构建视频理解 […]

ChatGPT 帮我制定护肤方案两个月让我的皮肤变成了这样…

ChatGPT 帮我制定护肤方案两个月让我的皮肤变成了这样…

Reddit 用户 General-Implement83 分享了她如何使用 ChatGPT 定制了一个个性化 […]

字节跳动发布AI图像编辑工具：SeedEdit 无需专业图片处理技能一句话即可实现P图

字节跳动发布AI图像编辑工具：SeedEdit 无需专业图片处理技能一句话即可实现P图

SeedEdit 是一个AI图像编辑工具，由 Doubao 团队开发。它的特殊之处在于，可以根据用户输入的文字 […]

Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3

Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3

Google DeepMind 和 Isomorphic Labs 宣布开源 AlphaFold 3 的模型代 […]

HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen 正在开放API，通过 HeyGen API，企业能够使用生动的虚拟人视频提升平台的互动性，转化原 […]

Fashion-VDM：通过给定的服装图像和人物视频生成一段虚拟试穿视频

Fashion-VDM：通过给定的服装图像和人物视频生成一段虚拟试穿视频

Fashion-VDM 是一个基于扩散模型（Video Diffusion Model，VDM）的虚拟试衣视频 […]

对标NotebookLM Play AI推出了PlayDialog：可生成自然对话播客、旁白以及自然交互

对标NotebookLM Play AI推出了PlayDialog：可生成自然对话播客、旁白以及自然交互

Play AI推出了PlayDialog beta，专门用于创建更加自然、富有表现力和情感的对话式语音输出。 […]

OpenAI 官方发布： ChatGPT 学生写作指南指导学生如何正确使用GPT

OpenAI 官方发布： ChatGPT 学生写作指南指导学生如何正确使用GPT

引言使用得当，ChatGPT 可以成为一个强大的工具，帮助学生培养严谨思维和清晰写作的技能，帮助他们思考想法 […]

Thinking-Claude：让 Claude 实现类似OpenAI o1 模型一样的高级推理模式

Thinking-Claude：让 Claude 实现类似OpenAI o1 模型一样的高级推理模式

“Thinking-Claude” 为Claude 提供系统化的思维流程指导，从而使其在回答问题前进行更深入和 […]

1 2 3 … 32