Stripe Agent Toolkit 是专为将财务功能集成到 AI 代理中的 SDK。它允许开发者通过函数 […]
ElevenLabs 宣布其开发者平台新增了创建对话式AI代理的功能。 这项新功能允许开发者平台上构建对话式A […]
FLUX 1.1 Pro Ultra 发布,支持高达 4 兆像素的分辨率,并具有快速生成速度,每张图片仅需约 […]
上周Runway 推出了一款生成式角色表演工具,可以把视频转换成任意风格虚拟角色动画,并且保持表情语音口型同步 […]
苹果正式推出集成Siri 和 Apple Intelligence新框架:App Intents ,允许开发者 […]
微软研究团队推出了 Magentic-One,一个通用的多智能体系统,具备在不同领域中处理开放性任务的能力。该 […]
Google 正式推出了其 Gemini AI 驱动的视频演示应用程序 Vids,用户可以通过简单的提示生成视 […]
NVIDIA 推出的 AI Blueprint , 这是一套用于构建视觉AI代理的框架,帮助开发者构建视频理解 […]
Reddit 用户 General-Implement83 分享了她如何使用 ChatGPT 定制了一个个性化 […]
SeedEdit 是一个AI图像编辑工具,由 Doubao 团队开发。它的特殊之处在于,可以根据用户输入的文字 […]
Google DeepMind 和 Isomorphic Labs 宣布开源 AlphaFold 3 的模型代 […]
HeyGen 正在开放API,通过 HeyGen API,企业能够使用生动的虚拟人视频提升平台的互动性,转化原 […]
Fashion-VDM 是一个基于扩散模型(Video Diffusion Model,VDM)的虚拟试衣视频 […]
Play AI推出了PlayDialog beta,专门用于创建更加自然、富有表现力和情感的对话式语音输出。 […]
引言 使用得当,ChatGPT 可以成为一个强大的工具,帮助学生培养严谨思维和清晰写作的技能,帮助他们思考想法 […]
“Thinking-Claude” 为Claude 提供系统化的思维流程指导,从而使其在回答问题前进行更深入和 […]
苹果发布 Final Cut Pro 11,这次重大更新为专业视频编辑带来了先进的 AI 驱动功能、空间视频编 […]
Context Autopilot 是由 Context 公司推出的一款 AI 办公助手,旨在通过先进的人工智 […]
ReadKidz 是一个专为儿童内容创作设计的 AI 驱动平台,提供一站式的儿童电子图画书和多媒体故事制作功能 […]
Fish Audio 发布高级语音处理模型Fish Agent V0.1 3B,它是一个语音到语音模型,它可以 […]
Rive 引入的新功能 Layouts 为设计师和开发者提供了一种方法,可以在各种设备上创建动态、响应式的动画 […]
腾讯发布开源 Mixture of Experts(MoE)模型:腾讯混元大模型(Hunyuan-Large) […]
腾讯推出的一体化 3D 生成框架:混元3D-1.0 ,支持从文本和图像生成 3D 内容,仅需 10 秒便可生成 […]
Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hert […]
Recraft推出了其最新的图像生成模型——Recraft V3。通过引入设计语言思维,Recraft V3能 […]
Act-One 是 Runway 的 Gen-3 Alpha 版本中的一款创新视频生成工具,能够通过简单的操作 […]
硬件与空间: 确保计算机上有 15GB 的可用磁盘空间。 本教程中的工具在大多数支持的硬件上运行良好,但更高性 […]
Ferret-UI是由苹果开发的一个专门理解和与移动用户界面(UI)互动的多模态大语言模型(MLLM)。 它把 […]
Physical Intelligence 公司推出了 π0(pi-zero),这是一个通用的机器人策略模型, […]
Meta FAIR(基础人工智能研究团队)公开发布了多项新研究成果,旨在推动机器人技术的发展,以实现高级机器智 […]
Stripe Agent Toolkit 是专为将财务功能集成到 AI 代理中的 SDK。它允许开发者通过函数 […]