Emilia 是一个广泛的开源多语言数据集,用于语音生成,包含六种语言的高质量语音数据。这些数据来自各种视频平 […]
Magic Insert 是一个是一种能够将图像中的主体从一个具有任意风格的图像拖放到另一种风格迥异的目标图像 […]
经过数月的测试,亚马逊今天向所有美国客户推出了其生成式人工智能购物助手Rufus。这个对话式购物助手旨在帮助客 […]
据路透社报道, OpenAI 正在开展一个代号为“Strawberry”的新人工智能模型项目。 “Strawb […]
老痴呆症(阿尔茨海默疾病)是一个全球性的健康挑战,影响超过5500万人,估计每年造成 8200 亿美元的费用预 […]
Reddit用户分享了一个用于认知行为疗法(CBT)的提示,旨在帮助用户通过一系列问题来识别和重构他们的负面思 […]
传统的上下文学习方法需要提供大量的上下文信息(即例子),才能让模型理解和生成正确的输出。这种方法会导致性能不稳 […]
EmoLLM 是一个用于心理健康领域的大模型项目,通过对大型语言模型(LLM)进行指令微调,旨在支持用户理解、 […]
在最近的全体员工大会上,OpenAI 推出了一个五级评分系统,用于追踪其在开发超越人类能力的人工智能软件方面的 […]
Prime Intellect推出了OpenDiLoCo,这是DeepMind分布式低通信(DiLoCo)方法 […]
Google DeepMind 的机器人团队展示了将Google Gemini 1.5 Pro安装到机器人里面 […]
EchoMimic 是由蚂蚁集团开发的一种通过音频和面部标志生成逼真的肖像动画视频的新方法。与传统的方法不同, […]
现在你可以在几秒钟内将 YouTube 视频转换为博客文章... Support authors and su […]
DeepMind 发布了一项新的研究,声称其新方法可以将 AI 模型的训练速度和能效大幅提升一个数量级,以高达 […]
ULTRAEDIT 是一个大规模、自动生成的数据集,专门用于基于指令的图像编辑。 使得你可以通过自然语言描述的 […]
在这个教程中,我们将详细介绍如何使用ComfyUI IC-Light工作流来重新照明你的视频。通过一系列简单的 […]
APIGen是一个自动化的数据生成流水线,旨在为函数调用应用程序生成高质量的可验证数据集。 其主要目标是生成多 […]
Stable AI 为其 Stable Assistant 机器人添加了两个新功能。现在,用户可以使用“搜索替 […]
麻省理工的的研究人员推出了一种名为 GenSQL 的生成式 AI 数据库分析系统,旨在简化数据库用户进行复杂统 […]
在构建人工智能驱动的应用程序时,提示词的质量对结果有重大影响。然而,编写高质量的提示词具有挑战性,需要深入了解 […]
三星电子宣布推出新的Galaxy Ring、Galaxy Watch7和Galaxy Watch Ultra, […]
FoleyCrafter 是一个能够为无声视频生成同步且逼真的声音效果的开源系统。用于自动生成与视频同步的高质 […]
测试时间训练(Test-Time Training, TTT)是由斯坦福大学、加州大学和Meta AI共同研究 […]
微软研究院推出了GraphRAG,这是一种先进的方法,旨在提升大语言模型(LLM)从私有数据集中检索和生成响应 […]
Poe推出了一项名为“Previews”的新功能,允许用户在聊天中直接查看和互动生成的Web应用程序。该功能特 […]
OdysseyML 旨在开发能够生成和导演好莱坞级别视觉效果的AI技术。受早期计算机图形研究和皮克斯故事的启发 […]
PaintsUndo是一个旨在模拟数字绘画行为的基础模型。你只需要通过输入静态图像,它就能帮你自动生成视频输出 […]
Huffington的心理健康公司Thrive Global和OpenAI创业基金合作创建Thrive AI […]
一位名为 Charles Diaz 的开发者使用树莓派创建了一个完全功能的 TARS 复制品。 这不仅仅是一个 […]
加州大学圣地亚哥分校和麻省理工学院的研究人员刚刚推出了一个名为Open-TeleVision的项目,这是一种开 […]
Emilia 是一个广泛的开源多语言数据集,用于语音生成,包含六种语言的高质量语音数据。这些数据来自各种视频平 […]