年后开工准备用SD的工作流版本ComfyUI整点东西出来。之所以要搞这个,主要是因为它跟我目前要做的很多内容都 […]
古早的互联网时代其实有很多非常经典和厉害的内容,这些内容不会随着时间的推移和环境的变化而失去价值。就像这篇文章 […]
一、引言 随着大型语言模型如 ChatGPT 的横空出世,我们进入了自然语言处理(NLP)的一个新纪元。在这个 […]
Kolors可图是快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训 […]
EmoLLM 是一个用于心理健康领域的大模型项目,通过对大型语言模型(LLM)进行指令微调,旨在支持用户理解、 […]
在最近的全体员工大会上,OpenAI 推出了一个五级评分系统,用于追踪其在开发超越人类能力的人工智能软件方面的 […]
Prime Intellect推出了OpenDiLoCo,这是DeepMind分布式低通信(DiLoCo)方法 […]
Google DeepMind 的机器人团队展示了将Google Gemini 1.5 Pro安装到机器人里面 […]
如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。 在这你可以找到各种智 […]
身体姿态估计旨在识别出给定图像中人或者动物实例身体的关键点,除了典型的身体骨骼关键点,还可以包括手、脚、脸部等 […]
在本地电脑上运行大型语言模型(LLM),需要考虑的关键因素之一就是电脑的内存够不够。希望能通过这篇文章让各位有 […]
项目主页-https://fun-audio-llm.github.io/ 代码链接-https://gith […]
之前有一个论调,说如果大模型支持足够长的上下文内容时候,是否就不在需要向量库。下面这个论文,通过实验证明了,即 […]
EchoMimic 是由蚂蚁集团开发的一种通过音频和面部标志生成逼真的肖像动画视频的新方法。与传统的方法不同, […]
现在你可以在几秒钟内将 YouTube 视频转换为博客文章... Support authors and su […]
DeepMind 发布了一项新的研究,声称其新方法可以将 AI 模型的训练速度和能效大幅提升一个数量级,以高达 […]
ULTRAEDIT 是一个大规模、自动生成的数据集,专门用于基于指令的图像编辑。 使得你可以通过自然语言描述的 […]
在这个教程中,我们将详细介绍如何使用ComfyUI IC-Light工作流来重新照明你的视频。通过一系列简单的 […]
APIGen是一个自动化的数据生成流水线,旨在为函数调用应用程序生成高质量的可验证数据集。 其主要目标是生成多 […]
前言 听雨貌似好久没有介绍 SD 的插件了,今天听雨给小伙伴们带来了一个 SD 的美颜修图神器,可以在我们生成 […]
都说今年是大模型落地元年,但实际进展还是快得超出想象了。 这不,在一年一度的AWE(中国家电及消费电子博览会) […]
一直没有写过关于声音克隆的文章,所以这次补上,毕竟这个用的还真是有点多,也为后面更多的个性化配音做好准备。 […]
Stable AI 为其 Stable Assistant 机器人添加了两个新功能。现在,用户可以使用“搜索替 […]
麻省理工的的研究人员推出了一种名为 GenSQL 的生成式 AI 数据库分析系统,旨在简化数据库用户进行复杂统 […]
在构建人工智能驱动的应用程序时,提示词的质量对结果有重大影响。然而,编写高质量的提示词具有挑战性,需要深入了解 […]
三星电子宣布推出新的Galaxy Ring、Galaxy Watch7和Galaxy Watch Ultra, […]
FoleyCrafter 是一个能够为无声视频生成同步且逼真的声音效果的开源系统。用于自动生成与视频同步的高质 […]
岁月如沙,从指缝悄然流逝。那些定格在泛黄照片里的笑脸,曾是我们最珍贵的瞬间。如今,科技让逝去的时光重现生机,让 […]
测试时间训练(Test-Time Training, TTT)是由斯坦福大学、加州大学和Meta AI共同研究 […]
TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技 […]
年后开工准备用SD的工作流版本ComfyUI整点东西出来。之所以要搞这个,主要是因为它跟我目前要做的很多内容都 […]