微软将在4月下旬发布OneDrive Copilot。 OneDrive Copilot将扮演类似研究助理的角 […]
DataDreamer是一个开源Python库,旨在简化大型语言模型(LLM)的集成和使用。在现代应用中,从合 […]
人像照明重塑(Portrait Relighting)是一种数字图像处理技术,它允许在不改变原始拍摄环境的情况 […]
D-ID推出D-IDAgent功能:克隆自己的数字分身 选择一个形象或者上传自己照片,上传自己的声音或克隆 […]
Verce发布新的AI SDK 3.0 推出生成式UI功能 这是一种开源的生成式UI技术,允许开发者创建丰富的 […]
Multimodal ArXiv是一个旨在提高大型视觉语言模型(LVLMs)科学理解能力的数据集项目。该项目由 […]
Relightful Harmonization是由Adobe和纽约大学合作开展的一项研究项目,这项技术的核心 […]
Stability AI 与 Tripo AI 合作开发了 TripoSR,这是一个受到最新研究 LRM(大型 […]
Anthropic公司宣布推出Claude 3模型系列,性能全面超越GPT4,具有多模态度能力,推理能力和人类 […]
WeWe-RSS是一个开源项目,旨在提供一种更优雅的微信公众号订阅方式。它支持私有化部署以及基于微信读书的微信 […]
Comflowyspace是一个用于生成AI图像和视频的开源工具,它比现有的SDWebUI和ComfyUI更易 […]
Puter项目是一个高级的开源浏览器内桌面环境,旨在提供丰富的功能、异常快速的性能和高度的可扩展性。它可以用于 […]
Stability AI发布了关于Stable Diffusion 3(SD3)的研究论文,揭示了这一最新模型 […]
PixelPlayer:MIT的研究团队开发的项目,能自动从视频中识别和分离出不同的声音源,并与画面位置匹配。 […]
该项目由字节跳动开发,DiffusionGPT的牛P之处在于它集成了多种领域的专家图像生成模型。 然后使用LL […]
Pika近日宣布推出新功能Lip Sync,此功能允许用户为视频添加语音对白,并通过ElevenLabs支持实 […]
SAMPLE可以自己设计和测试新的蛋白质,而不需要人类的帮助。就像一个能自己做实验的机器人科学家。 它能自主学 […]
STRUCT CHEM是为了解决大语言模型(LLMs)在复杂化学问题推理中遇到的挑战而设计的一种策略。虽然LL […]
AtomoVideo是一个创新的高保真图像到视频生成框架,由阿里巴巴团队开发。这个框架能够从给定的静态图像生成 […]
Marker 能将 PDF、EPUB 和 MOBI 文件转换成 markdown 格式。它的转换速度是 nou […]
ChatGPT插件将废弃⚠️ OpenAI将引导开发者将ChatGPT插件迁移到GPTs… Support a […]
InstanceDiffusion是一个由BAIR, UC Berkeley和GenAI, Meta共同开发的 […]
塔夫茨大学和哈佛大学维斯研究所团队开发出一种能够在实验室培养皿中移动的微小活体机器人。 他们将这些创造物称为“ […]
Design2Code项目探索了利用生成式人工智能,特别是多模态大语言模型(LLMs),将视觉设计自动转换为前 […]
01.AI发布新一代开源大语言模型:Yi-9B,特别针对双语(中英文)场景进行训练,拥有强大的语言理解、常识推 […]
ResAdapter是一个由字节跳动开发的领域一致性分辨率适配器,它能让扩散模型、生成不同分辨率和比例的图像, […]
如何使用Midjourney v6 创建自己的服装品牌 博主Hugo Ventura分享了他使用Midjour […]
Chase Lean @chaseleantj 在X上分享了一种简单的方法,用于改变图像的风格同时保持角色和姿 […]
MovieLLM 是由复旦大学和腾讯PCG的研究人员共同开发的一个新颖框架,能够从简单的文本提示中生成高质量、 […]
SaulLM-7B,这是一款专为法律领域定制的大语言模型(LLM)。拥有70亿参数,SaulLM-7B是首个专 […]
微软将在4月下旬发布OneDrive Copilot。 OneDrive Copilot将扮演类似研究助理的角 […]