01.AI发布新一代开源大语言模型:Yi-9B,特别针对双语(中英文)场景进行训练,拥有强大的语言理解、常识推 […]
ResAdapter是一个由字节跳动开发的领域一致性分辨率适配器,它能让扩散模型、生成不同分辨率和比例的图像, […]
如何使用Midjourney v6 创建自己的服装品牌 博主Hugo Ventura分享了他使用Midjour […]
Chase Lean @chaseleantj 在X上分享了一种简单的方法,用于改变图像的风格同时保持角色和姿 […]
MovieLLM 是由复旦大学和腾讯PCG的研究人员共同开发的一个新颖框架,能够从简单的文本提示中生成高质量、 […]
SaulLM-7B,这是一款专为法律领域定制的大语言模型(LLM)。拥有70亿参数,SaulLM-7B是首个专 […]
Figma推出一个强大的功能——多重编辑(Multi-edit),这项功能极大地简化了在Figma中跨多个框架 […]
RT-H是一个利用视觉语言模型(VLM)通过语言来预测动作层次结构的模型,由Google DeepMind的研 […]
OptimizerAI是一个AI声音效果生成器,专注于为创作者、游戏制作者、艺术家和视频制作者生成声音效果的平 […]
由传奇芯片架构师吉姆·凯勒(Jim Keller)领导的公司Tenstorrent,发布了其首款硬件产品Gra […]
The Pile是一个由EleutherAI提供的825 GiB大小的多样化、开源语言建模数据集,它由22个较 […]
Magi模型,由牛津大学工程科学系的视觉几何组开发。这项研究的核心目标是通过人工智能技术自动为漫画生成文字剧本 […]
Cradle,一个具有强大推理能力的代理框架,旨在探索通用计算机控制领域,以《荒野大镖客2》(Red Dead […]
AIwechat-Vercel利用 Vercel 的 Serverless Functions 提供后端服务, […]
哈佛大学CS50x 2024课程 CS50简介: 这是哈佛大学的一门计算机科学和编程入门课程,适合专业学生和非 […]
PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion […]
Pika平台发布了一项新功能,允许用户为视频无缝生成和集成音效,用户可以指定想要的声音或让平台根据视频内容自动 […]
WhiteRabbitNeo发布WhiteRabbitNeo-7B-v1.5a 模型,该模型属于文本生成领域, […]
Google Shopping API 由 SearchApi 提供,是一个强大的工具,旨在帮助开发者和研究者 […]
主要内容导览: Support authors and subscribe to content This i […]
MeloTTS是由MyShell.ai开发的一款高质量、支持多语言的文本转语音(TTS)库。该库支持英语(美式 […]
Human to Humanoid (H2O)由卡内基梅隆大学的研究团队开发,它允许人们通过一个简单的RGB摄 […]
Answer.AI发布了一个基于FSDP(Fully Sharded Data Parallel,完全分片数据 […]
Hume AI的博客文章《什么是语义空间理论?》介绍了一个先进的理解情感的方法:语义空间理论(SST)。这种方 […]
SLD是一种自我纠正的LLM控制扩散框架,它通过结合大型语言模型的检测能力,使图像生成模型能够更加精准地根据文 […]
Whomane是一款价格便宜且方便组装的开源可穿戴设备,只需几分钟即可完成组装。它只有四个组件:相机、按钮、电 […]
加拿大国防部和加拿大武装部队发布了一个人工智能(AI)战略,目标是到2030年,利用AI技术改善他们的工作和操 […]
Inflection AI发布Inflection-2.5版本模型 只用了四成功力就匹敌GPT 4性能,具有高 […]
Gemini 1.5 Pro 是由 Google Gemini 团队开发的一款多模态混合专家模型,它标志着人工 […]
ELLA(Efficient Large Language Model Adapter)是由腾讯开发的一个先进 […]
01.AI发布新一代开源大语言模型:Yi-9B,特别针对双语(中英文)场景进行训练,拥有强大的语言理解、常识推 […]