Meta 发布开源模型 Llama 3,包括预训练和指令调优的8B和70B两种参数的模型以及新版本 AI 助手 […]
Meta发表一篇新论文:Imagine Flash:利用逆向蒸馏加速Emu扩散模型 Imagine Flash […]
TeToS(Text-to-Speech Operating System)是一个开源项目,提供了一个统一的接 […]
Twitter-Insight-LLM 是一个开源项目,主要功能包括从Twitter抓取数据、基于嵌入的图像搜 […]
时尚品牌在品牌大使身上投入了大量资金,因为他们拥有完美的外形,符合品牌形象。 但现在一切都变了。现在,各品牌都 […]
Mixtral 发布了 Mixtral 8X22B,它采用了稀疏混合专家(Sparse Mixture-of- […]
Dynamic Typography:一种新颖的“动态排版”技术,通过视频扩散先验,将文本字母转化为动画,以增 […]
GPT-Academic主要是为了支持学术研究而设计的。它提供了多种工具和功能,特别是针对那些需要处理大量文献 […]
Video-sSubtitle-Remover (VSR) 一个基于 AI 技术的工具,专门用于从视频和图片中 […]
Nothing公司计划将聊天机器人ChatGPT引入其顶级无线耳机和手机中,使用户能够与设备对话并获得会话式的 […]
Llama3-8B-Chinese-Chat 是基于 Meta-Llama-3-8B-Instruct 模型通 […]
据报道苹果已经收购了一家位于法国巴黎的初创企业Datakalab,该企业专门从事人工智能压缩和计算机视觉技术。 […]
英国剑桥大学临床医学院和英国牛津大学临床学术研究生院发表了一个研究报告,评估大语言模型(LLMs),特别是GP […]
Adobe 推出了新的 Firefly Image 3 Model模型,这是继 Adobe Firefly 发 […]
Adobe Photoshop 利用 Adobe Firefly Image 3 模型的功能推出了新的人工智能 […]
Tibor Blaho 在 X上曝光了有关 ChatGPT 的即将更新的功能和改进信息 人们都在努力寻找 GP […]
微软推出的Phi-3系列小型开源语言模型,在多种语言、推理、编程和数学基准测试中展示了前所未有的性能,超越了相 […]
Hume AI发布了他们的EVI API,这是世界上第一个情感智能的语音AI接口。EVI API可以将情感智能 […]
Meta与EssilorLuxottica合作推出的Ray-Ban Meta智能眼镜推出了新功能和新款式,设计 […]
Synthesia 公司推出能通过脚本就能预测表情的虚拟数字人形象:Expressive-1 AI Avata […]
微信发布一款桌面工作效率的AI工具:小微助手,小微助手提供了灵活的搜索输入方式和广泛的搜索对象支持,使用户能够 […]
Video2Game :它能将单个视频转换成可以实时互动的、逼真的游戏和模拟环境。该项目由伊利诺伊大学香槟分校 […]
由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。 […]
HiDiffusion 是一个无需调整的高分辨率图像生成框架,该项目由来自MEGVII科技和字节跳动的研究团队 […]
DeepFaceLive 是一款专门用于实时面部交换的软件,可以在进行直播过程或视频通话时进行实时面部替换。 […]
IDM-VTON 是一个致力于提升虚拟试衣场景中的图像真实性和细节保留的新方法。让合成的试穿图片更加真实,细节 […]
Humanify 是一个专为Blender设计的插件,它使用户能够一键生成高度逼真的人类模型。这个工具主要面向 […]
这个课程为参与者提供了一个全面了解和掌握摄影中各种照明技术的平台,从基本的自然光照到复杂的特效照明,使他们能够 […]
Meta 发布开源模型 Llama 3,包括预训练和指令调优的8B和70B两种参数的模型以及新版本 AI 助手 […]