Deepgram推出了全新的AI语音代理API,这是一个统一的语音对话API,旨在让AI代理能够进行自然的对话 […]
StoryMaker是一个旨在生成一致性角色图像的个性化解决方案。它不仅可以在多人物场景中保持角色的面部一致性 […]
LVCD 是一个专门为动画视频线稿上色设计的工具。它通过一种新的方法,把黑白线稿自动转化为彩色动画视频。 传统 […]
开心电视助手,是一款专门针对安卓设备打造的远程管理工具,可以轻松实现:管理电视/机顶盒/投影仪等设备,还可 […]
我的电视 使用Android原生开发的电视直播软件 下载方式 1、Github 项目:【点击前往】 2、网 […]
谷歌之后,Meta 也来卷无限长上下文。 Transformers 的二次复杂度和弱长度外推限制了它们扩展到长 […]
为了让 AI 模型在特定环境中更有用,它往往需要访问背景知识。例如,客户支持聊天机器人需要了解它所服务的具体业 […]
阿里云发布Qwen2.5 系列模型,最新发布的 Qwen2.5 系列中包括普通的大语言模型 (LLM) 以及针 […]
前两天,我分享了SDXL的通用模型,这些模型不仅在生成高质量图像和艺术作品方面表现出色,搭配上LoRA模型还能 […]
Libcimbar 是一个用于数据传输的工具,通过一种特殊的二维条码格式(色彩图标矩阵条码)来进行隔空数据传输 […]
好久不见! 闲话不多说,今天主要是通知一下FaceFusion两个版本的更新。 更新内容如下: V3.5.0 […]
引言 先来一张图镇楼,欢迎大家积极转发、收藏。 接下来讲讲每个模式的原理,以及代码实现(看代码能帮助产品经理加 […]
YouTube Shorts 将引入Google DeepMind的Veo模型,它允许创作者制作6秒的独立视频 […]
最近 Deep Live Cam这款实时AI换脸神器,在GitHub上火爆得一塌糊涂!现在就跟着我一起来看看, […]
新智元报道 【新智元导读】卷疯了!世界最快的大模型Groq一夜之间爆火,能够每秒输出近500个token。如此 […]
微软推出了 Microsoft 365 Copilot 的第二波更新,将网页、工作和 Pages 整合为一个新 […]
Seed-Music是一个由字节跳动研发的音乐生成模型,用户可以通过输入多模态数据(如文本描述、音频参考、乐谱 […]
Snap公司发布了第五代SpectaclesAR 眼镜,新版Spectacles具备更高质量的显示效果和更长的 […]
Luma AI 正式发布其创新产品 Dream Machine API。该 API 为开发者提供了世界上最受欢 […]
Runway宣布推出其视频生成模型的API。该API旨在帮助开发者和公司将Runway的生成式AI模型集成到第 […]
Playground v3(PGv3)是由Playground开发的一种文本到图像生成模型,其基于最新的大语言 […]
今天,我们要聊一聊AI绘画领域里的一个超有趣的话题:为什么Midjourney能用一个5.2模型轻松驾驭各种风 […]
g1 是一个使用 Llama-3.1 70b 模型在 Groq 上创建类似 o1 的推理链的实验性应用。其主要 […]
故事板是一种视觉工具,用于通过一系列框架描绘故事或概念,类似于漫画。它最初用于电影行业,帮助有效规划和传达想法 […]
斯坦福大学教授李飞飞的新公司 World Labs 成功融资 2.3 亿美元。李飞飞被誉为“AI教母”,她的公 […]
GOT-OCR2.0 是一种用于光学字符识别(OCR)任务的通用模型,旨在解决传统OCR系统(OCR-1.0) […]
PuLID(Pure and Lightning ID Customization via Contrasti […]
如今数字媒体和虚拟现实技术飞速发展,对数字人的需求不断增加! 今天,介绍一个开源创新的虚拟人视频生成框架:Mu […]
本文精心编译自 OpenAI Sora 的主要作者Tim Brooks 和 Bill Peebles 在AGI […]
GameGen-O是一个专为生成开放世界视频游戏而设计的Diffusion Transforme模型。该模型能 […]
Deepgram推出了全新的AI语音代理API,这是一个统一的语音对话API,旨在让AI代理能够进行自然的对话 […]