加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]
Consistent Character 模型,结合多种技术实现角色的一致性图像生成,可以生成给定角色的不同姿 […]
ElevenLabs推出了一款新的AI音频模型,能够根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 […]
影眸团队推出了Rodin Gen-13D生成AI模型。这个模型可以在几十秒内通过文本生成高质量的3D模型,这些 […]
Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游 […]
Sonic 是一个快速、超逼真的语音生成模型,专为实时互动语音而设计,基于下一代状态空间模型(State Sp […]
OpenAI推出了ChatGPT Edu,这是一个为大学设计的专用版本,旨在让学生、教职员工、研究人员和校园运 […]
Perplexity AI推出Perplexity Pages ,该工具可以帮助你把你搜到的答案自动转化为视觉 […]
ToonCrafter 是一个帮助动画师生成和优化卡通动画过渡效果的工具。解决了卡通动画中帧与帧之间过渡不自然 […]
V-Express 是由南京大学和腾讯AI实验室共同开发的一项可以把单张照片变成视频的技术,并且它能够根据不同 […]
Udio推出新的udio-130音乐生成模型,可以生成2分钟的音频,帮助创建更具连贯性和结构的曲目。 这意味着 […]
随着互联网和电子商务行业的快速发展,消费者通过在线平台可以方便地接触到各种类型的服装。然而,单纯依赖电商网站上 […]
Apten是一种AI驱动的SMS助手,帮助B2C企业通过短信自动化销售、营销和客户服务。Apten可以个性化配 […]
ChatTTS 是一个专门为对话场景设计的文本到语音模型,支持中英文,能生成自然流畅的对话语音。这个项目提供了 […]
Llama3-V 是基于 Llama3 的多模态模型,能够处理图像输入并生成对应的文本描述,适用于多种多模态任 […]
Khoj 是一个开源的、个人化的 AI 助手,旨在充当你的第二大脑。它能够帮助你回答任何问题,不论这些问题是在 […]
StreamV2V 是一个可以实现实时视频转换的工具,能够在一个 RTX 4090 显卡上运行。它可以用来做面 […]
“Look Once to Hear” 是一个智能耳机系统,通过短暂注视目标说话者即可在嘈杂环境中提取其语音并 […]
SignLLM 是首个多语言手语数据集及其生成模型,旨在通过先进的人工智能技术生成和翻译多种手语。该项目引入了 […]
如何将自己融入到一幅 Midjourney 生成的图片中,并使其动画化。让你可以成为动画中真正的演员并能控制角 […]
Stability AI 推出Stable Assistant聊天机器人,集成了最新的文本和图像生成技术。 视 […]
LlamaFS 是一个自动整理文件的系统。它基于Llama 3,可以帮你自动重命名和组织电脑里的文件。 自动整 […]
Canva推出了一系列新功能和工具,旨在改变工作方式,提高团队协作效率。这些新功能包括: Magic Stud […]
ReVideo是一个创新的视频编辑工具,允许用户通过指定内容和运动来精确地编辑视频。与现有的方法不同,ReVi […]
Pandora 是一个混合自回归-扩散模型,通过生成视频来模拟世界状态,并允许通过自然语言实时控制。 它能够根 […]
OpenAI 开发人员体验主管 Romain Huet 在VivaTech发表的演讲,他在台上发布他们的最新创 […]
RAGapp 是一个简便的企业级 Agentic RAG应用,旨在帮助企业用户高效使用人工智能(AI)技术。R […]
YOLOv10 是一个开源的实时端到端目标检测系统,由清华大学多媒体智能组(THU-MIG)开发。 意味着从输 […]
Flawless 是生成式人工智能电影制作技术的先驱,提供具有电影级质量的 AI 驱动工具,服务于电影制作人、 […]
BRINC推出了一款名为 Responder 无人机,专为公共安全和应急响应设计。该无人机及其充电站(Resp […]
加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]