首页 > Ai资讯 > Ai日报
AI和脑机接口帮助失语症患者恢复双语交流
AI和脑机接口帮助失语症患者恢复双语交流

加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]

Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像
Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像

Consistent Character 模型,结合多种技术实现角色的一致性图像生成,可以生成给定角色的不同姿 […]

ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

ElevenLabs推出了一款新的AI音频模型,能够根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 […]

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布
接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

影眸团队推出了Rodin Gen-13D生成AI模型。这个模型可以在几十秒内通过文本生成高质量的3D模型,这些 […]

Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本
Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本

Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游 […]

Sonic:基于状态空间模型的低延迟实时推理语音生成模型
Sonic:基于状态空间模型的低延迟实时推理语音生成模型

Sonic 是一个快速、超逼真的语音生成模型,专为实时互动语音而设计,基于下一代状态空间模型(State Sp […]

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本
OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

OpenAI推出了ChatGPT Edu,这是一个为大学设计的专用版本,旨在让学生、教职员工、研究人员和校园运 […]

Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages
Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages

Perplexity AI推出Perplexity Pages ,该工具可以帮助你把你搜到的答案自动转化为视觉 […]

ToonCrafter:自动生成卡通动画的中间帧 并根据参考图像对草图自动上色
ToonCrafter:自动生成卡通动画的中间帧 并根据参考图像对草图自动上色

ToonCrafter 是一个帮助动画师生成和优化卡通动画过渡效果的工具。解决了卡通动画中帧与帧之间过渡不自然 […]

V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容
V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容

V-Express 是由南京大学和腾讯AI实验室共同开发的一项可以把单张照片变成视频的技术,并且它能够根据不同 […]

Udio推出新的udio-130音乐生成模型和更多高级功能
Udio推出新的udio-130音乐生成模型和更多高级功能

Udio推出新的udio-130音乐生成模型,可以生成2分钟的音频,帮助创建更具连贯性和结构的曲目。 这意味着 […]

ViViD:视频虚拟试穿技术 可以随意替换视频中人物的衣服
ViViD:视频虚拟试穿技术 可以随意替换视频中人物的衣服

随着互联网和电子商务行业的快速发展,消费者通过在线平台可以方便地接触到各种类型的服装。然而,单纯依赖电商网站上 […]

Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流
Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流

Apten是一种AI驱动的SMS助手,帮助B2C企业通过短信自动化销售、营销和客户服务。Apten可以个性化配 […]

ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文
ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文

ChatTTS 是一个专门为对话场景设计的文本到语音模型,支持中英文,能生成自然流畅的对话语音。这个项目提供了 […]

Llama3-V:500美元的成本构建的基于 Llama3 的多模态模型 性能与GPT-4V相当
Llama3-V:500美元的成本构建的基于 Llama3 的多模态模型 性能与GPT-4V相当

Llama3-V 是基于 Llama3 的多模态模型,能够处理图像输入并生成对应的文本描述,适用于多种多模态任 […]

Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑
Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑

Khoj 是一个开源的、个人化的 AI 助手,旨在充当你的第二大脑。它能够帮助你回答任何问题,不论这些问题是在 […]

StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换
StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换

StreamV2V 是一个可以实现实时视频转换的工具,能够在一个 RTX 4090 显卡上运行。它可以用来做面 […]

Look Once to Hear:全新的降噪耳机 只需注视对方即可放大或者消除对方声音
Look Once to Hear:全新的降噪耳机 只需注视对方即可放大或者消除对方声音

“Look Once to Hear” 是一个智能耳机系统,通过短暂注视目标说话者即可在嘈杂环境中提取其语音并 […]

SignLLM :第一个通过输入文字描述生成手语手势视频的多语言手语模型!
SignLLM :第一个通过输入文字描述生成手语手势视频的多语言手语模型!

SignLLM 是首个多语言手语数据集及其生成模型,旨在通过先进的人工智能技术生成和翻译多种手语。该项目引入了 […]

如何将自己融入到一幅 Midjourney 生成的图片中,并使其动画化
如何将自己融入到一幅 Midjourney 生成的图片中,并使其动画化

如何将自己融入到一幅 Midjourney 生成的图片中,并使其动画化。让你可以成为动画中真正的演员并能控制角 […]

Stability AI 推出Stable Assistant 聊天机器人 能聊天能生图能出视频
Stability AI 推出Stable Assistant 聊天机器人 能聊天能生图能出视频

Stability AI 推出Stable Assistant聊天机器人,集成了最新的文本和图像生成技术。 视 […]

LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具
LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具

LlamaFS 是一个自动整理文件的系统。它基于Llama 3,可以帮你自动重命名和组织电脑里的文件。 自动整 […]

Canva推出了一系列新功能和工具 16 项重要更新介绍
Canva推出了一系列新功能和工具 16 项重要更新介绍

Canva推出了一系列新功能和工具,旨在改变工作方式,提高团队协作效率。这些新功能包括: Magic Stud […]

ReVideo允许用户对视频特定区域和视频对象的运动轨迹进行精确编辑
ReVideo允许用户对视频特定区域和视频对象的运动轨迹进行精确编辑

ReVideo是一个创新的视频编辑工具,允许用户通过指定内容和运动来精确地编辑视频。与现有的方法不同,ReVi […]

Pandora:能够根据自然语言指令生成视频 并能实时进行视频控制的通用世界模型
Pandora:能够根据自然语言指令生成视频 并能实时进行视频控制的通用世界模型

Pandora 是一个混合自回归-扩散模型,通过生成视频来模拟世界状态,并允许通过自然语言实时控制。 它能够根 […]

OpenAI 开发人员体验主管VivaTech展示GPT-4o和Sora结合的能力
OpenAI 开发人员体验主管VivaTech展示GPT-4o和Sora结合的能力

OpenAI 开发人员体验主管 Romain Huet 在VivaTech发表的演讲,他在台上发布他们的最新创 […]

RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人
RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人

RAGapp 是一个简便的企业级 Agentic RAG应用,旨在帮助企业用户高效使用人工智能(AI)技术。R […]

YOLO v10:毫秒级实时的端到端目标检测开源模型
YOLO v10:毫秒级实时的端到端目标检测开源模型

YOLOv10 是一个开源的实时端到端目标检测系统,由清华大学多媒体智能组(THU-MIG)开发。 意味着从输 […]

Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本
Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本

Flawless 是生成式人工智能电影制作技术的先驱,提供具有电影级质量的 AI 驱动工具,服务于电影制作人、 […]

Responder 无人机 对接911报警系统 可70秒抵达案发现场实时监控
Responder 无人机 对接911报警系统 可70秒抵达案发现场实时监控

BRINC推出了一款名为 Responder 无人机,专为公共安全和应急响应设计。该无人机及其充电站(Resp […]


1 13 14 15 16 17 29