首页 > Ai资讯 > Ai日报
Fish Speech:完美支持中英日语言的开源TTS模型 接近人类水平
Fish Speech:完美支持中英日语言的开源TTS模型 接近人类水平

Fish Speech 是一个全新的文本转语音 (TTS) 解决方案,该项目由fishaudio开发。当前模型 […]

Runway Gen-3 Alpha 详细使用教程以及提示词指南大全
Runway Gen-3 Alpha 详细使用教程以及提示词指南大全

Gen-3 Alpha 是Runway推出的新一代视频生成模型,它在保真度、一致性、运动和速度方面都比以前的模 […]

Figure宣布与BMW制造公司签署商业协议 将通用机器人引入汽车生产
Figure宣布与BMW制造公司签署商业协议 将通用机器人引入汽车生产

Figure是一家总部位于加利福尼亚的公司,专注于开发自主人形机器人。该公司宣布与BMW制造公司签署商业协议, […]

StableFace:使用Stable Diffusion 2.1构建自己的面部美颜应用程序
StableFace:使用Stable Diffusion 2.1构建自己的面部美颜应用程序

StableFace是一个使用Stable Diffusion 2.1构建自己的面部美颜应用程序的项目。 通过 […]

SuperAnimal:能够自动检测和分析动物的运动行为的模型
SuperAnimal:能够自动检测和分析动物的运动行为的模型

SuperAnimal是由洛桑联邦理工学院(EPFL)团队开发的一种革命性深度学习模型。这个工具是一个开源的姿 […]

Resona V2A :利用AI解读理解视频 自动为视频进行配音配乐
Resona V2A :利用AI解读理解视频 自动为视频进行配音配乐

Resona V2A 是首个商用的视频转音频(Video to Audio,V2A)技术产品,能够通过视频数据 […]

OmniParse :一个开源的数据清理和整理的自动化工具 支持多种文件格式
OmniParse :一个开源的数据清理和整理的自动化工具 支持多种文件格式

OmniParse 是一个数据摄取和解析平台,可以将各种非结构化数据(如文档、表格、图像、视频、音频文件和网页 […]

Magnific Relight 教程:通过一个提示和参考图像来改变任何图像场景的照明和背景
Magnific Relight 教程:通过一个提示和参考图像来改变任何图像场景的照明和背景

🔥 Magnific Relight 🔥 通过一个提示、参考图像或光照图来改变任何场景的照明和背景! 主要信息 […]

全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答
全球首款集成GPT-4o 的智能眼镜发布 支持视觉能力和实时问答

Solos公司在香港智能眼镜峰会上发布了其最新的Solos AirGo Vision智能眼镜,这是首款集成Ch […]

如何用 Magnific Relight 把手机自拍转为写真照 & 制作电商产品图
如何用 Magnific Relight 把手机自拍转为写真照 & 制作电商产品图

简介 📌 本教程将指导您如何使用 Magnific.ai 的最新 Relight功能将手机自拍转化为专业肖像照 […]

Character.AI推出新功能 让你可以与AI角色进行通电话
Character.AI推出新功能 让你可以与AI角色进行通电话

的Character.AI公司宣布,现在用户可以通过电话与AI角色进行对话。这个功能支持多种语言,包括英语、西 […]

Hebbia获得近1亿美元B轮融资 利用AI一次可以处理多达数百万份文档
Hebbia获得近1亿美元B轮融资 利用AI一次可以处理多达数百万份文档

Hebbia是一家利用生成式AI进行大型文档搜索并返回答案的初创公司。该公司近日获得了由Andreessen […]

微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人
微软文本转语音虚拟数字人功能上线 可以创建实时互动的数字人

Azure的文本转语音虚拟形象功能允许用户通过输入文本来创建说话的虚拟形象视频。这些虚拟形象使用高级神经网络模 […]

代理符号学习框架:使人工智能代理能够自主学习和自我进化优化
代理符号学习框架:使人工智能代理能够自主学习和自我进化优化

本研究的主要目的是开发一种新的方法,使人工智能语言代理能够自主学习和进化,从而减少对人工工程设计的依赖,并推动 […]

OpenAI 开发了一个名为 CriticGPT 的模型 专门用来找ChatGPT的错误
OpenAI 开发了一个名为 CriticGPT 的模型 专门用来找ChatGPT的错误

OpenAI 开发了一种名为 CriticGPT 的模型,该模型基于 GPT-4,用于帮助发现 ChatGPT […]

Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比
Anthropic击败OpenAI:Claude 3.5 Sonnet与GPT-4o的并排对比

Austin Starks详细对比了Anthropic的Claude 3.5 Sonnet和OpenAI的GP […]

ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成
ToucanTTS:支持语言种类最多的 TTS 模型 支持超过7000种语言的语音合成

斯图加特大学自然语言处理研究所(IMS)开发了一个超全文本转语音模型ToucanTTS。ToucanTTS专为 […]

和 GPT 4o 匹敌 世界上最快的语音机器 实现500毫秒的语音到语音响应
和 GPT 4o 匹敌 世界上最快的语音机器 实现500毫秒的语音到语音响应

Daily与Cerebrium合作开发的一款语音AI机器人,该机器人能够实现500毫秒的语音到语音响应时间。5 […]

硅基智能开源其AI数字人交互平台 可以轻松创建逼真数字人
硅基智能开源其AI数字人交互平台 可以轻松创建逼真数字人

硅基智能开源其AI数字人交互平台,旨在帮助开发者快速创建并部署智能数字人。 这些数字人可以进行语音识别和语音合 […]

Alter 3:利用 GPT-4驱动的人机器人 将自然语言命令转换为机器人动作
Alter 3:利用 GPT-4驱动的人机器人 将自然语言命令转换为机器人动作

东京大学和Alternative Machine的研究人员开发了一种名为Alter3的仿人机器人系统,该系统可 […]

NVIDIA Broadcast:利用 AI 提升音频和视频质量 能够去除噪音、替换虚拟背景
NVIDIA Broadcast:利用 AI 提升音频和视频质量 能够去除噪音、替换虚拟背景

NVIDIA通过其硬件(NVENC)和软件(Maxine和NVIDIA Broadcast)解决方案,简化了高 […]

Google发布其开源模型Gemma 2 全新的架构设计 性能大幅提升
Google发布其开源模型Gemma 2 全新的架构设计 性能大幅提升

Google发布了Gemma 2,这是其下一代开放模型,旨在为研究人员和开发者提供更高性能和效率的AI工具。G […]

Figma 推出新的演示文稿制作工具 Figma Slides
Figma 推出新的演示文稿制作工具 Figma Slides

Figma 推出新的演示文稿制作工具 Figma Slides ,允许多个用户实时协作编辑同一个演示文稿。团队 […]

Figma 发布一系列 AI 功能 可根据提示生成不同风格和布局的设计初稿
Figma 发布一系列 AI 功能 可根据提示生成不同风格和布局的设计初稿

Figma 在 Config 2024 大会上发布了一系列新功能和更新,旨在提升设计效率和用户体验。 Figm […]

ChatGPT Mac客户端正式发布 可以通过屏幕截图上的任何内容进行聊天
ChatGPT Mac客户端正式发布 可以通过屏幕截图上的任何内容进行聊天

ChatGPT 桌面应用程序现已面向所有 macOS 用户提供。 通过 Option + Space 快捷键, […]

Claude推出了自己的类似GPTs 聊天机器人功能:Projects 但是有所不同
Claude推出了自己的类似GPTs 聊天机器人功能:Projects 但是有所不同

Claude推出了一项名为“Projects”的新功能,类似 ChatGPT 的GPTs,你可以创建个性化的机 […]

字节跳动发布AI开发工具:豆包MarsCode 无需配置环境实现云端编码开发
字节跳动发布AI开发工具:豆包MarsCode 无需配置环境实现云端编码开发

字节跳动发布基于豆包大模型打造的智能开发工具——豆包MarsCode,面向国内开发者免费开放。 豆包 Mars […]

Streamer-Sales:一个直播卖货大模型 能自动卖货 实时回答客户任何问题
Streamer-Sales:一个直播卖货大模型 能自动卖货 实时回答客户任何问题

Streamer-Sales 是一个直播卖货大模型,它能够帮助直播带货主播生成商品解说文案。能根据商品特点,自 […]

每首歌索赔 15 万美元 索尼、环球音乐、华纳起诉 Suno 和 Udio
每首歌索赔 15 万美元 索尼、环球音乐、华纳起诉 Suno 和 Udio

包括环球音乐集团(UMG)、索尼音乐娱乐公司(Sony Music Entertainment)和华纳唱片公司 […]

Google 推出 Gmail 侧边栏 Gemini 智能助手功能 可以帮你回复邮件
Google 推出 Gmail 侧边栏 Gemini 智能助手功能 可以帮你回复邮件

Google 宣布,推出 Gmail 侧边栏中的 Gemini 智能助手功能。此功能基于其AI模型(Gemin […]


1 9 10 11 12 13 29