首页 > Ai资讯 > Ai日报
ElevenLabs 发布Turbo 2.5模型 速度提高了3倍 支持中文等32种语言
ElevenLabs 发布Turbo 2.5模型 速度提高了3倍 支持中文等32种语言

ElevenLabs 推出了新款 Turbo 2.5 模型。 支持印地语、法语、西班牙语、普通话和其他共32 […]

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快更便宜
OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快更便宜

OpenAI推出了GPT-4o mini模型,用来取代GPT-3.5,这是目前市场上最具成本效益的小模型。 该 […]

TCAN:从视频中提取人物姿态动作 转移给图片 能让静态图片动起来
TCAN:从视频中提取人物姿态动作 转移给图片 能让静态图片动起来

TCAN项目致力于创建一个能够根据视频姿态生成一致性人像动画的方法。 也就是通过从视频中提取人物姿态动作,然后 […]

Hugging Face发布了一个完全开源的端侧模型SmolLM 可在手机上运行
Hugging Face发布了一个完全开源的端侧模型SmolLM 可在手机上运行

SmolLM 是由 Hugging Face 推出的一个小型语言模型系列,具有 135M、360M 和 1.7 […]

OpenAI 提出了一种新方法 来提高模型输出答案的可读性 确保输出正确且易于理解
OpenAI 提出了一种新方法 来提高模型输出答案的可读性 确保输出正确且易于理解

研究表明,仅通过优化链式思维(Chain-of-Thought, CoT)来解答问题,仅仅追求答案的正确性,可 […]

DETECT-2B :音频深度伪造检测工具 可以在只200毫秒内检测30多种语言的音频
DETECT-2B :音频深度伪造检测工具 可以在只200毫秒内检测30多种语言的音频

DETECT-2B 是由 Resemble AI 开发的一种先进的音频深度伪造检测工具。它旨在快速、准确地识别 […]

使用 Vercel 和 Nextjs 技术 开发一个 RAG(检索增强生成)系统
使用 Vercel 和 Nextjs 技术 开发一个 RAG(检索增强生成)系统

Baptiste Adrien 在X上介绍了其正在使用 @vercel 和 @nextjs 技术,开发一个 R […]

电影配音工种集体失业 全球第一部由 AI 完全翻译配音的电影即将上映
电影配音工种集体失业 全球第一部由 AI 完全翻译配音的电影即将上映

由电影制作人和科学家共同打造的Flawless公司,可能终于跨越了内容配音的“恐怖谷”(Uncanny Val […]

Mistral 发布了2个7B小模型: Codestral Mamba 7B 和 Mathstral 7B 
Mistral 发布了2个7B小模型: Codestral Mamba 7B 和 Mathstral 7B 

Mistral 通过 Mamba 2架构训练了一个7B 的代码模型:Codestral Mamba,以及新推出 […]

阿里巴巴发布语音模型:Qwen2-Audio 可与模型直接语音对话和分析转录各种声音
阿里巴巴发布语音模型:Qwen2-Audio 可与模型直接语音对话和分析转录各种声音

阿里巴巴发布了一个音频处理模型:Qwen2-Audio ,它可以通过语音聊天和音频分析两种方式与用户互动。在语 […]

Exa AI:真正的AI搜索引擎 要做 AI 领域的 Google
Exa AI:真正的AI搜索引擎 要做 AI 领域的 Google

又一个AI搜索引擎诞生:Exa AI。该公司最近宣布获得了1700万美元的A轮融资,由Lightspeed领投 […]

H2O-Danube3:无需联网 可以直接在手机上运行的开源模型
H2O-Danube3:无需联网 可以直接在手机上运行的开源模型

H2O-Danube3 是一个由 H2O.ai 开发的一系列小型语言模型。这些模型旨在提供高效的自然语言处理能 […]

微软团队研究出一种新的方 可以让大语言模型更好地理解和处理电子表格数据
微软团队研究出一种新的方 可以让大语言模型更好地理解和处理电子表格数据

微软研究团队提出了一种新的方法,旨在帮助大语言模型(如GPT-4)更好地理解和处理电子表格数据。传统方法在处理 […]

AutoGPT:使用“Blocks”像搭积木一样创建和使用AI代理的过程
AutoGPT:使用“Blocks”像搭积木一样创建和使用AI代理的过程

AutoGPT是一个开源工具,旨在简化创建和使用AI代理的过程。用户可以通过一个简单的图表式界面设计代理,并在 […]

RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容
RenderNet Al 推出视频换脸功能 可轻松通过照片更改视频人物面容

RenderNet Al是一款强大的图像生成工具,专注于创建一致的角色,并控制其姿势、构图和风格。 现在推出了 […]

谷歌开发出一个实时语音转换系统 在不改变语音内容和语调的情况下 改变说话者音色
谷歌开发出一个实时语音转换系统 在不改变语音内容和语调的情况下 改变说话者音色

StreamVC 是由Google开发的一个实时语音转换系统,可以在不改变语音内容和语调的情况下,改变说话者的 […]

Emilia 一个开源多语言高质量语音数据集 包含六种语言 超10万小时
Emilia 一个开源多语言高质量语音数据集 包含六种语言 超10万小时

Emilia 是一个广泛的开源多语言数据集,用于语音生成,包含六种语言的高质量语音数据。这些数据来自各种视频平 […]

Magic Insert:将一个图像中的人或物体拖放到另一个风格图像中 并实现风格融合
Magic Insert:将一个图像中的人或物体拖放到另一个风格图像中 并实现风格融合

Magic Insert 是一个是一种能够将图像中的主体从一个具有任意风格的图像拖放到另一种风格迥异的目标图像 […]

亚马逊推出了一款人工智能购物助手:Rufus 帮助用户进行购物决策
亚马逊推出了一款人工智能购物助手:Rufus 帮助用户进行购物决策

经过数月的测试,亚马逊今天向所有美国客户推出了其生成式人工智能购物助手Rufus。这个对话式购物助手旨在帮助客 […]

路透社:OpenAI 正在开发代号为“Strawberry”的新模型 可自主浏览互联网并自主推理
路透社:OpenAI 正在开发代号为“Strawberry”的新模型 可自主浏览互联网并自主推理

据路透社报道, OpenAI 正在开展一个代号为“Strawberry”的新人工智能模型项目。 “Strawb […]

英国剑桥大学开发出的AI模型 在预测阿尔茨海默症方面超过了临床测试
英国剑桥大学开发出的AI模型 在预测阿尔茨海默症方面超过了临床测试

老痴呆症(阿尔茨海默疾病)是一个全球性的健康挑战,影响超过5500万人,估计每年造成 8200 亿美元的费用预 […]

一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情
一个用于认知行为疗法(CBT)的提示 帮你识别生活中令人困扰事情

Reddit用户分享了一个用于认知行为疗法(CBT)的提示,旨在帮助用户通过一系列问题来识别和重构他们的负面思 […]

斯坦福大学推出一种上下文向量(ICV)新方法 提高模型微调效率和可扩展性
斯坦福大学推出一种上下文向量(ICV)新方法 提高模型微调效率和可扩展性

传统的上下文学习方法需要提供大量的上下文信息(即例子),才能让模型理解和生成正确的输出。这种方法会导致性能不稳 […]

EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导
EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

EmoLLM 是一个用于心理健康领域的大模型项目,通过对大型语言模型(LLM)进行指令微调,旨在支持用户理解、 […]

OpenAI 举行全体员工大会 推出了一个 AGI 等级体系 并展示了接近人类推理能力的模型
OpenAI 举行全体员工大会 推出了一个 AGI 等级体系 并展示了接近人类推理能力的模型

在最近的全体员工大会上,OpenAI 推出了一个五级评分系统,用于追踪其在开发超越人类能力的人工智能软件方面的 […]

OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练
OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练

Prime Intellect推出了OpenDiLoCo,这是DeepMind分布式低通信(DiLoCo)方法 […]

Google DeepMind 将Gemini 1.5 Pro安装到机器人上 实现机器人的记忆导航能力
Google DeepMind 将Gemini 1.5 Pro安装到机器人上 实现机器人的记忆导航能力

Google DeepMind 的机器人团队展示了将Google Gemini 1.5 Pro安装到机器人里面 […]

EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频
EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频

EchoMimic 是由蚂蚁集团开发的一种通过音频和面部标志生成逼真的肖像动画视频的新方法。与传统的方法不同, […]

教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。
教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。

现在你可以在几秒钟内将 YouTube 视频转换为博客文章... Support authors and su […]

Google新的 AI 训练技术 使得模型训练速度快了 13倍 效率提高了 10倍
Google新的 AI 训练技术 使得模型训练速度快了 13倍 效率提高了 10倍

DeepMind 发布了一项新的研究,声称其新方法可以将 AI 模型的训练速度和能效大幅提升一个数量级,以高达 […]


1 7 8 9 10 11 29