首页 > Ai资讯 > Ai日报
AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏
AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏

钢琴是全球范围内最受欢迎的乐器之一。为特定歌曲创作钢琴伴奏通常需要高度的音乐知识和技术,而这种技术难度使得普通 […]

Hallo 2:根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频
Hallo 2:根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频

根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态的模型 Hallo 发布了更新版本Hallo […]

Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容
Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容

Google NotebookLM 引入了两项重要功能:自定义音频概述 和 NotebookLM Busine […]

Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces 更加方便易用
Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces 更加方便易用

Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces,专为提升团队的研究与协作效率。 […]

全球首创桌面双轮足式 AI 机器人 接入ChatGPT 能跑、能看、能说、倒不了…
全球首创桌面双轮足式 AI 机器人 接入ChatGPT 能跑、能看、能说、倒不了…

你是否曾梦想拥有一台可以自由编程和互动的智能机器人?现在机会来了!XGO Rider 是一款全球首创的桌面双轮 […]

Zerox :一个简单易用的GPT OCR 工具 可将 PDF、DOCX 等文件转换为 Markdown 格式
Zerox :一个简单易用的GPT OCR 工具 可将 PDF、DOCX 等文件转换为 Markdown 格式

Zerox 是一个简单易用的 OCR 工具,可将 PDF、DOCX 等文件转换为 Markdown 格式。 它 […]

Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型 性能优于Llama 和 Gemma 模型
Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型 性能优于Llama 和 Gemma 模型

法国AI初创公司 Mistral 推出了名为 “Les Ministraux” 的新一代生成式AI模型,专为笔 […]

Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向
Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向

Sieve推出专门用于目光矫正(eye contact correction)的API服务。这一API旨在让讲 […]

阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具,名为Marco MT。 阿里巴巴称,这款工具在翻译性能 […]

Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作
Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作

现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体 […]

Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能,尤其是名为Generative Exte […]

Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来
Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具,旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统
F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音(Text-to-Speech, TTS)系统,该系统基于流匹配技 […]

One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作
OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架,专门用于构建、编排 […]

Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁
Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁

Anthropic 的 CEO Dario Amodei发表了一篇名为《机器爱的恩宠》的文章,讨论了强大人工智 […]

Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构
Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型,用于创建沉浸式视频和音频内容。它是媒体生成 […]

Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成
Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成

StackBlitz 推出了 Bolt․new,这是一款结合了 AI 与 WebContainers 技术的强 […]

人工智能能否读取你的思想?
人工智能能否读取你的思想?

在这一期 TED AI Show 中,伦理学家兼法律学者 Nita Farahany 讨论了神经技术的快速发展 […]

PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

PimEyes 是一个人脸识别搜索引擎和反向图像搜索工具,旨在帮助用户找到哪些网站发布了他们的照片。它允许用户 […]

Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具
Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具

Voice-Pro 是一个基于Gradio Web-UI的集成解决方案,专注于语音转录、翻译和文本转语音(TT […]

采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域
采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域

陶哲轩(Terence Tao),加州大学洛杉矶分校(UCLA)的数学教授,被誉为“数学界的莫扎特”,他被广泛 […]

Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]

使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势
使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势

手语是聋哑人之间以及他们与外界沟通的重要工具,然而,许多不会手语的人无法与他们有效交流。这个项目的目标是通过自 […]

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]

PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]

Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容
Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]

Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%
Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%

Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]

Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统
Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统

Inworld AI 发布《Beyond 2024》深入探讨了 AI 在游戏开发中的未来应用,尤其是如何通过 […]


1 2 3 4 5 31