首页 > Ai资讯 > Ai日报
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能,尤其是名为Generative Exte […]

Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来
Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具,旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统
F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音(Text-to-Speech, TTS)系统,该系统基于流匹配技 […]

One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作
OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架,专门用于构建、编排 […]

Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁
Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁

Anthropic 的 CEO Dario Amodei发表了一篇名为《机器爱的恩宠》的文章,讨论了强大人工智 […]

Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构
Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型,用于创建沉浸式视频和音频内容。它是媒体生成 […]

Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成
Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成

StackBlitz 推出了 Bolt․new,这是一款结合了 AI 与 WebContainers 技术的强 […]

人工智能能否读取你的思想?
人工智能能否读取你的思想?

在这一期 TED AI Show 中,伦理学家兼法律学者 Nita Farahany 讨论了神经技术的快速发展 […]

PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

PimEyes 是一个人脸识别搜索引擎和反向图像搜索工具,旨在帮助用户找到哪些网站发布了他们的照片。它允许用户 […]

Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具
Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具

Voice-Pro 是一个基于Gradio Web-UI的集成解决方案,专注于语音转录、翻译和文本转语音(TT […]

采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域
采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域

陶哲轩(Terence Tao),加州大学洛杉矶分校(UCLA)的数学教授,被誉为“数学界的莫扎特”,他被广泛 […]

使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势
使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势

手语是聋哑人之间以及他们与外界沟通的重要工具,然而,许多不会手语的人无法与他们有效交流。这个项目的目标是通过自 […]

Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]

PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]

Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容
Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]

Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%
Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%

Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]

Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统
Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统

Inworld AI 发布《Beyond 2024》深入探讨了 AI 在游戏开发中的未来应用,尤其是如何通过 […]

特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)

特斯拉在洛杉矶”We, Robot”活动上发布了其全新Cybercab,这款车类似于更小、更流线型的双座版Cy […]

OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露
OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露

OpenAI 推出了一款叫做 Canvas 的新工具,用来帮助用户更好地与 ChatGPT 协作写作和编程。 […]

哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

哈佛大学的学生 AnhPhu Nguyen 和 Caine Ardayfio 展示了AI智能眼镜的可怕能力,他 […]

 Hugging Face 推出一站式搜索开源成果的平台:Paper Central
 Hugging Face 推出一站式搜索开源成果的平台:Paper Central

Hugging Face 推出一个全面、便捷的学术平台:Paper Central  ,该平台可以帮助研究人员 […]

Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍
Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍

Black Forest Labs 宣布发布其最新的图像生成模型 FLUX1.1 [pro],以及开放测试版的 […]

OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…
OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…

在昨晚的 OpenAI 旧金山开发者大会( DevDay) 上 。OpenAI 公布了五项重大创新,其中“实时 […]

OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍
OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍

OpenAI 宣布推出了一个名为 large-v3-turbo(简称 turbo)的新 Whisper 模型。 […]

Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据
Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据

Liquid AI 是麻省理工学院的衍生公司,是一家总部位于马萨诸塞州波士顿的基础模型公司。 Liquid A […]

微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达
微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达

微软发布了 Azure AI 语音服务的新一代高清(HD)声音预览版本,进一步提升了语音的自然表达能力,尤其在 […]

微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化
微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化

微软推出了为每个人提供的“AI伴侣”Copilot,它不仅能够理解用户的需求,还能根据用户的日常习惯和偏好进行 […]


1 2 3 29