钢琴是全球范围内最受欢迎的乐器之一。为特定歌曲创作钢琴伴奏通常需要高度的音乐知识和技术,而这种技术难度使得普通 […]
根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态的模型 Hallo 发布了更新版本Hallo […]
Google NotebookLM 引入了两项重要功能:自定义音频概述 和 NotebookLM Busine […]
Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces,专为提升团队的研究与协作效率。 […]
你是否曾梦想拥有一台可以自由编程和互动的智能机器人?现在机会来了!XGO Rider 是一款全球首创的桌面双轮 […]
Zerox 是一个简单易用的 OCR 工具,可将 PDF、DOCX 等文件转换为 Markdown 格式。 它 […]
法国AI初创公司 Mistral 推出了名为 “Les Ministraux” 的新一代生成式AI模型,专为笔 […]
Sieve推出专门用于目光矫正(eye contact correction)的API服务。这一API旨在让讲 […]
阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具,名为Marco MT。 阿里巴巴称,这款工具在翻译性能 […]
现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体 […]
Adobe Premiere Pro 正在推出多项新的生成式AI功能,尤其是名为Generative Exte […]
Augmented Physics 是一个结合机器学习的创作工具,旨在将传统物理教材中的静态图表转换为互动物理 […]
F5-TTS 是一种完全非自回归的文本转语音(Text-to-Speech, TTS)系统,该系统基于流匹配技 […]
FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]
继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]
OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架,专门用于构建、编排 […]
Anthropic 的 CEO Dario Amodei发表了一篇名为《机器爱的恩宠》的文章,讨论了强大人工智 […]
Meta AI推出 Meta MovieGen AI 视频生成模型,用于创建沉浸式视频和音频内容。它是媒体生成 […]
StackBlitz 推出了 Bolt․new,这是一款结合了 AI 与 WebContainers 技术的强 […]
在这一期 TED AI Show 中,伦理学家兼法律学者 Nita Farahany 讨论了神经技术的快速发展 […]
PimEyes 是一个人脸识别搜索引擎和反向图像搜索工具,旨在帮助用户找到哪些网站发布了他们的照片。它允许用户 […]
Voice-Pro 是一个基于Gradio Web-UI的集成解决方案,专注于语音转录、翻译和文本转语音(TT […]
陶哲轩(Terence Tao),加州大学洛杉矶分校(UCLA)的数学教授,被誉为“数学界的莫扎特”,他被广泛 […]
ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]
手语是聋哑人之间以及他们与外界沟通的重要工具,然而,许多不会手语的人无法与他们有效交流。这个项目的目标是通过自 […]
TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]
PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]
Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]
Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]
Inworld AI 发布《Beyond 2024》深入探讨了 AI 在游戏开发中的未来应用,尤其是如何通过 […]
钢琴是全球范围内最受欢迎的乐器之一。为特定歌曲创作钢琴伴奏通常需要高度的音乐知识和技术,而这种技术难度使得普通 […]