ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]
TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]
PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]
Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]
Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]
Inworld AI 发布《Beyond 2024》深入探讨了 AI 在游戏开发中的未来应用,尤其是如何通过 […]
特斯拉在洛杉矶”We, Robot”活动上发布了其全新Cybercab,这款车类似于更小、更流线型的双座版Cy […]
Moonshot 介绍 Kimi Chat 是由月之暗面科技有限公司(Moonshot AI)开发的一款人工智 […]
原文:https://pub.towardsai.net/advanced-rag-techniques-an […]
AIPC是微软提出的概念,实际上就是把AI功能集成到电脑里,改变、重塑电脑的使用体验。 没买AIPC也没关系, […]
TTS(Text-to-Speech)技术是一项可以将文本转换成语音的技术。在早期,TTS技术主要依赖于预录制 […]
随着科技飞速发展,AI技术不再是大城市精英们的专属,它已经悄然下沉到四五线城市,甚至深入到县城。 对于下沉市场 […]
最近看了Ilya关于泛化的演讲有所感悟,所以总结了这篇文章,作为入门者只是尽力去联系和理解所观察到的现象,不会 […]
面壁智能多模态大模型 MiniCPM-V https://github.com/OpenBMB/MiniCPM […]
什么是思考链 (CoT) 思考链(Chain of Thought,简称 CoT)是一种推理策略,通过将复杂问 […]
OpenAI 推出了一款叫做 Canvas 的新工具,用来帮助用户更好地与 ChatGPT 协作写作和编程。 […]
哈佛大学的学生 AnhPhu Nguyen 和 Caine Ardayfio 展示了AI智能眼镜的可怕能力,他 […]
Hugging Face 推出一个全面、便捷的学术平台:Paper Central ,该平台可以帮助研究人员 […]
Black Forest Labs 宣布发布其最新的图像生成模型 FLUX1.1 [pro],以及开放测试版的 […]
在昨晚的 OpenAI 旧金山开发者大会( DevDay) 上 。OpenAI 公布了五项重大创新,其中“实时 […]
OpenAI 宣布推出了一个名为 large-v3-turbo(简称 turbo)的新 Whisper 模型。 […]
Liquid AI 是麻省理工学院的衍生公司,是一家总部位于马萨诸塞州波士顿的基础模型公司。 Liquid A […]
微软发布了 Azure AI 语音服务的新一代高清(HD)声音预览版本,进一步提升了语音的自然表达能力,尤其在 […]
微软推出了为每个人提供的“AI伴侣”Copilot,它不仅能够理解用户的需求,还能根据用户的日常习惯和偏好进行 […]
Copilot获得了全新的外观,加入了语音模式,并将在未来几周内向部分用户推送。新版本的Copilot比以往更 […]
Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 melo […]
安装步骤: 1、通过Ollama进行部署 ,支持多平台!Windows / Mac /Linux 都可以运 […]
Llama 3.2 11B 视觉模型下载方式 1、从Hugging Face模型库下载Llama 3.2 […]
Retrieval Augmented Thoughts (RAT) 是一种协同思维链 (CoT) 和检索增强 […]
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类视频生成,实现生动的运动和面 […]
ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]