首页 > Ai资讯
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]

PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]

Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容
Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]

Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%
Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%

Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]

Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统
Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统

Inworld AI 发布《Beyond 2024》深入探讨了 AI 在游戏开发中的未来应用,尤其是如何通过 […]

特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)

特斯拉在洛杉矶”We, Robot”活动上发布了其全新Cybercab,这款车类似于更小、更流线型的双座版Cy […]

Openai 异步客户端接入国产大模型 Kimi
Openai 异步客户端接入国产大模型 Kimi

Moonshot 介绍 Kimi Chat 是由月之暗面科技有限公司(Moonshot AI)开发的一款人工智 […]

高级 RAG 技术——图解概览
高级 RAG 技术——图解概览

原文:https://pub.towardsai.net/advanced-rag-techniques-an […]

GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!

AIPC是微软提出的概念,实际上就是把AI功能集成到电脑里,改变、重塑电脑的使用体验。 没买AIPC也没关系, […]

惊艳推荐!8款好用又免费的文本转语音TTS工具
惊艳推荐!8款好用又免费的文本转语音TTS工具

TTS(Text-to-Speech)技术是一项可以将文本转换成语音的技术。在早期,TTS技术主要依赖于预录制 […]

AI撬开小县城的万元商机
AI撬开小县城的万元商机

随着科技飞速发展,AI技术不再是大城市精英们的专属,它已经悄然下沉到四五线城市,甚至深入到县城。 对于下沉市场 […]

大模型:泛化即智能,压缩即一切!
大模型:泛化即智能,压缩即一切!

最近看了Ilya关于泛化的演讲有所感悟,所以总结了这篇文章,作为入门者只是尽力去联系和理解所观察到的现象,不会 […]

星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!
星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!

面壁智能多模态大模型 MiniCPM-V https://github.com/OpenBMB/MiniCPM […]

推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解

什么是思考链 (CoT) 思考链(Chain of Thought,简称 CoT)是一种推理策略,通过将复杂问 […]

OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露
OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露

OpenAI 推出了一款叫做 Canvas 的新工具,用来帮助用户更好地与 ChatGPT 协作写作和编程。 […]

哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

哈佛大学的学生 AnhPhu Nguyen 和 Caine Ardayfio 展示了AI智能眼镜的可怕能力,他 […]

 Hugging Face 推出一站式搜索开源成果的平台:Paper Central
 Hugging Face 推出一站式搜索开源成果的平台:Paper Central

Hugging Face 推出一个全面、便捷的学术平台:Paper Central  ,该平台可以帮助研究人员 […]

Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍
Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍

Black Forest Labs 宣布发布其最新的图像生成模型 FLUX1.1 [pro],以及开放测试版的 […]

OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…
OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…

在昨晚的 OpenAI 旧金山开发者大会( DevDay) 上 。OpenAI 公布了五项重大创新,其中“实时 […]

OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍
OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍

OpenAI 宣布推出了一个名为 large-v3-turbo(简称 turbo)的新 Whisper 模型。 […]

Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据
Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据

Liquid AI 是麻省理工学院的衍生公司,是一家总部位于马萨诸塞州波士顿的基础模型公司。 Liquid A […]

微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达
微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达

微软发布了 Azure AI 语音服务的新一代高清(HD)声音预览版本,进一步提升了语音的自然表达能力,尤其在 […]

微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化
微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化

微软推出了为每个人提供的“AI伴侣”Copilot,它不仅能够理解用户的需求,还能根据用户的日常习惯和偏好进行 […]

微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强
微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强

Copilot获得了全新的外观,加入了语音模式,并将在未来几周内向部分用户推送。新版本的Copilot比以往更 […]

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 melo […]

本地部署安装 Llama 3.2 大模型,支持1B、3B、11B、90B 模型
本地部署安装 Llama 3.2 大模型,支持1B、3B、11B、90B 模型

安装步骤:   1、通过Ollama进行部署 ,支持多平台!Windows / Mac /Linux 都可以运 […]

Llama 3.2 本地部署教程 ,11B模型、支持视觉、图片识别功能!
Llama 3.2 本地部署教程 ,11B模型、支持视觉、图片识别功能!

 Llama 3.2  11B 视觉模型下载方式 1、从Hugging Face模型库下载Llama 3.2 […]

RAT = CoT + RAG
RAT = CoT + RAG

Retrieval Augmented Thoughts (RAT) 是一种协同思维链 (CoT) 和检索增强 […]

超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频

南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类视频生成,实现生动的运动和面 […]


1 2 3 4 5 126