大型语言模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。然而,协调智能体合 […]
Mem0为大语言模型提供了一层智能的、自我改进的记忆层,用于大语言模型(LLM),以实现跨应用程序的个性化AI […]
多模态大语言模型(MLLMs)已经在理解图像和文本方面取得了很大的进展,但在如何表示和整合这两种类型的信息方面 […]
前几天介绍了Quivr,一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。不过Quivr侧重的是将你已有 […]
Live_Portrait_Monitor 基于快手的这个 LivePortrait 项目,实现了摄像头驱动图 […]
WayveScenes101 是一个用于自动驾驶应用的高分辨率图像数据集,主要用于新视角合成(novel vi […]
AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频内容转结构化笔记系统。它的主要功能 […]
Unique3D 是一个创新的图像到3D框架,可以从任意对象的单一正交RGB图像中生成高保真3D纹理网格,生成 […]
今天给大家介绍一个效果不错的开源文本转语音工具:MeloTTS MeloTTS是一个可以把文字转换成声音的工具 […]
一键清理病毒的Tron脚本下载(开源):https://www.freedidi.com/12992.ht […]
在当今复杂的数字环境中,计算机病毒和恶意软件仍然是一个持续的威胁。为了应对这一挑战,IT专业人士和高级用户经常 […]
在浏览器插件市场竞争激烈之际,海螺AI却另辟蹊径,推出了创新的"手机插件"——悬浮球功能。这款小巧的悬浮球在不 […]
微软正式推出 Microsoft Designer,这是一款创新的设计应用程序,利用人工智能技术赋予用户全新的 […]
Mistral AI 宣布发布 Mistral NeMo,这是一个由 NVIDIA 协作开发的 12B 参数模 […]
StockBot由Llama3-70B模型驱动,运行在Groq上,能够提供实时股票图表、财务数据、新闻的聊天机 […]
MUSCLE(Model Update Strategy for Compatible LLM Evoluti […]
IMAGDressing-v1 是一个自定义虚拟试衣系统,可生成可自由编辑的人像图像。该系统主要面向商家,帮助 […]
ElevenLabs 推出了新款 Turbo 2.5 模型。 支持印地语、法语、西班牙语、普通话和其他共32 […]
从昨天开始,全球范围内的Windows系统的电脑,出现了大范围的蓝屏死机问题!目前已经确认的是,这个全球性的电 […]
————————————- 🔔 1.修复CrowdStrike 导致的蓝屏死机问题:https://www.f […]
大模型已经发布很久,网络上的大模型形形色色,现在已然是群英荟萃,那么,如何在本地运行一个大模型? 本文采用ol […]
最近在搞克隆人,发现一个很好的声音克隆项目,测试了一下,效果真不错,可以直接用,也可以微调后使用,好了废话不多 […]
在介绍扣子的图像流之前,有必要先讲讲 ComfyUI.ComfyUI 是一个爆火的开源项目,目前在 Githu […]
OpenAI推出了GPT-4o mini模型,用来取代GPT-3.5,这是目前市场上最具成本效益的小模型。 该 […]
TCAN项目致力于创建一个能够根据视频姿态生成一致性人像动画的方法。 也就是通过从视频中提取人物姿态动作,然后 […]
SmolLM 是由 Hugging Face 推出的一个小型语言模型系列,具有 135M、360M 和 1.7 […]
研究表明,仅通过优化链式思维(Chain-of-Thought, CoT)来解答问题,仅仅追求答案的正确性,可 […]
DETECT-2B 是由 Resemble AI 开发的一种先进的音频深度伪造检测工具。它旨在快速、准确地识别 […]
Baptiste Adrien 在X上介绍了其正在使用 @vercel 和 @nextjs 技术,开发一个 R […]
由电影制作人和科学家共同打造的Flawless公司,可能终于跨越了内容配音的“恐怖谷”(Uncanny Val […]
大型语言模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。然而,协调智能体合 […]