一、overview 在第一部分,已经介绍过 Transformer 的整体架构: 1. 数据在输入编码器和解 […]
1、蓝海战略:是指在商业策略中寻找或创造没有竞争的新市场空间,也就是“蓝海”,从而避免在充满激烈竞争的现有市场 […]
大型语言模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据 […]
五一小长假,竟然被黏土滤镜刷屏了。 这是一款风格滤镜,可以一键把照片转绘成土里土气、可可爱爱的黏土风,就像这样 […]
标题:IP-Adapter 新模型超越 Roop 和 Reactor:更完美的角色一致性和相似性 继我们上一篇 […]
大型语言模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。然而,协调智能体合 […]
前几天介绍了Quivr,一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。不过Quivr侧重的是将你已有 […]
今天给大家介绍一个效果不错的开源文本转语音工具:MeloTTS MeloTTS是一个可以把文字转换成声音的工具 […]
大模型已经发布很久,网络上的大模型形形色色,现在已然是群英荟萃,那么,如何在本地运行一个大模型? 本文采用ol […]
最近在搞克隆人,发现一个很好的声音克隆项目,测试了一下,效果真不错,可以直接用,也可以微调后使用,好了废话不多 […]
在介绍扣子的图像流之前,有必要先讲讲 ComfyUI.ComfyUI 是一个爆火的开源项目,目前在 Githu […]
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的 […]
MoveNet是Google在2021年5月推出的一款轻量化姿态估计模型,集成在MediaPipe当中,出来至 […]
来围观初代教父唱《野狼disco》 之前全网刷屏的阿里明星项目 EMO 终于正式开放了!简单来说,EMO […]
随着生成型人工智能(AI)的飞速发展,多模态理解和代码生成的能力达到了前所未有的水平。这为前端开发带来了一场自 […]
3.5k star!一款万能的 SQL 分析工具,厉害了! 大家好,我是开源君! 众所周知,SQL是数据分析领 […]
摘要:嵌入技术(Embedding)是一种将高维数据映射到低维空间的技术,在人工智能与图形学研究中被广泛应用。 […]
最近,国内的Coze更新了多智能体(Multi-Agents),距离上一次发布已近半年了。那么,多智能体究竟是 […]
腾讯元宝已经上架应用宝、小米、华为、vivo、OPPO等应用商店,苹果App Store中尚未搜到该应用,还 […]
昨天探索了多任务模式,让系统根据用户的输入信息自动找到对应的代理进行处理。今天继续来探索多任务模式的多任务分配 […]
代理模式不仅可以拓展大模型的功能(比如给大模型加上网页搜索,加入知识库等),还可以规避大模型的弱点(比如需求是 […]
论文:《The Power of Noise: Redefining Retrieval for RAG Sy […]
InstantID是一个非常不错的AI绘画工具,一张图片,一键生成百变的自己。 除了配置运行难度搞一点之外 […]
一场资本暗战 这是一场融资的突变。 在持续了一年多的中国大模型鏖战中,由杨植麟创办的月之暗面,尽管是一个是 […]
年后开工准备用SD的工作流版本ComfyUI整点东西出来。之所以要搞这个,主要是因为它跟我目前要做的很多内容都 […]
古早的互联网时代其实有很多非常经典和厉害的内容,这些内容不会随着时间的推移和环境的变化而失去价值。就像这篇文章 […]
一、引言 随着大型语言模型如 ChatGPT 的横空出世,我们进入了自然语言处理(NLP)的一个新纪元。在这个 […]
Kolors可图是快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训 […]
身体姿态估计旨在识别出给定图像中人或者动物实例身体的关键点,除了典型的身体骨骼关键点,还可以包括手、脚、脸部等 […]
在本地电脑上运行大型语言模型(LLM),需要考虑的关键因素之一就是电脑的内存够不够。希望能通过这篇文章让各位有 […]
一、overview 在第一部分,已经介绍过 Transformer 的整体架构: 1. 数据在输入编码器和解 […]