首页 > Ai资讯 > Ai知识库
图解 transformer——逐层介绍
图解 transformer——逐层介绍

一、overview 在第一部分,已经介绍过 Transformer 的整体架构: 1. 数据在输入编码器和解 […]

40个值得收藏的AI prompt提示词,帮助你更好地思考问题,做出更加准确地商业决策,让你无往不利
40个值得收藏的AI prompt提示词,帮助你更好地思考问题,做出更加准确地商业决策,让你无往不利

1、蓝海战略:是指在商业策略中寻找或创造没有竞争的新市场空间,也就是“蓝海”,从而避免在充满激烈竞争的现有市场 […]

阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!

大型语言模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。尽管检索增强的LLMs通过检索外部数据 […]

比 remini 更便宜,比美图更有风格!黏土滤镜免费做,速领
比 remini 更便宜,比美图更有风格!黏土滤镜免费做,速领

五一小长假,竟然被黏土滤镜刷屏了。 这是一款风格滤镜,可以一键把照片转绘成土里土气、可可爱爱的黏土风,就像这样 […]

比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真

标题:IP-Adapter 新模型超越 Roop 和 Reactor:更完美的角色一致性和相似性 继我们上一篇 […]

[论文] 阿里提出AgentScope:灵活强大的智能体框架
[论文] 阿里提出AgentScope:灵活强大的智能体框架

大型语言模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。然而,协调智能体合 […]

【开源看AI】4.2K star!Reor:AI自动帮你发现知识之间的连接
【开源看AI】4.2K star!Reor:AI自动帮你发现知识之间的连接

前几天介绍了Quivr,一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。不过Quivr侧重的是将你已有 […]

AI文本转语音工具(TTS):MeloTTS
AI文本转语音工具(TTS):MeloTTS

今天给大家介绍一个效果不错的开源文本转语音工具:MeloTTS MeloTTS是一个可以把文字转换成声音的工具 […]

ollama本地部署自然语言大模型
ollama本地部署自然语言大模型

大模型已经发布很久,网络上的大模型形形色色,现在已然是群英荟萃,那么,如何在本地运行一个大模型? 本文采用ol […]

数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源

最近在搞克隆人,发现一个很好的声音克隆项目,测试了一下,效果真不错,可以直接用,也可以微调后使用,好了废话不多 […]

扣子更新图像流功能,字节版 ComfyUI 来了!
扣子更新图像流功能,字节版 ComfyUI 来了!

在介绍扣子的图像流之前,有必要先讲讲 ComfyUI.ComfyUI 是一个爆火的开源项目,目前在 Githu […]

Deepseek-V2技术报告解读!全网最细!
Deepseek-V2技术报告解读!全网最细!

深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的 […]

Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计

MoveNet是Google在2021年5月推出的一款轻量化姿态估计模型,集成在MediaPipe当中,出来至 […]

四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放

来围观初代教父唱《野狼disco》   之前全网刷屏的阿里明星项目 EMO 终于正式开放了!简单来说,EMO […]

斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!

随着生成型人工智能(AI)的飞速发展,多模态理解和代码生成的能力达到了前所未有的水平。这为前端开发带来了一场自 […]

3.5k star!一款万能的 SQL 分析工具,厉害了!
3.5k star!一款万能的 SQL 分析工具,厉害了!

3.5k star!一款万能的 SQL 分析工具,厉害了! 大家好,我是开源君! 众所周知,SQL是数据分析领 […]

AIGC系列之一-一文理解什么是Embedding嵌入技术
AIGC系列之一-一文理解什么是Embedding嵌入技术

摘要:嵌入技术(Embedding)是一种将高维数据映射到低维空间的技术,在人工智能与图形学研究中被广泛应用。 […]

Coze多智能体(Multi-Agents)模式体验!
Coze多智能体(Multi-Agents)模式体验!

最近,国内的Coze更新了多智能体(Multi-Agents),距离上一次发布已近半年了。那么,多智能体究竟是 […]

AI助手App“腾讯元宝”已上线应用商店
AI助手App“腾讯元宝”已上线应用商店

 腾讯元宝已经上架应用宝、小米、华为、vivo、OPPO等应用商店,苹果App Store中尚未搜到该应用,还 […]

【AI代理】多代理模式之多任务分配&信息传递
【AI代理】多代理模式之多任务分配&信息传递

昨天探索了多任务模式,让系统根据用户的输入信息自动找到对应的代理进行处理。今天继续来探索多任务模式的多任务分配 […]

【AI代理】扣子,开始探索多代理模式
【AI代理】扣子,开始探索多代理模式

代理模式不仅可以拓展大模型的功能(比如给大模型加上网页搜索,加入知识库等),还可以规避大模型的弱点(比如需求是 […]

24年首篇离奇论文:加点噪声,RAG效果翻倍?!
24年首篇离奇论文:加点噪声,RAG效果翻倍?!

论文:《The Power of Noise: Redefining Retrieval for RAG Sy […]

AI绘画:InstantID 一键运行包和在线Colab脚本!
AI绘画:InstantID 一键运行包和在线Colab脚本!

InstantID是一个非常不错的AI绘画工具,一张图片,一键生成百变的自己。   除了配置运行难度搞一点之外 […]

中国大模型融资暗战:罗曼蒂克的快速消亡
中国大模型融资暗战:罗曼蒂克的快速消亡

一场资本暗战   这是一场融资的突变。 在持续了一年多的中国大模型鏖战中,由杨植麟创办的月之暗面,尽管是一个是 […]

用ComfyUI整了一套照片转Q版手办的工作流
用ComfyUI整了一套照片转Q版手办的工作流

年后开工准备用SD的工作流版本ComfyUI整点东西出来。之所以要搞这个,主要是因为它跟我目前要做的很多内容都 […]

为什么说腾讯22年前的这份神级PPT是立项汇报的天花板?
为什么说腾讯22年前的这份神级PPT是立项汇报的天花板?

古早的互联网时代其实有很多非常经典和厉害的内容,这些内容不会随着时间的推移和环境的变化而失去价值。就像这篇文章 […]

图解 Transformer——功能概览
图解 Transformer——功能概览

一、引言 随着大型语言模型如 ChatGPT 的横空出世,我们进入了自然语言处理(NLP)的一个新纪元。在这个 […]

最佳开源文生图大模型可图:安装与批量出图的完整教程
最佳开源文生图大模型可图:安装与批量出图的完整教程

Kolors可图是快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训 […]

ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型

身体姿态估计旨在识别出给定图像中人或者动物实例身体的关键点,除了典型的身体骨骼关键点,还可以包括手、脚、脸部等 […]

自己电脑上跑大语言模型(LLM)要多少内存?
自己电脑上跑大语言模型(LLM)要多少内存?

在本地电脑上运行大型语言模型(LLM),需要考虑的关键因素之一就是电脑的内存够不够。希望能通过这篇文章让各位有 […]


1 4 5 6 7 8 43