首页 > Ai资讯
LLM应用架构之检索增强(RAG)的缘起与架构介绍
LLM应用架构之检索增强(RAG)的缘起与架构介绍

当前,随着大模型应用落地需求不断增加,越来越多的人在寻找搭建LLM应用的最佳模式,而这种模式就如同当年web开 […]

快手大模型出炉!【快意】来袭!
快手大模型出炉!【快意】来袭!

「快意」大模型(KwaiYii) 是由快手AI团队从零到一独立自主研发的一系列大规模语言模型(Large La […]

没有思考过 Embedding,不足以谈 AI
没有思考过 Embedding,不足以谈 AI

和大部分人一样,我对自然语言处理和语言模型的了解从ChatGPT开始。 和大部分人一样,第一次接触就被Chat […]

基于LLM+向量库的文档对话痛点及解决方案
基于LLM+向量库的文档对话痛点及解决方案

痛点:文档切分粒度不好把控,既担心噪声太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具, […]

万字长文,AI大模型的应用实践总结
万字长文,AI大模型的应用实践总结

导读以ChatGPT为代表的大模型悄然加速了时代的变革,你是否对此感到举手无措呢。本文详细整理了探索大模型相关 […]

清华系17人,撑起中国大模型创业半壁江山
清华系17人,撑起中国大模型创业半壁江山

智东西8月23日报道,过去三个月,生成式AI浪潮变数丛生,国内AI大模型产业也连爆大事:6月29日美团宣布完成 […]

【大模型微调】 Llama 2 :对话模型的全过程微调
【大模型微调】 Llama 2 :对话模型的全过程微调

该项工作的作者提出 Llama 2 模型:这是经过一系列 预训练和微调的大语言模型 (LLM),其参数规模从 […]

阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设

通义千问开源第二波!8月25日消息,阿里云推出大规模视觉语言模型Qwen-VL,一步到位、直接开源。Qwen- […]

大模型+人形机器人,是不是下一个风口?
大模型+人形机器人,是不是下一个风口?

随着ChatGPT以前所未有的速度火出圈,大模型也迅速从过去的遥不可及走到了我们身边。从今天开始,元碳院将开始 […]

LLM微调神器Lamini,疯狂获星1.9k,免费可用!!
LLM微调神器Lamini,疯狂获星1.9k,免费可用!!

LLM(大规模语言模型)的微调不再困难!!我们都知道,大模型在某些特定的垂直场景,效果不是那么好,很多企业/个 […]

FaceSwapLab,截止2023年8月最好用的一键换脸工具
FaceSwapLab,截止2023年8月最好用的一键换脸工具

几周前,我介绍了基于stable diffsion的一个换脸插件:roop(这个插件也有独立版,功能更多,甚至 […]

大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!
大规模中文开源数据集发布!2TB、几十亿条可商用的中文数据集书生·万卷 1.0开源~中文大模型能力可能要更上一层楼了!

随着近年来GPT-3、ChatGPT等大模型的兴起,高质量的数据集在模型训练中扮演着越来越重要的角色。但是当前 […]

如何避免大语言模型绕过知识库乱答的情况?LlamaIndex 原理与应用简介
如何避免大语言模型绕过知识库乱答的情况?LlamaIndex 原理与应用简介

随着 LangChain + LLM 方案快速普及,知识问答类应用的开发变得容易,但是面对回答准确度要求较高的 […]

它来了!SDXL + ControlNet 终于强强联合!
它来了!SDXL + ControlNet 终于强强联合!

一、ControlNet 简介 SDXL 1.0 发布已经过去20多天,终于迎来了首批能够应用于 SDXL 的 […]

从⼤模型到 AI 应⽤落地,工程实现有多复杂?
从⼤模型到 AI 应⽤落地,工程实现有多复杂?

众所周知,⼤模型代表了⼈⼯智能技术的前沿发展。它以强⼤的语⾔理解和⽣成能⼒,正在重塑许多领域。但是从获得⼤模型 […]

AI Agent:大模型与场景间的价值之桥,但不适合当纯技术看
AI Agent:大模型与场景间的价值之桥,但不适合当纯技术看

在开源大模型LLaMA 2会扮演类似Android的角色么?一文中曾经提到:大模型落地的方式是系统型超级应用。 […]

Giraffe:世界上第一个商业可用的32K长上下文开源LLM(基于Llama-2)
Giraffe:世界上第一个商业可用的32K长上下文开源LLM(基于Llama-2)

项目简介 选择如何对 Transformer 的位置信息进行编码一直是 LLM 架构的关键组成部分之一。 最近 […]

[中文开源震撼首发]33B QLoRA大语言模型Anima真的太强大了!QLoRA技术可能是AI转折点!
[中文开源震撼首发]33B QLoRA大语言模型Anima真的太强大了!QLoRA技术可能是AI转折点!

我们开源了第一个中文QLoRA 33B大语言模型——Anima。按照我们的评测,Anima模型的性能超越了对比 […]

深度对比丨探索LLM(大模型)部署服务的七大框架差异
深度对比丨探索LLM(大模型)部署服务的七大框架差异

本文旨在比较用于 LLM 推理和服务的不同开源库。我们将通过实际部署示例探讨它们的核心特性和优缺点。研究 vL […]

大模型LLM基础|分词
大模型LLM基础|分词

分词是NLP中的关键预处理步骤之一,用于将文本分解为词或子词的组合,使机器更好地理解和分析文本。 1. 规则分 […]

大模型下半场,关于Agent的几个疑问
大模型下半场,关于Agent的几个疑问

大模型的下半场,迎接寒武纪的Agent大爆发。5.4亿至3.6亿年前,海洋生物破发,相比于以前的单细胞或简单多 […]

中国大模型「顶流群聊」笔记
中国大模型「顶流群聊」笔记

国内的科技创新历史上,从没有哪一次像大模型技术这样,短短几个月就建立了「科技圈共识」。 我 1998 年入行科 […]

11个非常简短却十分神奇的 ChatGPT 指令,刷新你的认知
11个非常简短却十分神奇的 ChatGPT 指令,刷新你的认知

人工智能日益成为我们工作和生活的一部分。ChatGPT 作为人工智能的代表性工具,它的有效性取决于人们使用它的 […]

2023年LLM如何入门?请看这篇综述!
2023年LLM如何入门?请看这篇综述!

一、引言与摘要 Q:这些年,我们在做什么? A:自从图灵测试在1950年代提出以来,人类一直在探索如何让机器掌 […]

Stable Diffusion  ControlNet:Reference“垫图”功能,不炼丹也能保持同一人物
Stable Diffusion ControlNet:Reference“垫图”功能,不炼丹也能保持同一人物

ControlNet推出Reference(参考)控制类型也有一段时间了,最近体验了一下,被他的强大的效果震惊 […]

Stable Diffusion XL 1.0 出图风格鉴赏
Stable Diffusion XL 1.0 出图风格鉴赏

SDXL1.0 能支持不同的艺术风格。 这一节我们趁热来看看不同风格下 SDXL 的表现效果 参数介绍 模型: […]

14.4K Star,一款漂亮、快速、现代化的开源免费UI组件库
14.4K Star,一款漂亮、快速、现代化的开源免费UI组件库

今天继续给大家推荐一个广受好评的UI组件库:NextUI NextUI 主要特性 NextUI的主要目标是简化 […]

Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney

近日,Meta公司宣布开发出一款名为CM3Leon的文生图模型,该模型能够独力解决文本到图像和图像到文本的双向 […]

摆脱 OpenAI 依赖,8 分钟教你用开源生态构建全栈 AI 应用
摆脱 OpenAI 依赖,8 分钟教你用开源生态构建全栈 AI 应用

大模型时代的到来使得 AI 应用开发变得更加轻松、省时,尤其是在 CVP Stack 的范式下,开发者甚至可以 […]

冲击传统模特,商汤发布高质量虚拟试衣Diffusion模型
冲击传统模特,商汤发布高质量虚拟试衣Diffusion模型

“ Taming the Power of Diffusion Models for High-Quality […]


1 32 33 34 35 36 129