首页 > Ai资讯 > Ai知识库
百川智能正式发布130亿参数通用大语言模型百川大模型(Baichuan-13B-Base)
百川智能正式发布130亿参数通用大语言模型百川大模型(Baichuan-13B-Base)

就在刚刚,王小川的开源大模型又有了新动作—— 百川智能,正式发布130亿参数通用大语言模型(Baichuan- […]

CLiB中文大模型能力评测榜单(持续更新)
CLiB中文大模型能力评测榜单(持续更新)

出自:https://zhuanlan.zhihu.com/p/634608422 目前已囊括19个大模型,覆 […]

ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记

对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套视频教程(B站地址:https://ww […]

微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记

Tuning整体介绍 微调(Fine-tunning) 语言模型的参数需要一起参与梯度更新 轻量微调(ligh […]

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

原文:https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比 大 […]

玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍

1.安装 目前官方提供 单机模式、集群模式、离线模式三种安装方式,目前milvus都是基于docker 容器方 […]

如何用大语言模型构建一个知识问答系统
如何用大语言模型构建一个知识问答系统

需求描述 打造 特定领域知识(Domain-specific Knowledge) 问答 系统,具体需求有: […]

LangChain + ChatGLM2-6B 搭建私域专属知识库
LangChain + ChatGLM2-6B 搭建私域专属知识库

ChatGLM2-6B 介绍 ChatGLM2-6B 在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基 […]

谈谈LLM在推荐域的渗透,探索推荐新范式
谈谈LLM在推荐域的渗透,探索推荐新范式

来源|阿里开发者公众号https://developer.aliyun.com/article/1272112 […]

微调大型语言模型-核心思想和方法介绍
微调大型语言模型-核心思想和方法介绍

上下文学习和索引 自 GPT-2(Radford 等人)和 GPT-3(Brown 等人)以来,我们已经看到在 […]

人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法
人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法

人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freez […]

LLM大模型推理输出生成方式总结
LLM大模型推理输出生成方式总结

Greedy Search 方式:每一时间步都选择概率最大的词。 参数设置:do_sample = False […]

大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>

模型 训练数据 训练数据量 模型参数量 词表大小 LLaMA 以英语为主的拉丁语系,不包含中日韩文 1T/1. […]

垂直领域大模型的一些思考及开源模型汇总
垂直领域大模型的一些思考及开源模型汇总

写在前面 大家好,我是刘聪NLP。 对于ToC端来说,广大群众的口味已经被ChatGPT给养叼了,市场基本上被 […]

关于GPT-4在变笨,有人写了篇论文证实了这一点
关于GPT-4在变笨,有人写了篇论文证实了这一点

最近几个月一直都有关于OpenAI的两个传说,其一是ChatGPT的流量开始下滑,其二是GPT4“变笨”了。 […]

微调百川Baichuan-13B保姆式教程,手把手教你训练百亿大模型
微调百川Baichuan-13B保姆式教程,手把手教你训练百亿大模型

本文旨在帮助读者快速掌握使用Firefly项目微调Baichuan-13B模型,该教程同样适用于微调llama […]

Stable Diffusion使用Roop插件一键换脸教程
Stable Diffusion使用Roop插件一键换脸教程

一、前言 先做个声明,下面图片都是AI工具生成,此技术不要做危害他人之事。 在AI绘画的学习过程中,有不少人希 […]

手把手教你用 SD 生成文字形状的光线,用来做营销宣传图非常有效
手把手教你用 SD 生成文字形状的光线,用来做营销宣传图非常有效

昨天类似这种文字光效或者将文字合成在衣服上的图好像又火了,很多朋友在问怎么做,其实就是ControlNet的简 […]

大模型量化:什么是模型量化,如何进行模型量化
大模型量化:什么是模型量化,如何进行模型量化

What:什么是模型量化 简单来说,模型量化(Model Quantization)就是通过某种方法将浮点模型 […]

最新最全的开源中文大语言模型列表
最新最全的开源中文大语言模型列表

本文Github地址:https://github.com/HqWu-HITCS/Awesome-Chines […]

如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播

Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模 […]

StableDiffusion常用热门模型下载站点推荐(国内版)
StableDiffusion常用热门模型下载站点推荐(国内版)

第一个首推的是哩布哩布,网址是: https://www.liblibai.com/ 哩布哩布LiblibAI […]

Stable Diffusion的模型分类以及使用
Stable Diffusion的模型分类以及使用

在上一篇文章里我们列举了国内可以下载StableDiffusion模型的两个著名网站,那么小伙伴们下载下来模型 […]

喂饭级 AI’MWISE 启动器安装教程
喂饭级 AI’MWISE 启动器安装教程

一、下载启动器 先根据百度云盘下载相对应自己系统版本的安装器 Aimwise启动器 基于vladmandic版 […]

百模大战,谁是大模型的裁判员?
百模大战,谁是大模型的裁判员?

定义了树-邻接语法(TAG)的阿拉文德·乔西(Aravind Joshi)教授,曾提出过“如果没有基准来评估模 […]

来自Microsoft Build 2023:大语言模型是如何被训练出来的
来自Microsoft Build 2023:大语言模型是如何被训练出来的

在今年的Microsoft Build 2023大会上,来自OpenAI的研究员Andrej Karpathy […]

达摩院SPACE对话大模型:知识注入与知识利用
达摩院SPACE对话大模型:知识注入与知识利用

原文:https://www.toutiao.com/article/7160153099146297897/ […]

预训练对话大模型深度解读
预训练对话大模型深度解读

作者:轻口味 链接:https://juejin.cn/post/7239393450906058810 1、 […]

StableDiffusion使用Roop插件一键换脸教程
StableDiffusion使用Roop插件一键换脸教程

一、前言 先做个声明,下面图片都是AI工具生成,此技术不要做危害他人之事。 在AI绘画的学习过程中,有不少人希 […]

实现聊天机器人打字机形式输出内容:SSE原理介绍及Post实现方式
实现聊天机器人打字机形式输出内容:SSE原理介绍及Post实现方式

一.SSE原理介绍 1、SSE基础概念 SSE(Server Sent Event),直译为服务器发送事件,顾 […]


1 8 9 10 11 12 43