Ai知识库 - 第 10 页 - 智汇宝库

首页 > Ai资讯 > Ai知识库

百川智能正式发布130亿参数通用大语言模型百川大模型（Baichuan-13B-Base）

百川智能正式发布130亿参数通用大语言模型百川大模型（Baichuan-13B-Base）

就在刚刚，王小川的开源大模型又有了新动作—— 百川智能，正式发布130亿参数通用大语言模型（Baichuan- […]

CLiB中文大模型能力评测榜单（持续更新）

CLiB中文大模型能力评测榜单（持续更新）

出自：https://zhuanlan.zhihu.com/p/634608422 目前已囊括19个大模型，覆 […]

ChatGPT Prompt提示词课程（斯坦福吴恩达 | OpenAl）指南篇极简笔记

ChatGPT Prompt提示词课程（斯坦福吴恩达 | OpenAl）指南篇极简笔记

对于大模型prompt的设计，近期斯坦福吴恩达伙同OpenAl出了一套视频教程（B站地址：https://ww […]

微调、训练大模型概念介绍及论文笔记：Tuning系列论文笔记

微调、训练大模型概念介绍及论文笔记：Tuning系列论文笔记

Tuning整体介绍微调（Fine-tunning）语言模型的参数需要一起参与梯度更新轻量微调（ligh […]

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

原文：https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比大 […]

玩转大模型必备：milvus向量数据库私有化安装部署及使用介绍

玩转大模型必备：milvus向量数据库私有化安装部署及使用介绍

1.安装目前官方提供单机模式、集群模式、离线模式三种安装方式，目前milvus都是基于docker 容器方 […]

如何用大语言模型构建一个知识问答系统

如何用大语言模型构建一个知识问答系统

需求描述打造特定领域知识(Domain-specific Knowledge) 问答系统，具体需求有： […]

LangChain + ChatGLM2-6B 搭建私域专属知识库

LangChain + ChatGLM2-6B 搭建私域专属知识库

ChatGLM2-6B 介绍 ChatGLM2-6B 在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基 […]

谈谈LLM在推荐域的渗透，探索推荐新范式

谈谈LLM在推荐域的渗透，探索推荐新范式

来源｜阿里开发者公众号https://developer.aliyun.com/article/1272112 […]

微调大型语言模型-核心思想和方法介绍

微调大型语言模型-核心思想和方法介绍

上下文学习和索引自 GPT-2（Radford 等人）和 GPT-3（Brown 等人）以来，我们已经看到在 […]

人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法

人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freez […]

LLM大模型推理输出生成方式总结

LLM大模型推理输出生成方式总结

Greedy Search 方式：每一时间步都选择概率最大的词。参数设置：do_sample = False […]

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

模型训练数据训练数据量模型参数量词表大小 LLaMA 以英语为主的拉丁语系，不包含中日韩文 1T/1. […]

垂直领域大模型的一些思考及开源模型汇总

垂直领域大模型的一些思考及开源模型汇总

写在前面大家好，我是刘聪NLP。对于ToC端来说，广大群众的口味已经被ChatGPT给养叼了，市场基本上被 […]

关于GPT-4在变笨，有人写了篇论文证实了这一点

关于GPT-4在变笨，有人写了篇论文证实了这一点

最近几个月一直都有关于OpenAI的两个传说，其一是ChatGPT的流量开始下滑，其二是GPT4“变笨”了。 […]

微调百川Baichuan-13B保姆式教程，手把手教你训练百亿大模型

微调百川Baichuan-13B保姆式教程，手把手教你训练百亿大模型

本文旨在帮助读者快速掌握使用Firefly项目微调Baichuan-13B模型，该教程同样适用于微调llama […]

Stable Diffusion使用Roop插件一键换脸教程

Stable Diffusion使用Roop插件一键换脸教程

一、前言先做个声明，下面图片都是AI工具生成，此技术不要做危害他人之事。在AI绘画的学习过程中，有不少人希 […]

手把手教你用 SD 生成文字形状的光线，用来做营销宣传图非常有效

手把手教你用 SD 生成文字形状的光线，用来做营销宣传图非常有效

昨天类似这种文字光效或者将文字合成在衣服上的图好像又火了，很多朋友在问怎么做，其实就是ControlNet的简 […]

大模型量化：什么是模型量化，如何进行模型量化

大模型量化：什么是模型量化，如何进行模型量化

What：什么是模型量化简单来说，模型量化（Model Quantization）就是通过某种方法将浮点模型 […]

最新最全的开源中文大语言模型列表

最新最全的开源中文大语言模型列表

本文Github地址：https://github.com/HqWu-HITCS/Awesome-Chines […]

如何免费打造自己的数字人主播：StableDiffusion插件SadTalker打造本地数字人主播

如何免费打造自己的数字人主播：StableDiffusion插件SadTalker打造本地数字人主播

Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型，它使用了一种叫做潜在扩散模 […]

StableDiffusion常用热门模型下载站点推荐（国内版）

StableDiffusion常用热门模型下载站点推荐（国内版）

第一个首推的是哩布哩布，网址是： https://www.liblibai.com/ 哩布哩布LiblibAI […]

Stable Diffusion的模型分类以及使用

Stable Diffusion的模型分类以及使用

在上一篇文章里我们列举了国内可以下载StableDiffusion模型的两个著名网站，那么小伙伴们下载下来模型 […]

喂饭级 AI’MWISE 启动器安装教程

喂饭级 AI’MWISE 启动器安装教程

一、下载启动器先根据百度云盘下载相对应自己系统版本的安装器 Aimwise启动器基于vladmandic版 […]

百模大战，谁是大模型的裁判员？

百模大战，谁是大模型的裁判员？

定义了树-邻接语法（TAG）的阿拉文德·乔西（Aravind Joshi）教授，曾提出过“如果没有基准来评估模 […]

来自Microsoft Build 2023：大语言模型是如何被训练出来的

来自Microsoft Build 2023：大语言模型是如何被训练出来的

在今年的Microsoft Build 2023大会上，来自OpenAI的研究员Andrej Karpathy […]

达摩院SPACE对话大模型：知识注入与知识利用

达摩院SPACE对话大模型：知识注入与知识利用

原文：https://www.toutiao.com/article/7160153099146297897/ […]

预训练对话大模型深度解读

预训练对话大模型深度解读

作者：轻口味链接：https://juejin.cn/post/7239393450906058810 1、 […]

StableDiffusion使用Roop插件一键换脸教程

StableDiffusion使用Roop插件一键换脸教程

一、前言先做个声明，下面图片都是AI工具生成，此技术不要做危害他人之事。在AI绘画的学习过程中，有不少人希 […]

实现聊天机器人打字机形式输出内容：SSE原理介绍及Post实现方式

实现聊天机器人打字机形式输出内容：SSE原理介绍及Post实现方式

一.SSE原理介绍 1、SSE基础概念 SSE(Server Sent Event)，直译为服务器发送事件，顾 […]

1 … 8 9 10 11 12 … 43