上期我们讲了利用基于语言到图像的生成网络的GLIGEN模型可以做到指哪打哪的生成。就又有猴急的comfy先驱栋 […]
有多种方法可以提高检索增强生成(RAG)的能力,其中一种方法称为查询扩展。我们这里主要介绍在Langchain […]
01 前言 Stable Cascade 模型最大的优点是 § 是能生成带有文字的图片,文字出错率相比以前模型 […]
本文是学术大佬资料整理得合集(共计86位),他们都是自然语言处理(NLP)方面得权威专家。如果你还在迷茫找不到 […]
OCRmyPDF向扫描的PDF文件添加了OCR文本层,使它们可以被搜索或复制粘贴。 · 1、ocrmypdf […]
附件是Sora相关论文合集,一共32套大放送,同时附上阅读这些论文相关的提示词,包括翻译、论文分析、文档阅读等 […]
要问当前AI大型语言模型界万众期待的一件事,以及各通用大模型厂商都在暗自铆足劲干的一件事,一定是追赶GPT-4 […]
本文讲解,模型底模,VAE美化模型,Lora模型,hypernetwork。 文本Stable Diffusi […]
1.精确的语言和词语选择:在与AI进行交互时,精确和明确的语言至关重要。AI模型,如ChatGPT自己,依赖于 […]
一.本文背景 本文是上一篇的姊妹篇,上文我们主要讲到了<提示词堆栈>这个优质的提示词网址,以及本文 […]
按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的 […]
没想到啊,开源大模型家族里,居然挤进来一位特别的选手: 来自央企,身份为运营商。 具体是谁? 中国电信。 所谓 […]
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现语音驱动唇部运动的! 本文来自ACM 202 […]
朋友们,字节跳动真的是爆款制造机,太卷了! 前面分享了小悟空、即创等字节系列AI创作平台,今天又给大家分享另一 […]
最近 animatediff 升级了 2.0 版本,相较于 1.0 版本呢,只能用一个字来形容,就是:秀。 这 […]
自 ChatGPT 在去年 11 月底横空出世,大模型的风刮了整一年。 历经了 自 ChatGPT 在去年 1 […]
ZEPHYR-7B 是新一代大型语言模型(LLMs)之一,它受到了 AI 社区的极大欢迎。该模型由 Huggi […]
【新版】chatglm3-6b一键部署+API! https://www.123pan.com/s/nX5VV […]
https://stability.ai/news/stable-diffusion-3 最近,Stable […]
大家好我是皮特,今天我们来聊一聊如何用AI生成整篇文章。 话不多说,直接上干货! 一、短内容 如果要写的内容比 […]
本文是对高级检索增强式生成技术(Retrieval Augmented Generation,简称 RAG)和 […]
一、我正在寻找与(XX主题)相关的高质量学术资源,包括期刊文章、会议论文和研究报告。希望能获取这些文献的摘要和 […]
ComfyUI Portrait Master 是一个用于生成人物肖像提示词的模块,旨在优化肖像生成过程。该项 […]
检索增强生成(RAG)模型已经成为一种有前景的方法,通过利用存储在文档中的外部知识来提高生成文本的准确性和相关 […]
距离我们 GPTs 攻防的上篇发布到现在已经过去了两周,也有很多的群友积极参与了我们的攻防活动,但是截止目前还 […]
图:by bing wallpaper 先说结论:Moonshot AI 公司构建的Kimi Chat。 […]
facebookresearch/audiocraft[1] Stars: 16.6k License: M […]
刚刚,谷歌杀入开源大模型。 开源领域大模型,迎来了重磅新玩家。 谷歌推出了全新的开源模型系列「Gemma」 […]
在【AI绘画神器】探索Stable Diffusion、Midjourney与DALL-E 3:让创意无限飞扬 […]
prompt原文: A whimsical children's book illustration show […]
上期我们讲了利用基于语言到图像的生成网络的GLIGEN模型可以做到指哪打哪的生成。就又有猴急的comfy先驱栋 […]