首页 > Ai资讯 > Ai知识库
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal

你想要了解audio2photoreal这个项目吗?这是一个由Facebook研究院开发的技术,可以根据音频生 […]

ChatGLM3在线搜索功能升级
ChatGLM3在线搜索功能升级

在前面的图文当ChatGLM3能用搜索引擎时中,我们让ChatGLM3在搜索引擎上进行的简单的搜索,但是仅仅只 […]

Mokker,想取代商业棚拍效果的场景生成AI
Mokker,想取代商业棚拍效果的场景生成AI

有别于其他的生成式工具,Mokker有她特别用心和擅长的地方,专注帮你更换合适的商品场景,如果有一张产品图了, […]

小白也可以一键安装的Stable Diffusion——Easy Diffusion
小白也可以一键安装的Stable Diffusion——Easy Diffusion

上图是老徐用的2G显存的N卡GPU设置的为low跑出来的效果 Easy  Diffusion 出来已经一段时间 […]

BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai

提纲 1 简介 2 BGE M3-Embedding     2.1 训练数据构建     2.2 混合检索 […]

GitHub狂飙3万star的LLM公开资料 – 大模型入门教程
GitHub狂飙3万star的LLM公开资料 – 大模型入门教程

先用一张图片说明这篇blog多火热! 本篇大型语言模型(LLM)课程分为三个部分: LLM基础:涵盖了数学、P […]

金融行业的开源AI大模型
金融行业的开源AI大模型

大家经常把通用大模型比喻为高考前的学生,智商似乎达到了巅峰,天文地理历史生物无所不知,但是对某个行业的真实运作 […]

AI探索-我怎么使用Kimi Chat的
AI探索-我怎么使用Kimi Chat的

除了ChatGPT以外,Kimi Chat算是我经常使用的一个AI工具了,他对长文本的处理个人感觉比Claud […]

鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验

大厂们在整活方面开始卷起来了! 前脚字节阿里的工具火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏 […]

用秋叶启动器安装fooocus,comfyui
用秋叶启动器安装fooocus,comfyui

今天秋叶大佬发布了comfyui整合包,我也马上转载到百度盘方便大家下载,还是老地方。 但是今天想讲的其实是用 […]

ChatGPT论文润色进阶指令
ChatGPT论文润色进阶指令

    GPT-4.0在使用体验上相较于GPT-3.5有显著提升,特别是在逻辑推理方面。GPT-3.5的一个特 […]

ComfyUI王牌!复合生成!必须揉在一起
ComfyUI王牌!复合生成!必须揉在一起

上期我们讲了利用基于语言到图像的生成网络的GLIGEN模型可以做到指哪打哪的生成。就又有猴急的comfy先驱栋 […]

Langchain中改进RAG能力的3种常用的扩展查询方法
Langchain中改进RAG能力的3种常用的扩展查询方法

有多种方法可以提高检索增强生成(RAG)的能力,其中一种方法称为查询扩展。我们这里主要介绍在Langchain […]

新模型Cascade你真的用对了吗?!
新模型Cascade你真的用对了吗?!

01 前言 Stable Cascade 模型最大的优点是 § 是能生成带有文字的图片,文字出错率相比以前模型 […]

全球学术界知名学者教授信息大盘点(全)
全球学术界知名学者教授信息大盘点(全)

本文是学术大佬资料整理得合集(共计86位),他们都是自然语言处理(NLP)方面得权威专家。如果你还在迷茫找不到 […]

OCRmyPDF—可智能识别PDF文本和图片信息的工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具

OCRmyPDF向扫描的PDF文件添加了OCR文本层,使它们可以被搜索或复制粘贴。 · 1、ocrmypdf  […]

Sora相关论文合集—全32套大放送
Sora相关论文合集—全32套大放送

附件是Sora相关论文合集,一共32套大放送,同时附上阅读这些论文相关的提示词,包括翻译、论文分析、文档阅读等 […]

2024,智谱如何更快?
2024,智谱如何更快?

要问当前AI大型语言模型界万众期待的一件事,以及各通用大模型厂商都在暗自铆足劲干的一件事,一定是追赶GPT-4 […]

AI绘画Stable Diffusion进阶使用
AI绘画Stable Diffusion进阶使用

本文讲解,模型底模,VAE美化模型,Lora模型,hypernetwork。 文本Stable Diffusi […]

AI提示词|一词千金,写提示词的这个技巧你一定没想到!(一)
AI提示词|一词千金,写提示词的这个技巧你一定没想到!(一)

1.精确的语言和词语选择:在与AI进行交互时,精确和明确的语言至关重要。AI模型,如ChatGPT自己,依赖于 […]

AI提示词|一词千金,写提示词的这个技巧你一定没想到!(二)
AI提示词|一词千金,写提示词的这个技巧你一定没想到!(二)

一.本文背景 本文是上一篇的姊妹篇,上文我们主要讲到了<提示词堆栈>这个优质的提示词网址,以及本文 […]

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言

按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的 […]

中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生

没想到啊,开源大模型家族里,居然挤进来一位特别的选手: 来自央企,身份为运营商。 具体是谁? 中国电信。 所谓 […]

解读wav2lip:探究语音驱动唇部动作的技术原理!
解读wav2lip:探究语音驱动唇部动作的技术原理!

本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现语音驱动唇部运动的! 本文来自ACM 202 […]

字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?

朋友们,字节跳动真的是爆款制造机,太卷了! 前面分享了小悟空、即创等字节系列AI创作平台,今天又给大家分享另一 […]

Animatediff V2 版本来了!就一个字:秀
Animatediff V2 版本来了!就一个字:秀

最近 animatediff 升级了 2.0 版本,相较于 1.0 版本呢,只能用一个字来形容,就是:秀。 这 […]

九问中国大模型掌门人,万字长文详解大模型进度趋势
九问中国大模型掌门人,万字长文详解大模型进度趋势

自 ChatGPT 在去年 11 月底横空出世,大模型的风刮了整一年。 历经了 自 ChatGPT 在去年 1 […]

更强的小型LLM:Zephyr-7B
更强的小型LLM:Zephyr-7B

ZEPHYR-7B 是新一代大型语言模型(LLMs)之一,它受到了 AI 社区的极大欢迎。该模型由 Huggi […]

傻瓜式!一键部署ChatGLM3,免去环境烦恼+开箱即用!集成API调用!本地化界面操作!
傻瓜式!一键部署ChatGLM3,免去环境烦恼+开箱即用!集成API调用!本地化界面操作!

【新版】chatglm3-6b一键部署+API! https://www.123pan.com/s/nX5VV […]

AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较

https://stability.ai/news/stable-diffusion-3 最近,Stable […]


1 33 34 35 36 37 43