首页 > Ai资讯 > Ai知识库
大模型天才杨植麟,被朱啸虎“咬”了一口
大模型天才杨植麟,被朱啸虎“咬”了一口

“人红是非多”,明星大模型独角兽月之暗面又“摊上事”了。 据暗涌报道,Kimi背后公司月之暗面的创始人& […]

Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI

Ilya终于承认,自己关于Scaling的说法错了!现在训练模型已经不是「越大越好」,而是找出Scaling的 […]

一文彻底搞懂多模态 – 多模态推理
一文彻底搞懂多模态 – 多模态推理

多模态推理多模态推理涉及至少两种不同的感知模态,最常见的是视觉和语言。这两种模态的信息可以是图片和文本、视频和 […]

PymuPDF4llm:PDF 提取的革命
PymuPDF4llm:PDF 提取的革命

PDF 文件作为一种广泛使用的文档格式,包含着大量有价值的信息。然而,从 PDF 中高效、准确地提取信息一直是 […]

Westlake – Omni:西湖心辰推出的全球首个开源的中文情感端 – 端语音交互大模型
Westlake – Omni:西湖心辰推出的全球首个开源的中文情感端 – 端语音交互大模型

在当今数字化时代,人工智能技术正以前所未有的速度发展,深刻地改变着我们的生活和工作方式。语音交互作为人机交互的 […]

字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器

随着数字人技术的发展,生成高度逼真的「3D说话头像」(3D Talking Face)成为了一种趋势。这不仅对 […]

京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语

在音频驱动的视频生成领域,制作普通话视频面临着许多挑战。首先,收集全面的普通话数据集非常困难;其次,普通话的复 […]

登顶的小熊猫模型出AI产品了!3步10秒出一张海报,可免费商用
登顶的小熊猫模型出AI产品了!3步10秒出一张海报,可免费商用

一款AI海报设计生成神器上新即爆火! 它叫“图形设计生成器”(Graphic Design Generator […]

我们需要的不是智能体,而是工作流(5000字保姆式教学)
我们需要的不是智能体,而是工作流(5000字保姆式教学)

思维融入工作流 科幻作家威廉·吉布森曾说过:"未来已经到来,只是尚未均匀分布。"这句话用来描述AI Agent […]

天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈

整理 | 华卫、核子可乐 近日,有外媒报道称,OpenAI 正在制定新策略,以应对人工智能大模型改进速度放缓的 […]

MCI-GRU:在真实金融交易中验证有效的股票价格预测模型
MCI-GRU:在真实金融交易中验证有效的股票价格预测模型

一 本文概要 随着金融市场的日益复杂化和大数据时代的到来,精准的股票预测变得尤为关键。传统的时间序列模型,如门 […]

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

如何设置 GLM-4-Voice 9B 以实现无缝的实时语音交互,支持英语和中文,并探索其独特的架构、低延迟响 […]

个人从零预训练1B LLM心路历程
个人从零预训练1B LLM心路历程

前言 项目开始于2024年3月初,当时朋友搞到了一台不知道能用多久的A100。这么棒的机器放着也是浪费,就琢磨 […]

小度为何押注AI眼镜?
小度为何押注AI眼镜?

注意看,这是一款最新发布的眼镜。 看起来平平无奇的它,却是个不折不扣的新物种。 因为它内置了AI。 戴上它,你 […]

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

这两天,我被这个Claude3.5这个神级Prompt惊呆了。 佩服的五体投地。 非常简单的话说,就是它用Pr […]

13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、 […]

AI+大模型在金融行业的应用场景
AI+大模型在金融行业的应用场景

AI技术之于现有金融行业的赋能是多领域、多环节的。从现有行业形态看,AI可赋能的金融领域包括营销(如精准营销、 […]

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!

今天给大家同时展示5款(Fish、F5、GPT、CosyVoice、MaskGCT)爆火的语音克隆-文本合成的 […]

LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐

引言 紧跟技术发展趋势,快速了解大模型最新动态。终于又有时间更新文章了,今天继续总结最近一周的研究动态,梳理了 […]

字节,悄咪咪做了个 Liblib
字节,悄咪咪做了个 Liblib

三个月前,「LiblibAI 哩布哩布 AI」,一个 AI 模型社区型产品,在一年内完成了三轮共计数亿元的融资 […]

MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型

01前言 近日,香港中文大学(深圳)联手趣丸科技推出了新一代大规模声音克隆TTS模型——MaskGCT。该模型 […]

比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?

字节跳动最近推出了一款名为PersonaTalk的AI模型,这项黑科技让视频配音彻底摆脱了传统的“僵硬感”。只 […]

神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的

一夜之间,名为“red_panda”(小熊猫)的神秘文生图模型狠狠火了!! 登顶文生图竞技场,直接将Flux、 […]

鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此

把微信公众号优质内容变成自己的专属知识库,只差这一个AI助手! 鹅厂悄悄上线的ima copilot,可以说把 […]

LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)

在前面文章《应用编排的未来是Pipeline,LlamaIndex开发预览版推出Query Pipeline, […]

独家!黄太吉创始人再创业:首次披露惨败内幕
独家!黄太吉创始人再创业:首次披露惨败内幕

31岁那年,东北人赫畅创办了餐饮品牌“黄太吉”,卖北方最常见的杂粮煎饼。当时,中国智能手机用户突破2亿,手机上 […]

了解Kimi必看的26个问题 | Kimi系列文(二)
了解Kimi必看的26个问题 | Kimi系列文(二)

大家好,这是《Kimi使用,从入门到精通》系列文章的第二篇。在上一篇中,我们带大家系统认识了AI。了解到,目前 […]

技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评

在SD中有很多人物换脸的新技术,比如像之前的Roop还有ReActor,它们都可以实现仅凭一张图进行人物换脸, […]

必看!阿里通义千问完整技术报告
必看!阿里通义千问完整技术报告

摘要 大型语言模型(LLMs)已经彻底改变了人工智能领域,使得以前被认为是人类专属的自然语言处理任务成为实现可 […]

Stable Diffusion基础:ControlNet之身份标识
Stable Diffusion基础:ControlNet之身份标识

本文给大家分享一个新的ControlNet类型:Instant ID,翻译为身份标识,核心能力是由国内的小红书 […]


1 2 3 43