首页 > Ai资讯
Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3
Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3

Google DeepMind 和 Isomorphic Labs 宣布开源 AlphaFold 3 的模型代 […]

京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语

在音频驱动的视频生成领域,制作普通话视频面临着许多挑战。首先,收集全面的普通话数据集非常困难;其次,普通话的复 […]

登顶的小熊猫模型出AI产品了!3步10秒出一张海报,可免费商用
登顶的小熊猫模型出AI产品了!3步10秒出一张海报,可免费商用

一款AI海报设计生成神器上新即爆火! 它叫“图形设计生成器”(Graphic Design Generator […]

HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人
HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人

HeyGen 正在开放API,通过 HeyGen API,企业能够使用生动的虚拟人视频提升平台的互动性,转化原 […]

Fashion-VDM:通过给定的服装图像和人物视频 生成一段虚拟试穿视频
Fashion-VDM:通过给定的服装图像和人物视频 生成一段虚拟试穿视频

Fashion-VDM 是一个基于扩散模型(Video Diffusion Model,VDM)的虚拟试衣视频 […]

对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互
对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互

Play AI推出了PlayDialog beta,专门用于创建更加自然、富有表现力和情感的对话式语音输出。 […]

OpenAI 官方发布: ChatGPT 学生写作指南 指导学生如何正确使用GPT
OpenAI 官方发布: ChatGPT 学生写作指南 指导学生如何正确使用GPT

引言 使用得当,ChatGPT 可以成为一个强大的工具,帮助学生培养严谨思维和清晰写作的技能,帮助他们思考想法 […]

我们需要的不是智能体,而是工作流(5000字保姆式教学)
我们需要的不是智能体,而是工作流(5000字保姆式教学)

思维融入工作流 科幻作家威廉·吉布森曾说过:"未来已经到来,只是尚未均匀分布。"这句话用来描述AI Agent […]

Thinking-Claude:让 Claude 实现类似OpenAI o1 模型一样的高级推理模式
Thinking-Claude:让 Claude 实现类似OpenAI o1 模型一样的高级推理模式

“Thinking-Claude” 为Claude 提供系统化的思维流程指导,从而使其在回答问题前进行更深入和 […]

天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈

整理 | 华卫、核子可乐 近日,有外媒报道称,OpenAI 正在制定新策略,以应对人工智能大模型改进速度放缓的 […]

苹果发布 Final Cut Pro 11 新增多项AI功能 自动抠图和自动生成字幕
苹果发布 Final Cut Pro 11 新增多项AI功能 自动抠图和自动生成字幕

苹果发布 Final Cut Pro 11,这次重大更新为专业视频编辑带来了先进的 AI 驱动功能、空间视频编 […]

MCI-GRU:在真实金融交易中验证有效的股票价格预测模型
MCI-GRU:在真实金融交易中验证有效的股票价格预测模型

一 本文概要 随着金融市场的日益复杂化和大数据时代的到来,精准的股票预测变得尤为关键。传统的时间序列模型,如门 […]

Context Autopilot:全球首个上下文引擎驱动的 AI 办公助手
Context Autopilot:全球首个上下文引擎驱动的 AI 办公助手

Context Autopilot 是由 Context 公司推出的一款 AI 办公助手,旨在通过先进的人工智 […]

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

如何设置 GLM-4-Voice 9B 以实现无缝的实时语音交互,支持英语和中文,并探索其独特的架构、低延迟响 […]

个人从零预训练1B LLM心路历程
个人从零预训练1B LLM心路历程

前言 项目开始于2024年3月初,当时朋友搞到了一台不知道能用多久的A100。这么棒的机器放着也是浪费,就琢磨 […]

小度为何押注AI眼镜?
小度为何押注AI眼镜?

注意看,这是一款最新发布的眼镜。 看起来平平无奇的它,却是个不折不扣的新物种。 因为它内置了AI。 戴上它,你 […]

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

这两天,我被这个Claude3.5这个神级Prompt惊呆了。 佩服的五体投地。 非常简单的话说,就是它用Pr […]

13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、 […]

摩尔线程冲刺IPO:国产GPU,英伟达中国一把手打造,估值已超255亿
摩尔线程冲刺IPO:国产GPU,英伟达中国一把手打造,估值已超255亿

国产GPU独角兽摩尔线程正式启动IPO! 官网显示,摩尔线程智能科技股份有限公司在北京证监局办理辅导备案登记, […]

AI+大模型在金融行业的应用场景
AI+大模型在金融行业的应用场景

AI技术之于现有金融行业的赋能是多领域、多环节的。从现有行业形态看,AI可赋能的金融领域包括营销(如精准营销、 […]

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!

今天给大家同时展示5款(Fish、F5、GPT、CosyVoice、MaskGCT)爆火的语音克隆-文本合成的 […]

ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定
ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定

ReadKidz 是一个专为儿童内容创作设计的 AI 驱动平台,提供一站式的儿童电子图画书和多媒体故事制作功能 […]

Fish Audio 发布语音到语音模型Fish Agent V0.1 3B 实现“即时”语音克隆
Fish Audio 发布语音到语音模型Fish Agent V0.1 3B 实现“即时”语音克隆

Fish Audio 发布高级语音处理模型Fish Agent V0.1 3B,它是一个语音到语音模型,它可以 […]

Rive 发布 Layouts 新功能 只需设计一次 图像动画自动适应屏幕大小和各种布局
Rive 发布 Layouts 新功能 只需设计一次 图像动画自动适应屏幕大小和各种布局

Rive 引入的新功能 Layouts 为设计师和开发者提供了一种方法,可以在各种设备上创建动态、响应式的动画 […]

 腾讯发布目前最大开源MoE模型:腾讯混元大模型(Hunyuan-Large) 具有 3890 亿参数
 腾讯发布目前最大开源MoE模型:腾讯混元大模型(Hunyuan-Large) 具有 3890 亿参数

腾讯发布开源 Mixture of Experts(MoE)模型:腾讯混元大模型(Hunyuan-Large) […]

腾讯发布3D开源模型:混元-3D 10秒即可生成高分辨率细3D模型
腾讯发布3D开源模型:混元-3D 10秒即可生成高分辨率细3D模型

腾讯推出的一体化 3D 生成框架:混元3D-1.0 ,支持从文本和图像生成 3D 内容,仅需 10 秒便可生成 […]

Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟

Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hert […]

LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐

引言 紧跟技术发展趋势,快速了解大模型最新动态。终于又有时间更新文章了,今天继续总结最近一周的研究动态,梳理了 […]

Recraft发布其最新图像生成模型:Recraft V3 可精确处理复杂长文本和手指等解剖学细节
Recraft发布其最新图像生成模型:Recraft V3 可精确处理复杂长文本和手指等解剖学细节

Recraft推出了其最新的图像生成模型——Recraft V3。通过引入设计语言思维,Recraft V3能 […]

Runway Act-One 使用教程 :仅通过单个视频和任意角色图像生成生动的表演动画
Runway Act-One 使用教程 :仅通过单个视频和任意角色图像生成生动的表演动画

Act-One 是 Runway 的 Gen-3 Alpha 版本中的一款创新视频生成工具,能够通过简单的操作 […]


1 2 3 4 129