首页 > Ai资讯 > Ai日报
Follow-Your-Emoji:通过表情感知 精细控制和生成动态表情丰富的肖像动画
Follow-Your-Emoji:通过表情感知 精细控制和生成动态表情丰富的肖像动画

Follow-Your-Emoji 是一个基于扩散模型的头像动画生成框架。可以将参考头像(例如照片、卡通人物、 […]

Freepik Designer:一个在线 AI 图像编辑器 几分钟内完成专业级别的图像设计
Freepik Designer:一个在线 AI 图像编辑器 几分钟内完成专业级别的图像设计

想象一下,一个设计工具可以帮助你在几分钟内完成专业级别的设计,而无需复杂的操作或繁琐的学习曲线。无论你是设计新 […]

MotionFollower:将一个视频中的人物动作转移到另一个视频中的人物身上
MotionFollower:将一个视频中的人物动作转移到另一个视频中的人物身上

MotionFollower用来编辑视频中运动的新方法,它能将目标视频的运动信息转移到源视频上,同时保持源视频 […]

Chatwiz:一个非常丝滑的 AI 虚拟女朋友 高度还原真实对话 含提示词
Chatwiz:一个非常丝滑的 AI 虚拟女朋友 高度还原真实对话 含提示词

Chatwiz是一个AI 虚拟女朋友聊天机器人,包含6个角色,3位女性3位女性,对话非常的丝滑,非常接近真人对 […]

Nothing CEO 我们将进入一个后应用时代 在未来将不再有应用程序
Nothing CEO 我们将进入一个后应用时代 在未来将不再有应用程序

Nothing CEO @getpeid 分享了对AI手机、智能硬件的看法,并展示了他们最新的AI原型机。 他 […]

StreamSpeech :实时语言翻译模型 可以实现流媒体语音输入的实时翻译
StreamSpeech :实时语言翻译模型 可以实现流媒体语音输入的实时翻译

StreamSpeech 是一个用于实时语言翻译的先进模型,旨在实现流媒体语音输入的实时翻译。 用于在实时通信 […]

阿里云发布Qwen 2开源模型 性能超越目前所有开源模型和国内闭源模型
阿里云发布Qwen 2开源模型 性能超越目前所有开源模型和国内闭源模型

阿里云发布Qwen 2开源模型,性能超越目前所有开源模型和国内闭源模型   Qwen 2 模型涵盖多种尺寸,包 […]

快手发布“可灵”视频大模型 类似Sora技术路线 能生成超过120秒 1080P视频
快手发布“可灵”视频大模型 类似Sora技术路线 能生成超过120秒 1080P视频

快手最新发布的国产视频生成大模型“可灵”大模型,采用了类似Sora的技术路线,并结合了多项自研技术创新,能够生 […]

Seed-TTS:字节跳动开发的几乎完美接近人类语音的文本到语音(TTS)模型
Seed-TTS:字节跳动开发的几乎完美接近人类语音的文本到语音(TTS)模型

Seed-TTS 是由字节跳动开发的一种高级文本到语音(TTS)模型系列,能够生成高质量、几乎无法与人类语音区 […]

Mobile-Agent-v2:让AI可以像真人一样来操控你的手机执行各种任务
Mobile-Agent-v2:让AI可以像真人一样来操控你的手机执行各种任务

Mobile-Agent 是一个旨在帮助用户更高效地操作移动设备的项目。该项目通过多种技术手段,实现了对移动设 […]

教程:只需合适的提示词 使用 ChatGPT 在 Blender 中创建3D场景
教程:只需合适的提示词 使用 ChatGPT 在 Blender 中创建3D场景

在这篇教程中,我们将展示如何使用ChatGPT生成的Python脚本在Blender中创建3D场景。我们将以一 […]

Backseat AI:英雄联盟 AI 游戏伴侣 通过语音为玩家提供实时的游戏评论和建议
Backseat AI:英雄联盟 AI 游戏伴侣 通过语音为玩家提供实时的游戏评论和建议

Backseat AI 是一个免费的、Riot 批准的英雄联盟 AI 伴侣,在比赛过程中,通过语音为玩家提供实 […]

TimeUi:简化ComfyUI 动画编辑的时间线节点系统
TimeUi:简化ComfyUI 动画编辑的时间线节点系统

TimeUi 是一个用于 ComfyUi 的时间线节点系统,它的作用类似于视频或动画编辑工具中的时间线功能。用 […]

英伟达黄仁勋 Computex 2024 演讲全文及精华介绍
英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

6月2日,英伟达联合创始人兼首席执行官黄仁勋在Computex 2024(2024台北国际电脑展)上发表主题演 […]

Video-MME: 首个多模态大模型视频分析综合评估基准
Video-MME: 首个多模态大模型视频分析综合评估基准

Video-MME(Multi-Modal Evaluation benchmark)是首个专门为评估多模态大 […]

NVIDIA 发布全套数字人服务 可根据音频自动生成数字人的身体、面部和姿势
NVIDIA 发布全套数字人服务 可根据音频自动生成数字人的身体、面部和姿势

NVIDIA最近发布了一套名为NVIDIA ACE的生成式AI微服务,这些服务旨在加速数字人(虚拟人)的发展。 […]

教程:如何把自己变成吉卜力电影角色 替换动画片中人物角色
教程:如何把自己变成吉卜力电影角色 替换动画片中人物角色

把自己变成了吉卜力电影角色🤩。这非常简单,只需40分钟!按照以下步骤操作即可。 使用Midjourney生成吉 […]

100 个 Midjourney 随机风格参考 Sref Codes库 以及Sref Codes教程
100 个 Midjourney 随机风格参考 Sref Codes库 以及Sref Codes教程

Sref Codes是什么? Midjourney风格参考种子(srefs)是代表不同风格的独特标识符,通常称 […]

Omost:自动帮你完善提示词并生成符合你预期的图像
Omost:自动帮你完善提示词并生成符合你预期的图像

Omost 是一个使用大语言模型(LLM)生成图像的项目。它通过虚拟画布代理来合成图像,旨在将模型的代码能力转 […]

Spacetop:世界上首款 AR(增强现实) 电脑 100 英寸大屏幕
Spacetop:世界上首款 AR(增强现实) 电脑 100 英寸大屏幕

Spacetop 是一种革命性的笔记本电脑,它取消了传统的物理显示屏,取而代之的是使用 AR(增强现实)眼镜, […]

提高Transformer模型处理复杂算术任务的能力的方法
提高Transformer模型处理复杂算术任务的能力的方法

传统的transformer在处理长数字序列时,难以准确地跟踪和表示每个数字的位置,导致在进行多步骤和复杂运算 […]

Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互
Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互

Anthropic的Claude 3模型现在支持Tool use功能,可以与外部工具和API交互,执行各种任务 […]

AI和脑机接口帮助失语症患者恢复双语交流
AI和脑机接口帮助失语症患者恢复双语交流

加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]

Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像
Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像

Consistent Character 模型,结合多种技术实现角色的一致性图像生成,可以生成给定角色的不同姿 […]

ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

ElevenLabs推出了一款新的AI音频模型,能够根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 […]

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布
接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

影眸团队推出了Rodin Gen-13D生成AI模型。这个模型可以在几十秒内通过文本生成高质量的3D模型,这些 […]

Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本
Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本

Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游 […]

Sonic:基于状态空间模型的低延迟实时推理语音生成模型
Sonic:基于状态空间模型的低延迟实时推理语音生成模型

Sonic 是一个快速、超逼真的语音生成模型,专为实时互动语音而设计,基于下一代状态空间模型(State Sp […]

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本
OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

OpenAI推出了ChatGPT Edu,这是一个为大学设计的专用版本,旨在让学生、教职员工、研究人员和校园运 […]

Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages
Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages

Perplexity AI推出Perplexity Pages ,该工具可以帮助你把你搜到的答案自动转化为视觉 […]


1 15 16 17 18 19 32