Ai日报 - 第 17 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

Follow-Your-Emoji：通过表情感知精细控制和生成动态表情丰富的肖像动画

Follow-Your-Emoji：通过表情感知精细控制和生成动态表情丰富的肖像动画

Follow-Your-Emoji 是一个基于扩散模型的头像动画生成框架。可以将参考头像（例如照片、卡通人物、 […]

Freepik Designer：一个在线 AI 图像编辑器几分钟内完成专业级别的图像设计

Freepik Designer：一个在线 AI 图像编辑器几分钟内完成专业级别的图像设计

想象一下，一个设计工具可以帮助你在几分钟内完成专业级别的设计，而无需复杂的操作或繁琐的学习曲线。无论你是设计新 […]

MotionFollower：将一个视频中的人物动作转移到另一个视频中的人物身上

MotionFollower：将一个视频中的人物动作转移到另一个视频中的人物身上

MotionFollower用来编辑视频中运动的新方法，它能将目标视频的运动信息转移到源视频上，同时保持源视频 […]

Chatwiz：一个非常丝滑的 AI 虚拟女朋友高度还原真实对话含提示词

Chatwiz：一个非常丝滑的 AI 虚拟女朋友高度还原真实对话含提示词

Chatwiz是一个AI 虚拟女朋友聊天机器人，包含6个角色，3位女性3位女性，对话非常的丝滑，非常接近真人对 […]

Nothing CEO 我们将进入一个后应用时代在未来将不再有应用程序

Nothing CEO 我们将进入一个后应用时代在未来将不再有应用程序

Nothing CEO @getpeid 分享了对AI手机、智能硬件的看法，并展示了他们最新的AI原型机。他 […]

StreamSpeech ：实时语言翻译模型可以实现流媒体语音输入的实时翻译

StreamSpeech ：实时语言翻译模型可以实现流媒体语音输入的实时翻译

StreamSpeech 是一个用于实时语言翻译的先进模型，旨在实现流媒体语音输入的实时翻译。用于在实时通信 […]

阿里云发布Qwen 2开源模型性能超越目前所有开源模型和国内闭源模型

阿里云发布Qwen 2开源模型性能超越目前所有开源模型和国内闭源模型

阿里云发布Qwen 2开源模型，性能超越目前所有开源模型和国内闭源模型 Qwen 2 模型涵盖多种尺寸，包 […]

快手发布“可灵”视频大模型类似Sora技术路线能生成超过120秒 1080P视频

快手发布“可灵”视频大模型类似Sora技术路线能生成超过120秒 1080P视频

快手最新发布的国产视频生成大模型“可灵”大模型，采用了类似Sora的技术路线，并结合了多项自研技术创新，能够生 […]

Seed-TTS：字节跳动开发的几乎完美接近人类语音的文本到语音（TTS）模型

Seed-TTS：字节跳动开发的几乎完美接近人类语音的文本到语音（TTS）模型

Seed-TTS 是由字节跳动开发的一种高级文本到语音（TTS）模型系列，能够生成高质量、几乎无法与人类语音区 […]

Mobile-Agent-v2：让AI可以像真人一样来操控你的手机执行各种任务

Mobile-Agent-v2：让AI可以像真人一样来操控你的手机执行各种任务

Mobile-Agent 是一个旨在帮助用户更高效地操作移动设备的项目。该项目通过多种技术手段，实现了对移动设 […]

教程：只需合适的提示词使用 ChatGPT 在 Blender 中创建3D场景

教程：只需合适的提示词使用 ChatGPT 在 Blender 中创建3D场景

在这篇教程中，我们将展示如何使用ChatGPT生成的Python脚本在Blender中创建3D场景。我们将以一 […]

Backseat AI：英雄联盟 AI 游戏伴侣通过语音为玩家提供实时的游戏评论和建议

Backseat AI：英雄联盟 AI 游戏伴侣通过语音为玩家提供实时的游戏评论和建议

Backseat AI 是一个免费的、Riot 批准的英雄联盟 AI 伴侣，在比赛过程中，通过语音为玩家提供实 […]

TimeUi：简化ComfyUI 动画编辑的时间线节点系统

TimeUi：简化ComfyUI 动画编辑的时间线节点系统

TimeUi 是一个用于 ComfyUi 的时间线节点系统，它的作用类似于视频或动画编辑工具中的时间线功能。用 […]

英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

6月2日，英伟达联合创始人兼首席执行官黄仁勋在Computex 2024（2024台北国际电脑展）上发表主题演 […]

Video-MME: 首个多模态大模型视频分析综合评估基准

Video-MME: 首个多模态大模型视频分析综合评估基准

Video-MME（Multi-Modal Evaluation benchmark）是首个专门为评估多模态大 […]

NVIDIA 发布全套数字人服务可根据音频自动生成数字人的身体、面部和姿势

NVIDIA 发布全套数字人服务可根据音频自动生成数字人的身体、面部和姿势

NVIDIA最近发布了一套名为NVIDIA ACE的生成式AI微服务，这些服务旨在加速数字人（虚拟人）的发展。 […]

教程：如何把自己变成吉卜力电影角色替换动画片中人物角色

教程：如何把自己变成吉卜力电影角色替换动画片中人物角色

把自己变成了吉卜力电影角色🤩。这非常简单，只需40分钟！按照以下步骤操作即可。使用Midjourney生成吉 […]

100 个 Midjourney 随机风格参考 Sref Codes库以及Sref Codes教程

100 个 Midjourney 随机风格参考 Sref Codes库以及Sref Codes教程

Sref Codes是什么？ Midjourney风格参考种子（srefs）是代表不同风格的独特标识符，通常称 […]

Omost：自动帮你完善提示词并生成符合你预期的图像

Omost：自动帮你完善提示词并生成符合你预期的图像

Omost 是一个使用大语言模型（LLM）生成图像的项目。它通过虚拟画布代理来合成图像，旨在将模型的代码能力转 […]

Spacetop：世界上首款 AR（增强现实）电脑 100 英寸大屏幕

Spacetop：世界上首款 AR（增强现实）电脑 100 英寸大屏幕

Spacetop 是一种革命性的笔记本电脑，它取消了传统的物理显示屏，取而代之的是使用 AR（增强现实）眼镜， […]

提高Transformer模型处理复杂算术任务的能力的方法

提高Transformer模型处理复杂算术任务的能力的方法

传统的transformer在处理长数字序列时，难以准确地跟踪和表示每个数字的位置，导致在进行多步骤和复杂运算 […]

Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互

Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互

Anthropic的Claude 3模型现在支持Tool use功能，可以与外部工具和API交互，执行各种任务 […]

AI和脑机接口帮助失语症患者恢复双语交流

AI和脑机接口帮助失语症患者恢复双语交流

加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物，研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]

Consistent Character：保持角色一致性的同时生成给定角色的不同姿势图像

Consistent Character：保持角色一致性的同时生成给定角色的不同姿势图像

Consistent Character 模型，结合多种技术实现角色的一致性图像生成，可以生成给定角色的不同姿 […]

ElevenLabs推出新的 AI 音频模型能够根据文本生成各种音效和声音

ElevenLabs推出新的 AI 音频模型能够根据文本生成各种音效和声音

ElevenLabs推出了一款新的AI音频模型，能够根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 […]

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

影眸团队推出了Rodin Gen-13D生成AI模型。这个模型可以在几十秒内通过文本生成高质量的3D模型，这些 […]

Jina AI Reader 工具能够从任意 URL 读取 PDF 文件并快速解析成文本

Jina AI Reader 工具能够从任意 URL 读取 PDF 文件并快速解析成文本

Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件，并快速解析成文本，供下游 […]

Sonic：基于状态空间模型的低延迟实时推理语音生成模型

Sonic：基于状态空间模型的低延迟实时推理语音生成模型

Sonic 是一个快速、超逼真的语音生成模型，专为实时互动语音而设计，基于下一代状态空间模型（State Sp […]

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

OpenAI推出了ChatGPT Edu，这是一个为大学设计的专用版本，旨在让学生、教职员工、研究人员和校园运 […]

Perplexity AI推出可以将你的答案一键生成博客、文章的工具：Perplexity Pages

Perplexity AI推出可以将你的答案一键生成博客、文章的工具：Perplexity Pages

Perplexity AI推出Perplexity Pages ，该工具可以帮助你把你搜到的答案自动转化为视觉 […]

1 … 15 16 17 18 19 … 32