首页 > Ai资讯 > Ai日报
Claude 3.5 新功能 支持对 100 页的PDF 图像、图表和图形进行可视化分析
Claude 3.5 新功能 支持对 100 页的PDF 图像、图表和图形进行可视化分析

Claude 3.5 Sonnet发布PDF图像预览新功能,允许用户分析长度不超过100页的PDF中的视觉内容 […]

In-Context LoRA:给图像生成模型增加“情节记忆力”和“角色一致性”的能力
In-Context LoRA:给图像生成模型增加“情节记忆力”和“角色一致性”的能力

In-Context LoRA是一种新方法,用于对文本到图像的生成模型(如扩散变换器,DiTs)进行微调,使其 […]

X-to-Voice:输入你的 Twitter 账号名称 自动生成能说话的个人资料头像
X-to-Voice:输入你的 Twitter 账号名称 自动生成能说话的个人资料头像

ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生 […]

OpenAI 高层 Reddit AMA 完整版
OpenAI 高层 Reddit AMA 完整版

OpenAI 高层 Reddit AMA 完整翻译 GPT-5 及即将推出的模型 GPT-5:今年没有发布 G […]

Google Gemini API 新增“搜索锚定”功能 利用 Google 搜索实时数据确保准确性
Google Gemini API 新增“搜索锚定”功能 利用 Google 搜索实时数据确保准确性

Google 宣布在其 Gemini API 和 Google AI Studio 中推出新功能“Google […]

Wonder Dynamics 推出可将传统视频片段自动转换为 3D 动画场景新技术——Wonder Animation
Wonder Dynamics 推出可将传统视频片段自动转换为 3D 动画场景新技术——Wonder Animation

Wonder Dynamics 推出了一项开创性的新技术——Wonder Animation,可以将传统视频片 […]

D-ID推出了两款新数字人工具 只需一分钟视频训练即可生成 支持复杂表现
D-ID推出了两款新数字人工具 只需一分钟视频训练即可生成 支持复杂表现

AI视频平台D-ID推出了两款新型数字人工具—Express和Premium+,专为内容创作设计,旨在让企业在 […]

Google DeepMind 公布其NotebookLM背后的创新音频生成技术 使 AI 能够生成更加自然的对话
Google DeepMind 公布其NotebookLM背后的创新音频生成技术 使 AI 能够生成更加自然的对话

DeepMind 公布其正在开发一套创新的音频生成技术细节,也就是NotebookLM背后使用的语音技术。使 […]

Ultralight-Digital-Human :支持在移动设备上实时运行的超轻量级数字人模型
Ultralight-Digital-Human :支持在移动设备上实时运行的超轻量级数字人模型

Ultralight-Digital-Human 是一个创新的开源项目,使得数字人在移动设备上的实时应用成为可 […]

NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程
NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程

NotebookLlama 是一套用于从 PDF 文件生成播客的引导式教程,结合了文本到语音(TTS)模型的应 […]

MaskGCT:零样本文本到语音(TTS)模型 支持跨语言配音、语音转换、情感控制等
MaskGCT:零样本文本到语音(TTS)模型 支持跨语言配音、语音转换、情感控制等

MaskGCT(Masked Generative Codec Transformer)是一种零样本文本到语音 […]

PersonaTalk:字节跳动开发出可精准给视频进行AI配音的模型 能保持口型同步、说话风格完美匹配
PersonaTalk:字节跳动开发出可精准给视频进行AI配音的模型 能保持口型同步、说话风格完美匹配

PersonaTalk 是由字节跳动开发的一种专为实现高保真和个性化视觉配音的技术框架,也就是专门用来给视频人 […]

Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力
Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力

长期记忆(LTM)是AI自进化的核心,它允许模型通过与环境的持续交互,累积并存储经验数据。这些数据可以在未来的 […]

Google 更新 MusicFX DJ 可以像DJ一样灵活控制音乐生成和编辑
Google 更新 MusicFX DJ 可以像DJ一样灵活控制音乐生成和编辑

Google DeepMind 发布了一项新的生成式 AI 技术,这项技术被应用在了 MusicFX DJ 和 […]

Cloudflare推出了一个新的开发工具:Workflows 大幅简化多步骤应用的构建
Cloudflare推出了一个新的开发工具:Workflows 大幅简化多步骤应用的构建

Cloudflare推出了一个新的开发工具:Workflows。的持久执行引擎,目前已进入公开测试阶段。这项工 […]

智谱 AI 这次是真的国际领先了 发布AutoGLM 一句话手机自动帮你点外卖、订酒店买东西
智谱 AI 这次是真的国际领先了 发布AutoGLM 一句话手机自动帮你点外卖、订酒店买东西

前天,Claude 才发布 Computer Use,让AI可以像人一样操控你的电脑来干活,已经很炸裂了。 这 […]

Midjourney 大更新:新增外部图像编辑器、图像重纹理功能 编辑图像更轻松
Midjourney 大更新:新增外部图像编辑器、图像重纹理功能 编辑图像更轻松

Midjourney 大更新   新增功能:外部图像编辑器、图像重纹理 图像编辑器:允许用户上传图像并进行扩展 […]

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑
Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Hai […]

Runway 推出一款生成式角色表演工具 可以把视频转换成任意风格虚拟角色动画 并且保持表情语音口型同步
Runway 推出一款生成式角色表演工具 可以把视频转换成任意风格虚拟角色动画 并且保持表情语音口型同步

Runway 推出的一款生成式角色表演工具,Act-One可以通过使用视频和语音输入生成逼真的角色表演,是一种 […]

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具 轻松编辑图像
Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具 轻松编辑图像

Ideogram发布 Ideogram Canvas ,这是是一个无限的创意画板,用于组织、生成、编辑和组合图 […]

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数
Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出最新开源视频生成模型 Mochi 1。 Mochi 1 采用了Asymmetric Diffu […]

美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附 开枪自杀身亡
美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附 开枪自杀身亡

14岁少年 Sewell Setzer III 在与一款名为 Character.AI 的聊天机器人进行长时间 […]

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音
ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新的AI语音生成工具:Voice Design ,用户可以通过描述文本提示创建个性 […]

微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI
微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

微软CEO Satya Nadella 伦敦巡讲 Satya Nadella 和 Jared Spataro […]

微软发布了10个全新的自主AI代理 可以处理客户查询的“人工智能员工”
微软发布了10个全新的自主AI代理 可以处理客户查询的“人工智能员工”

微软正在推出一种新的自主人工智能代理,也称为“虚拟员工”,这些AI代理能够执行多种业务任务,如处理客户查询、识 […]

Applicant AI:人工智能面试系统 通过AI视频聊天快速筛选求职简历
Applicant AI:人工智能面试系统 通过AI视频聊天快速筛选求职简历

Applicant AI 是一款由 Web3 Jobs 和 Remote OK 开发的基于AI的申请人跟踪系统 […]

Project Turntable:将2D矢量图像 像3D对象一样进行旋转 并自动补充缺失部分
Project Turntable:将2D矢量图像 像3D对象一样进行旋转 并自动补充缺失部分

在Adobe MAX 2024大会上,Adobe推出了一项创新AI工具Project Turntable,该工 […]

Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律
Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律

之前报道 Archetype AI 发布了一个创新的人工智能平台 —— Newton™,这是一个专门为理解物理 […]

Claude Financial Data Analyst :由 Claude 支持的可视化金融数据分析工具
Claude Financial Data Analyst :由 Claude 支持的可视化金融数据分析工具

Claude Financial Data Analyst 是一个结合了AI模型Claude和数据可视化技术的 […]

Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型
Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型

Meta Spirit LM 是Meta推出的一个开源的多模态语言模型,其设计目的是能够在语音和文本之间进行无 […]


1 2 3 4 31