Ai日报 - 第 3 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

Midjourney 大更新：新增外部图像编辑器、图像重纹理功能编辑图像更轻松

Midjourney 大更新：新增外部图像编辑器、图像重纹理功能编辑图像更轻松

Midjourney 大更新新增功能：外部图像编辑器、图像重纹理图像编辑器：允许用户上传图像并进行扩展 […]

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Hai […]

Runway 推出一款生成式角色表演工具可以把视频转换成任意风格虚拟角色动画并且保持表情语音口型同步

Runway 推出一款生成式角色表演工具可以把视频转换成任意风格虚拟角色动画并且保持表情语音口型同步

Runway 推出的一款生成式角色表演工具，Act-One可以通过使用视频和语音输入生成逼真的角色表演，是一种 […]

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具轻松编辑图像

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具轻松编辑图像

Ideogram发布 Ideogram Canvas ，这是是一个无限的创意画板，用于组织、生成、编辑和组合图 […]

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出最新开源视频生成模型 Mochi 1。 Mochi 1 采用了Asymmetric Diffu […]

美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附开枪自杀身亡

美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附开枪自杀身亡

14岁少年 Sewell Setzer III 在与一款名为 Character.AI 的聊天机器人进行长时间 […]

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新的AI语音生成工具：Voice Design ，用户可以通过描述文本提示创建个性 […]

微软CEO Satya Nadella ：计算能力现在每 6 个月翻一番微软正在使用 AI 构建 AI

微软CEO Satya Nadella ：计算能力现在每 6 个月翻一番微软正在使用 AI 构建 AI

微软CEO Satya Nadella 伦敦巡讲 Satya Nadella 和 Jared Spataro […]

微软发布了10个全新的自主AI代理可以处理客户查询的“人工智能员工”

微软发布了10个全新的自主AI代理可以处理客户查询的“人工智能员工”

微软正在推出一种新的自主人工智能代理，也称为“虚拟员工”，这些AI代理能够执行多种业务任务，如处理客户查询、识 […]

Applicant AI：人工智能面试系统通过AI视频聊天快速筛选求职简历

Applicant AI：人工智能面试系统通过AI视频聊天快速筛选求职简历

Applicant AI 是一款由 Web3 Jobs 和 Remote OK 开发的基于AI的申请人跟踪系统 […]

Project Turntable：将2D矢量图像像3D对象一样进行旋转并自动补充缺失部分

Project Turntable：将2D矢量图像像3D对象一样进行旋转并自动补充缺失部分

在Adobe MAX 2024大会上，Adobe推出了一项创新AI工具Project Turntable，该工 […]

Newton AI 模型：通过输入传感器数据模型可以分析数据自行发现物理规律

Newton AI 模型：通过输入传感器数据模型可以分析数据自行发现物理规律

之前报道 Archetype AI 发布了一个创新的人工智能平台 —— Newton™，这是一个专门为理解物理 […]

Claude Financial Data Analyst ：由 Claude 支持的可视化金融数据分析工具

Claude Financial Data Analyst ：由 Claude 支持的可视化金融数据分析工具

Claude Financial Data Analyst 是一个结合了AI模型Claude和数据可视化技术的 […]

Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型

Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型

Meta Spirit LM 是Meta推出的一个开源的多模态语言模型，其设计目的是能够在语音和文本之间进行无 […]

AMT-APC：自动生成钢琴伴奏模型将任意音乐转换成与原曲匹配钢琴伴奏

AMT-APC：自动生成钢琴伴奏模型将任意音乐转换成与原曲匹配钢琴伴奏

钢琴是全球范围内最受欢迎的乐器之一。为特定歌曲创作钢琴伴奏通常需要高度的音乐知识和技术，而这种技术难度使得普通 […]

Hallo 2：根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频

Hallo 2：根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频

根据单张图像和音频输入生成唱歌和说话视频，并能控制人物表情和姿态的模型 Hallo 发布了更新版本Hallo […]

Google NotebookLM 推出企业版和个性化控制你可以自定义AI播客内容

Google NotebookLM 推出企业版和个性化控制你可以自定义AI播客内容

Google NotebookLM 引入了两项重要功能：自定义音频概述和 NotebookLM Busine […]

Perplexity AI 推出了两个全新功能：内部知识搜索和 Spaces 更加方便易用

Perplexity AI 推出了两个全新功能：内部知识搜索和 Spaces 更加方便易用

Perplexity AI 推出了两个全新功能：内部知识搜索和 Spaces，专为提升团队的研究与协作效率。 […]

全球首创桌面双轮足式 AI 机器人接入ChatGPT 能跑、能看、能说、倒不了…

全球首创桌面双轮足式 AI 机器人接入ChatGPT 能跑、能看、能说、倒不了…

你是否曾梦想拥有一台可以自由编程和互动的智能机器人？现在机会来了！XGO Rider 是一款全球首创的桌面双轮 […]

Zerox ：一个简单易用的GPT OCR 工具可将 PDF、DOCX 等文件转换为 Markdown 格式

Zerox ：一个简单易用的GPT OCR 工具可将 PDF、DOCX 等文件转换为 Markdown 格式

Zerox 是一个简单易用的 OCR 工具，可将 PDF、DOCX 等文件转换为 Markdown 格式。它 […]

Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型性能优于Llama 和 Gemma 模型

Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型性能优于Llama 和 Gemma 模型

法国AI初创公司 Mistral 推出了名为 “Les Ministraux” 的新一代生成式AI模型，专为笔 […]

Eye Contact：目光矫正 API 自动调整视频、直播中眼睛的视线方向

Eye Contact：目光矫正 API 自动调整视频、直播中眼睛的视线方向

Sieve推出专门用于目光矫正（eye contact correction）的API服务。这一API旨在让讲 […]

阿里巴巴推出升级版AI翻译工具：Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴推出升级版AI翻译工具：Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具，名为Marco MT。阿里巴巴称，这款工具在翻译性能 […]

Power-over-Skin “皮肤供电”技术让可穿戴设备无需电池也能工作

Power-over-Skin “皮肤供电”技术让可穿戴设备无需电池也能工作

现代计算设备功能强大且小巧，可以轻松佩戴在身体上。然而，电池成为设计和用户体验的主要障碍，增加了设备的重量和体 […]

Adobe Premiere Pro 推出多项新的生成式AI功能大幅提高视频编辑效率

Adobe Premiere Pro 推出多项新的生成式AI功能大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能，尤其是名为Generative Exte […]

Augmented Physics：增强现实你的物理课本让你的物理课本上的图表动起来

Augmented Physics：增强现实你的物理课本让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具，旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS ：支持多语言切换、速度控制、情感表达具有零样本生成能力的TTS系统

F5-TTS ：支持多语言切换、速度控制、情感表达具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音（Text-to-Speech, TTS）系统，该系统基于流匹配技 […]

One-Click Creative Template：创意模型用一张卡通图片总结4张真实人物照片

One-Click Creative Template：创意模型用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

@MKBHD ：如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

@MKBHD ：如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后，YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架，专门用于构建、编排 […]

1 2 3 4 5 … 32