首页 > Ai资讯 > Ai日报
Midjourney 大更新:新增外部图像编辑器、图像重纹理功能 编辑图像更轻松
Midjourney 大更新:新增外部图像编辑器、图像重纹理功能 编辑图像更轻松

Midjourney 大更新   新增功能:外部图像编辑器、图像重纹理 图像编辑器:允许用户上传图像并进行扩展 […]

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑
Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Hai […]

Runway 推出一款生成式角色表演工具 可以把视频转换成任意风格虚拟角色动画 并且保持表情语音口型同步
Runway 推出一款生成式角色表演工具 可以把视频转换成任意风格虚拟角色动画 并且保持表情语音口型同步

Runway 推出的一款生成式角色表演工具,Act-One可以通过使用视频和语音输入生成逼真的角色表演,是一种 […]

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具 轻松编辑图像
Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具 轻松编辑图像

Ideogram发布 Ideogram Canvas ,这是是一个无限的创意画板,用于组织、生成、编辑和组合图 […]

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数
Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数

Genmo 推出最新开源视频生成模型 Mochi 1。 Mochi 1 采用了Asymmetric Diffu […]

美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附 开枪自杀身亡
美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附 开枪自杀身亡

14岁少年 Sewell Setzer III 在与一款名为 Character.AI 的聊天机器人进行长时间 […]

ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音
ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音

ElevenLabs 推出全新的AI语音生成工具:Voice Design ,用户可以通过描述文本提示创建个性 […]

微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI
微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI

微软CEO Satya Nadella 伦敦巡讲 Satya Nadella 和 Jared Spataro […]

微软发布了10个全新的自主AI代理 可以处理客户查询的“人工智能员工”
微软发布了10个全新的自主AI代理 可以处理客户查询的“人工智能员工”

微软正在推出一种新的自主人工智能代理,也称为“虚拟员工”,这些AI代理能够执行多种业务任务,如处理客户查询、识 […]

Applicant AI:人工智能面试系统 通过AI视频聊天快速筛选求职简历
Applicant AI:人工智能面试系统 通过AI视频聊天快速筛选求职简历

Applicant AI 是一款由 Web3 Jobs 和 Remote OK 开发的基于AI的申请人跟踪系统 […]

Project Turntable:将2D矢量图像 像3D对象一样进行旋转 并自动补充缺失部分
Project Turntable:将2D矢量图像 像3D对象一样进行旋转 并自动补充缺失部分

在Adobe MAX 2024大会上,Adobe推出了一项创新AI工具Project Turntable,该工 […]

Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律
Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律

之前报道 Archetype AI 发布了一个创新的人工智能平台 —— Newton™,这是一个专门为理解物理 […]

Claude Financial Data Analyst :由 Claude 支持的可视化金融数据分析工具
Claude Financial Data Analyst :由 Claude 支持的可视化金融数据分析工具

Claude Financial Data Analyst 是一个结合了AI模型Claude和数据可视化技术的 […]

Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型
Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型

Meta Spirit LM 是Meta推出的一个开源的多模态语言模型,其设计目的是能够在语音和文本之间进行无 […]

AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏
AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏

钢琴是全球范围内最受欢迎的乐器之一。为特定歌曲创作钢琴伴奏通常需要高度的音乐知识和技术,而这种技术难度使得普通 […]

Hallo 2:根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频
Hallo 2:根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频

根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态的模型 Hallo 发布了更新版本Hallo […]

Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容
Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容

Google NotebookLM 引入了两项重要功能:自定义音频概述 和 NotebookLM Busine […]

Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces 更加方便易用
Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces 更加方便易用

Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces,专为提升团队的研究与协作效率。 […]

全球首创桌面双轮足式 AI 机器人 接入ChatGPT 能跑、能看、能说、倒不了…
全球首创桌面双轮足式 AI 机器人 接入ChatGPT 能跑、能看、能说、倒不了…

你是否曾梦想拥有一台可以自由编程和互动的智能机器人?现在机会来了!XGO Rider 是一款全球首创的桌面双轮 […]

Zerox :一个简单易用的GPT OCR 工具 可将 PDF、DOCX 等文件转换为 Markdown 格式
Zerox :一个简单易用的GPT OCR 工具 可将 PDF、DOCX 等文件转换为 Markdown 格式

Zerox 是一个简单易用的 OCR 工具,可将 PDF、DOCX 等文件转换为 Markdown 格式。 它 […]

Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型 性能优于Llama 和 Gemma 模型
Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型 性能优于Llama 和 Gemma 模型

法国AI初创公司 Mistral 推出了名为 “Les Ministraux” 的新一代生成式AI模型,专为笔 […]

Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向
Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向

Sieve推出专门用于目光矫正(eye contact correction)的API服务。这一API旨在让讲 […]

阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具,名为Marco MT。 阿里巴巴称,这款工具在翻译性能 […]

Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作
Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作

现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体 […]

Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能,尤其是名为Generative Exte […]

Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来
Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具,旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统
F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音(Text-to-Speech, TTS)系统,该系统基于流匹配技 […]

One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作
OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架,专门用于构建、编排 […]


1 2 3 4 5 32