首页 > Ai资讯 > Ai日报
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士)

特斯拉在洛杉矶”We, Robot”活动上发布了其全新Cybercab,这款车类似于更小、更流线型的双座版Cy […]

OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露
OpenAI 推出全新 Canvas 工具 帮助用户更好地写作和编程 “Canvas” 的系统提示词泄露

OpenAI 推出了一款叫做 Canvas 的新工具,用来帮助用户更好地与 ChatGPT 协作写作和编程。 […]

哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息
哈佛大学学生开发出一种 AI 眼镜 看你一眼即可扒光你的所有个人信息

哈佛大学的学生 AnhPhu Nguyen 和 Caine Ardayfio 展示了AI智能眼镜的可怕能力,他 […]

 Hugging Face 推出一站式搜索开源成果的平台:Paper Central
 Hugging Face 推出一站式搜索开源成果的平台:Paper Central

Hugging Face 推出一个全面、便捷的学术平台:Paper Central  ,该平台可以帮助研究人员 […]

Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍
Black Forest Labs 发布其最新的图像生成模型 FLUX1.1 [pro] 生成速度快6倍

Black Forest Labs 宣布发布其最新的图像生成模型 FLUX1.1 [pro],以及开放测试版的 […]

OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…
OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏…

在昨晚的 OpenAI 旧金山开发者大会( DevDay) 上 。OpenAI 公布了五项重大创新,其中“实时 […]

OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍
OpenAI 宣布推出Whisper large-v3-turbo 语音转录模型 速度提高了8倍

OpenAI 宣布推出了一个名为 large-v3-turbo(简称 turbo)的新 Whisper 模型。 […]

Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据
Liquid AI 发布 LFMs 系列 “液态神经网络” 通用 AI 模型 能处理各种连续数据

Liquid AI 是麻省理工学院的衍生公司,是一家总部位于马萨诸塞州波士顿的基础模型公司。 Liquid A […]

微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达
微软发布 Azure AI 高清语音模型 能理解文本背后的情感 并实时调整语音语调和情感表达

微软发布了 Azure AI 语音服务的新一代高清(HD)声音预览版本,进一步提升了语音的自然表达能力,尤其在 […]

微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化
微软推出针对个人的 “AI伴侣” Copilot 会根据用户的行为模式、习惯自动进化

微软推出了为每个人提供的“AI伴侣”Copilot,它不仅能够理解用户的需求,还能根据用户的日常习惯和偏好进行 […]

微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强
微软 Copilot 升级全新的外观 加入了语音模式 速度更快、性能更强

Copilot获得了全新的外观,加入了语音模式,并将在未来几周内向部分用户推送。新版本的Copilot比以往更 […]

Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气
Open NotebookLM :将 PDF 文件转化为播客的开源工具 支持中文 可定制语气

Open NotebookLM 是一个将 PDF 文件转化为播客的工具,依靠 Llama 3.1 和 melo […]

投资者要求Open AI 两年内转变为营利性企业 否则其融资将转换为债务
投资者要求Open AI 两年内转变为营利性企业 否则其融资将转换为债务

纽约时报拿到了一份 OpenAI 最新融资的财务审查文件显示:   – 截至20234年6月,OpenAI月活 […]

Screenpipe:24小时不间断记录你的屏幕和音频数据 帮你自动干活
Screenpipe:24小时不间断记录你的屏幕和音频数据 帮你自动干活

Screenpipe 是一个可以读取你屏幕和麦克风的AI工具,它会持续24小时记录你的屏幕和音频数据,并将这些 […]

FLUX-Controlnet-Inpainting:基于 ControlNet 和 FLUX.1-dev 的图像修复工具
FLUX-Controlnet-Inpainting:基于 ControlNet 和 FLUX.1-dev 的图像修复工具

Alimama-Creative 团队开发的的基于FLUX.1-dev 模型的图像修复工具。 它是Contro […]

3.17亿粉丝 全球第一网红 MRBEAST 公司内部培训手册 教你如何制造爆款内容
3.17亿粉丝 全球第一网红 MRBEAST 公司内部培训手册 教你如何制造爆款内容

MrBeast 是美国第一网红,也是全球第一网红,他是 Youtube 订阅者最多的作者,截止2024年9月, […]

Omni-Zero-Couples :无需图像训练自动生成风格化情侣肖像的扩散模型
Omni-Zero-Couples :无需图像训练自动生成风格化情侣肖像的扩散模型

Omni-Zero-Couples 是一个用于生成风格化情侣肖像的扩散模型,支持零样本输入。用户可以通过上传照 […]

2VEdit :一种基于图像到视频扩散模型视频编辑方法 只需编辑第一帧即可应用到整个视频效果
2VEdit :一种基于图像到视频扩散模型视频编辑方法 只需编辑第一帧即可应用到整个视频效果

2VEdit 是一种基于图像到视频扩散模型的视频编辑方法,其核心思想是通过编辑视频中的单个画面(第一帧),然后 […]

Notion 发布全新的Notion AI 集成搜索、生成内容、分析数据和智能聊天等功能
Notion 发布全新的Notion AI 集成搜索、生成内容、分析数据和智能聊天等功能

新的 Notion AI 集成了搜索、生成内容、分析数据和智能聊天等功能,所有操作都可以在 Notion 内部 […]

Meta AI 发布Orion AR眼镜 眼镜集成了能够感知周围环境的AI 目标是替代智能手机
Meta AI 发布Orion AR眼镜 眼镜集成了能够感知周围环境的AI 目标是替代智能手机

Meta AI 发布Orion AR眼镜,这是是一款具有潜力的增强现实设备,旨在替代智能手机。Meta 公司介 […]

Meta AI 发布 Llama 3.2 多模态AI模型 性能与GPT4o-mini 相当 能够在边缘设备上高效运行
Meta AI 发布 Llama 3.2 多模态AI模型 性能与GPT4o-mini 相当 能够在边缘设备上高效运行

Meta AI 发布 Llama 3.2多模态AI模型,旨在提供强大的自然语言处理和图像理解能力。其设计目标是 […]

Molmo 一个完全开源的多模态模型 支持2D指向交互 性能仅次于GPT-4o
Molmo 一个完全开源的多模态模型 支持2D指向交互 性能仅次于GPT-4o

Molmo 一个开源的先进多模态人工智能模型,旨在提高开放系统在性能上与专有系统(如商业模型)之间的竞争力,特 […]

换脸应用 FaceFusion 升级为 “面部操控平台” 支持面部表情恢复迁移编辑
换脸应用 FaceFusion 升级为 “面部操控平台” 支持面部表情恢复迁移编辑

FaceFusion 是一个用于面部交换、深度伪造的项目,在经历了四个月的高强度工作后,FaceFusion宣 […]

Google发布全球185个各大企业的生成式AI实际应用落地案例
Google发布全球185个各大企业的生成式AI实际应用落地案例

Google发布了一篇文章,详细介绍了185个来自全球各大企业的生成式AI实际应用案例。 这些案例展示了生成式 […]

MIMO:给定一个参考图像 、视频 几分钟即可生成一个可以控制动作和场景的动画人物
MIMO:给定一个参考图像 、视频 几分钟即可生成一个可以控制动作和场景的动画人物

MIMO是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息(如图片、动作序列或视频),生成 […]

OpenAI 推理模型 o1 评估研究报告 准确率高达 97.8% 远超其他 LLM 模型 但成本很高
OpenAI 推理模型 o1 评估研究报告 准确率高达 97.8% 远超其他 LLM 模型 但成本很高

随着o1 模型的发布,OpenAI提出了一种全新的大规模推理模型(Large Reasoning Model, […]

字节跳动发布一些列新的模型 包括基于DIT的视频生成模型、音乐模型,同声传译模型等
字节跳动发布一些列新的模型 包括基于DIT的视频生成模型、音乐模型,同声传译模型等

字节跳动今天发布一些列新的模型。包括音乐模型,同声传译模型、文生图2.0模型、新的基于DIT的视频生成模型、豆 […]

Google DeepMind 推出通过强化学习实现自我纠正(SCoRe)的训练方法 提高模型在复杂数学和编码任务中的准确性
Google DeepMind 推出通过强化学习实现自我纠正(SCoRe)的训练方法 提高模型在复杂数学和编码任务中的准确性

大语言模型(LLMs)在数学问题解决和代码生成等推理和科学领域展现了强大的能力。然而,当前的LLMs在“自我纠 […]

n8n推出自托管 AI 入门工具包 可在本地快速部署AI项目和低代码开发环境
n8n推出自托管 AI 入门工具包 可在本地快速部署AI项目和低代码开发环境

n8n推出了Self-Hosted AI Starter Kit 自托管 AI 入门工具包,帮助用户在本地或私 […]

Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达
Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

Moshi 是一个多流(multi-stream)的实时语音到语音生成 Transformer 模型,支持全双 […]


1 2 3 4 5 6 31