首页 > Ai资讯 > Ai日报
Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制
Runway 推出新一代视频生成模型 Gen-3 Alpha 能够进行精细时间控制

Runway推出新一代视频生成模型 Gen-3 Alpha,具备更高的保真度和一致性,能够生成逼真的人类角色和 […]

麻省理工开发出 AI 聊天机器人 可以让你和60岁的自己进行对话
麻省理工开发出 AI 聊天机器人 可以让你和60岁的自己进行对话

麻省理工学院(MIT)的研究人员开发了一款名为Future You “未来的你”的AI聊天机器人,它可以让你和 […]

DeepSeek发布开源模型DeepSeek-Coder-V2 在代码和数学能力上超越了GPT-4-Turbo
DeepSeek发布开源模型DeepSeek-Coder-V2 在代码和数学能力上超越了GPT-4-Turbo

DeepSeek宣布发布开源模型DeepSeek-Coder-V2,该模型在代码和数学能力上超越了GPT-4- […]

Google 发布根据视频生成音频技术:V2A 也就是给视频自动配音、配乐
Google 发布根据视频生成音频技术:V2A 也就是给视频自动配音、配乐

DeepMind最新研发了一种叫视频转音频(V2A)的技术。这种技术可以根据视频画面和文字描述,自动生成丰富的 […]

Color Health 与OpenAI 合作 开发出Cancer Copilot 加速癌症患者治疗
Color Health 与OpenAI 合作 开发出Cancer Copilot 加速癌症患者治疗

Color Health与OpenAI合作开发了一款名为Color’s copilot的工具,旨在通过使用GP […]

MimicBrush:通过模仿参考图像对目标图像选定区域自动进行局部编辑
MimicBrush:通过模仿参考图像对目标图像选定区域自动进行局部编辑

MimicBrush 由阿里巴巴开发的一种新型的图像编辑方法,也可以称为模仿编辑(imitative edit […]

根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态
根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态

通过语音音频输入来驱动肖像图像生成动画视频,也就是一段语音+个人图像生成会说话唱歌的视频。 研究团队提出了一种 […]

让 AI 像人类一样通过试错法学习决策和推理 提高其逻辑推理和数学能力
让 AI 像人类一样通过试错法学习决策和推理 提高其逻辑推理和数学能力

随着人工智能的快速发展,诸如GPT-4和LLaMA等大语言模型在自然语言处理能力方面取得了显著进步。这些模型展 […]

教程:借助伪代码让 ChatGPT 一次生成一套绘本图像
教程:借助伪代码让 ChatGPT 一次生成一套绘本图像

如果你想让通过ChatGPT来生成图像,一般一次只会生成一张,一张一张的生成而且想要保持图像风格和角色一致非常 […]

NVIDIA 发布 Nemotron-4 340B 开源模型 主要用于生成高质量的合成数据
NVIDIA 发布 Nemotron-4 340B 开源模型 主要用于生成高质量的合成数据

NVIDIA 发布了 Nemotron-4 340B 开源模型家族,该模型主要用于生成高质量的合成数据,从而提 […]

Soft and Squishy Linework:专门生成柔和的、低保真(lofi)线条风格动漫图像模型
Soft and Squishy Linework:专门生成柔和的、低保真(lofi)线条风格动漫图像模型

“Soft and Squishy Linework” 是一个文本生成图像模型,专门设计用于创建柔和的、低保真 […]

Google:个人健康大语言模型和智能体研究 可利用穿戴设备数据进行健康检测
Google:个人健康大语言模型和智能体研究 可利用穿戴设备数据进行健康检测

移动设备和可穿戴设备(如智能手表和健身追踪器)能够持续、详细和长期地记录个人的生理状态和行为数据。例如: 步数 […]

阿里云发布 VideoLLaMA 2 视频语言模型 提升模型对视频、音频内容的理解能力
阿里云发布 VideoLLaMA 2 视频语言模型 提升模型对视频、音频内容的理解能力

VideoLLaMA 2 是一个旨在提升视频大语言模型(Video-LLM)时空建模和音频理解能力的项目。该模 […]

基于大语言模型的知识库问答系统 支持自动爬取在线文档 兼容多个大模型
基于大语言模型的知识库问答系统 支持自动爬取在线文档 兼容多个大模型

MaxKB 是一个基于大语言模型 (LLM) 的智能知识库问答系统。它能够帮助企业高效地管理知识,并提供智能问 […]

PROTEUS:斯坦福大学开发的 通过单张图片让人物进行实时唱歌和说话的AI
PROTEUS:斯坦福大学开发的 通过单张图片让人物进行实时唱歌和说话的AI

PROTEUS是斯坦福大学的研究人员和Apparate Labs推出的一款用于生成逼真、具有表现力的人类形象的 […]

Luma 发布 DIT 视频生成模型 Dream Machine 具有物理交互理解
Luma 发布 DIT 视频生成模型 Dream Machine 具有物理交互理解

Luma Dream Machine 基于 DIT 视频生成架构,能够快速从文本和图像生成高质量、逼真的视频。 […]

Suno发布音频输入功能 用户可以使用任何声音随时随地创作歌曲
Suno发布音频输入功能 用户可以使用任何声音随时随地创作歌曲

Suno 发布了一项新功能,允许用户从任何声音创建歌曲。所有专业版和高级版用户现在可以上传或录制音频,并将其转 […]

Uizard 发布 Autodesigner 2.0 AI设计引擎 只需文字或截图几秒钟内完成网站设计
Uizard 发布 Autodesigner 2.0 AI设计引擎 只需文字或截图几秒钟内完成网站设计

Uizard 发布 Autodesigner 2.0 AI设计引擎,结合了 uizard 的专有模型和Anth […]

Musashi:东京大学开发并训练了一款可以自己开车的机器人
Musashi:东京大学开发并训练了一款可以自己开车的机器人

东京大学的一组研究人员开发并训练了一款名为Musashi的“肌骨类人机器人”,能够驾驶一辆小型电动车。这款机器 […]

吴恩达提出的基于反思代理工作流的机器翻译方法
吴恩达提出的基于反思代理工作流的机器翻译方法

吴恩达 Andrew Ng 分享了一种基于反思代理工作流的机器翻译 Python 实现。他认为它有可能超越传统 […]

俄罗斯科技巨头Yandex 开源了一个LLM培训工具 可节省高达20%的 GPU 资源
俄罗斯科技巨头Yandex 开源了一个LLM培训工具 可节省高达20%的 GPU 资源

俄罗斯科技巨头Yandex发布了一款新的开源工具YaFSDP,称可以帮助AI公司在训练新模型时节省资金和资源。 […]

Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行
Stability AI 开源其 Stable Diffusion 3 Medium 模型 可在消费级笔记本电脑上运行

Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最 […]

『iOS 18.0 超详细体验报告』 52 项改进详细介绍以及BUG和升级方法
『iOS 18.0 超详细体验报告』 52 项改进详细介绍以及BUG和升级方法

这个版本主要在以下几个部分做了改进: 1、可更换的主屏幕图标颜色。 2、重新设计的控制中心。 3、应用加密、通 […]

教程:如何使用 Midjourney 换脸 将一个人面部复制并粘贴到任意人身上
教程:如何使用 Midjourney 换脸 将一个人面部复制并粘贴到任意人身上

在本教程中,我们将一步步教你如何在私人Discord服务器中通过Midjourney,来创建和个性化图像。即使 […]

Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好
Midjourney 推出 Personalization 功能 Midjourney会记住你的艺术喜好

个性化功能是Midjourney用来根据你的喜好生成图像的一种工具。它会记住你喜欢什么样的图像,然后根据你的喜 […]

iOS 18 推出了全新自定义选项 Apple Intelligence深度集成
iOS 18 推出了全新自定义选项 Apple Intelligence深度集成

苹果今日发布了 iOS 18 预览版,推出了更多自定义选项,为照片 app 带来迄今最重大的设计更新,并为用户 […]

WWDC 2024 发布会Apple Intelligence中文介绍完整视频
WWDC 2024 发布会Apple Intelligence中文介绍完整视频

苹果今日发布适用于 iPhone、iPad 和 Mac 的个人智能化系统 Apple Intelligence […]

Apple Intelligence背后基础模型:一个约30亿参数的设备端模型和一个服务器端大模型
Apple Intelligence背后基础模型:一个约30亿参数的设备端模型和一个服务器端大模型

苹果介绍了其在基础生成模型,这些模型是 Apple Intelligence 系统的核心,深度集成在 iOS […]

使用Domo AI 和Udio 创建动漫风格音乐视频的详细教程
使用Domo AI 和Udio 创建动漫风格音乐视频的详细教程

今天,我将向大家展示如何通过结合两个AI工具:Domo AI和Udio来创建音乐视频。下面是详细的步骤和一些扩 […]

Proofread:利用大语言模型自动修正键盘输入的文本错误 提升打字体验
Proofread:利用大语言模型自动修正键盘输入的文本错误 提升打字体验

Proofread 是谷歌Gboard键盘应用中的一个新功能,利用大语言模型(LLM)实现句子级和段落级的错误 […]


1 11 12 13 14 15 29