Ai日报 - 第 6 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

Runway推出其视频生成模型的API 方便开发者集成到应用中但是有一些特殊要求

Runway推出其视频生成模型的API 方便开发者集成到应用中但是有一些特殊要求

Runway宣布推出其视频生成模型的API。该API旨在帮助开发者和公司将Runway的生成式AI模型集成到第 […]

Playground v3 技术报告：完全整合了大语言模型的图像生成模型精细的图像生成与控制能力

Playground v3 技术报告：完全整合了大语言模型的图像生成模型精细的图像生成与控制能力

Playground v3（PGv3）是由Playground开发的一种文本到图像生成模型，其基于最新的大语言 […]

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1 是一个使用 Llama-3.1 70b 模型在 Groq 上创建类似 o1 的推理链的实验性应用。其主要 […]

StoryTribe ：一个免费的在线故事板制作工具无需绘画技能轻松制作故事板

StoryTribe ：一个免费的在线故事板制作工具无需绘画技能轻松制作故事板

故事板是一种视觉工具，用于通过一系列框架描绘故事或概念，类似于漫画。它最初用于电影行业，帮助有效规划和传达想法 […]

李飞飞的空间智能公司World Labs正式成立获得 2.3 亿美元融资估值10亿美金

李飞飞的空间智能公司World Labs正式成立获得 2.3 亿美元融资估值10亿美金

斯坦福大学教授李飞飞的新公司 World Labs 成功融资 2.3 亿美元。李飞飞被誉为“AI教母”，她的公 […]

GOT-OCR2.0：端到端的 OCR 模型可以处理各种复杂的光学字符任务

GOT-OCR2.0：端到端的 OCR 模型可以处理各种复杂的光学字符任务

GOT-OCR2.0 是一种用于光学字符识别（OCR）任务的通用模型，旨在解决传统OCR系统（OCR-1.0） […]

PuLID：通过一张参考照片使用文本描述快速更改图像中人物的外貌和身份特征

PuLID：通过一张参考照片使用文本描述快速更改图像中人物的外貌和身份特征

PuLID（Pure and Lightning ID Customization via Contrasti […]

GameGen-O：可以生成开放世界游戏的模型自动生成角色、场景、动作和事件

GameGen-O：可以生成开放世界游戏的模型自动生成角色、场景、动作和事件

GameGen-O是一个专为生成开放世界视频游戏而设计的Diffusion Transforme模型。该模型能 […]

使用AI 辅助合成数学数据集生成高质量、复杂的困难数学题

使用AI 辅助合成数学数据集生成高质量、复杂的困难数学题

随着大语言模型（如GPT-4、Claude等）的发展，LLM在处理数学问题上取得了显著进展。然而，这些模型的能 […]

OpenAI发布了全新的 o1 推理模型工作原理及技术报告详解

OpenAI发布了全新的 o1 推理模型工作原理及技术报告详解

OpenAI发布了全新的o1-preview” 推理模型系列，这是一个设计用于解决复杂问题的 AI 系列，能够 […]

OpenAI公布其最新的o1 模型官方提示词建议提示越简洁越好链式思维提示可能适得其反

OpenAI公布其最新的o1 模型官方提示词建议提示越简洁越好链式思维提示可能适得其反

OpenAI公布了其最新的o1 模型官方提示词建议，OpenAI明确表示模型在简单的提示下表现最佳。一些提示工 […]

Suno推出 Covers 翻唱功能可以将任何音频、歌曲转化为另一种全新的风格

Suno推出 Covers 翻唱功能可以将任何音频、歌曲转化为另一种全新的风格

Suno推出Covers功能，通过Cover功能，你可以将任何音频，从简单的录音到完整制作的歌曲，转化为一种全 […]

DataGemma：利用真实世界数据解决人工智能幻觉

DataGemma：利用真实世界数据解决人工智能幻觉

Google最新推出的DataGemma模型旨在通过与Google Data Commons（数据共享平台）的 […]

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型Adobe Firefly Video Model ，专门用于视频 […]

Hume AI推出 EVI 2 全新的基础语音到语音模型可进行极其人性化的语音对话

Hume AI推出 EVI 2 全新的基础语音到语音模型可进行极其人性化的语音对话

Hume AI 推出的全新语音对话基础模型：EVI 2 ，能够与用户进行极其人性化的语音对话。它可以快速流畅地 […]

Vchitect 2.0：上海人工智能实验室开发的视频生成模型金额生成5 到 20 秒的高清短视频

Vchitect 2.0：上海人工智能实验室开发的视频生成模型金额生成5 到 20 秒的高清短视频

Vchitect 2.0 是由上海人工智能实验室开发的视频生成模型，它支持通过文本和图像生成5 到 20 秒的 […]

Google NotebookLM推出 “Audio Overview” 的功能可以将任意文档转换成播客对话

Google NotebookLM推出 “Audio Overview” 的功能可以将任意文档转换成播客对话

Google 推出的 NotebookLM 新增了一项名为 “Audio Overview” 的功能，允许用户 […]

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B，该模型具有120 亿参数 […]

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

Jina AI 推出的两款专门将原始 HTML 转换为干净的 Markdown 的小型语言模型。 Reader […]

Runway ：关于未来AI生成式媒体工具界面和交互的设计原则

Runway ：关于未来AI生成式媒体工具界面和交互的设计原则

Runway 发布了一篇文章介绍了他们对 AI 生成媒体的新交互方式的思考。Runway认为应该为生成式媒体创 […]

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

OpenAI 分享了一篇内容，介绍了一些作家如何在创作过程中使用 ChatGPT 的示例。在这篇文章中，Op […]

吴恩达AI课程：AI Python 初学者课程每节课5分钟 1小时学会AI Python编程

吴恩达AI课程：AI Python 初学者课程每节课5分钟 1小时学会AI Python编程

这个课程由Andrew Ng主讲，专为初学者设计，帮助学员学习Python编程基础，并将其与AI工具集成进行数 […]

Vidu发布参考一致性功能可以让任意主体保持一致视频生成进入新阶段

Vidu发布参考一致性功能可以让任意主体保持一致视频生成进入新阶段

Vidu升级其 AI 视频模型，支持让任意主体保持一致重点在于在生成图像时保持主体的一致性，尤其是针对角色和 […]

软宣布有史以来性能最优的逻辑量子比特并将推出世界上最强大的量子计算机

软宣布有史以来性能最优的逻辑量子比特并将推出世界上最强大的量子计算机

微软宣布了他们在逻辑量子比特领域的突破，展示了性能最好的逻辑量子比特，错误率比物理量子比特低800倍。这一成果 […]

Chai-1 ：一个用于预测分子结构多模态基础模型解码生命的分子相互作用

Chai-1 ：一个用于预测分子结构多模态基础模型解码生命的分子相互作用

Chai Discovery 推出了 Chai-1，一个面向分子结构预测的多模态基础模型，适用于药物发现等任务 […]

Open Interpreter 推出01 App 能运行在各种硬件上并通过语音控制来操作设备

Open Interpreter 推出01 App 能运行在各种硬件上并通过语音控制来操作设备

Open Interpreter团队宣布了一个重要的决定：放弃制造01 Light硬件设备，转而推出01 Ap […]

教程：无需编程知识使用自己的照片快速训练一个自己的FLUX.1 图像模型

教程：无需编程知识使用自己的照片快速训练一个自己的FLUX.1 图像模型

FLUX.1模型的发布迅速风靡全球，生成的图像质量超越了现有的开源模型，并且支持通过简单的操作进行微调，无需编 […]

WechatFerry：一个开源微信机器人框架助你轻松开发微信聊天机器人

WechatFerry：一个开源微信机器人框架助你轻松开发微信聊天机器人

WechatFerry 是一个微信机器人框架，提供了一套强大、快速且可定制的解决方案，适用于开发和集成微信机器 […]

Concept Sliders：通过拖到滑块来精确控制特定图像特征如年龄、性别、眼睛大小等

Concept Sliders：通过拖到滑块来精确控制特定图像特征如年龄、性别、眼睛大小等

Concept Sliders 是一种用于扩散模型（如 Stable Diffusion）的LoRA 适配器， […]

iPhone 16 的相机控制按钮：是如何工作的苹果通过它可以随时将Touch ID带回iPhone

iPhone 16 的相机控制按钮：是如何工作的苹果通过它可以随时将Touch ID带回iPhone

苹果在所有新款 iPhone 都配备了一个新的按钮引入了一个全新的**“Camera Control”按钮** […]

1 … 4 5 6 7 8 … 32