首页 > Ai资讯 > Ai日报
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反

OpenAI公布了其最新的o1 模型官方提示词建议,OpenAI明确表示模型在简单的提示下表现最佳。一些提示工 […]

Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格
Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格

Suno推出Covers功能,通过Cover功能,你可以将任何音频,从简单的录音到完整制作的歌曲,转化为一种全 […]

DataGemma:利用真实世界数据解决人工智能幻觉
DataGemma:利用真实世界数据解决人工智能幻觉

Google最新推出的DataGemma模型旨在通过与Google Data Commons(数据共享平台)的 […]

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中
Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型Adobe Firefly Video Model ,专门用于视频 […]

Hume AI推出 EVI 2 全新的基础语音到语音模型 可进行极其人性化的语音对话
Hume AI推出 EVI 2 全新的基础语音到语音模型 可进行极其人性化的语音对话

Hume AI 推出的全新语音对话基础模型:EVI 2 ,能够与用户进行极其人性化的语音对话。它可以快速流畅地 […]

Vchitect 2.0:上海人工智能实验室开发的视频生成模型 金额生成5 到 20 秒的高清短视频
Vchitect 2.0:上海人工智能实验室开发的视频生成模型 金额生成5 到 20 秒的高清短视频

Vchitect 2.0 是由上海人工智能实验室开发的视频生成模型,它支持通过文本和图像生成5 到 20 秒的 […]

Google NotebookLM推出 “Audio Overview” 的功能 可以将任意文档转换成播客对话
Google NotebookLM推出 “Audio Overview” 的功能 可以将任意文档转换成播客对话

Google 推出的 NotebookLM 新增了一项名为 “Audio Overview” 的功能,允许用户 […]

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务
Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B,该模型具有120 亿参数 […]

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型
Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

Jina AI 推出的两款专门将原始 HTML 转换为干净的 Markdown 的小型语言模型。 Reader […]

Runway :关于未来AI生成式媒体工具界面和交互的设计原则
Runway :关于未来AI生成式媒体工具界面和交互的设计原则

Runway 发布了一篇文章介绍了他们对 AI 生成媒体的新交互方式的思考。Runway认为应该为生成式媒体创 […]

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧
OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

OpenAI 分享了一篇内容,介绍了一些作家如何在创作过程中使用 ChatGPT 的示例。 在这篇文章中,Op […]

吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程
吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程

这个课程由Andrew Ng主讲,专为初学者设计,帮助学员学习Python编程基础,并将其与AI工具集成进行数 […]

Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

Vidu升级其 AI 视频模型,支持让任意主体保持一致 重点在于在生成图像时保持主体的一致性,尤其是针对角色和 […]

软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机
软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机

微软宣布了他们在逻辑量子比特领域的突破,展示了性能最好的逻辑量子比特,错误率比物理量子比特低800倍。这一成果 […]

Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用
Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

Chai Discovery 推出了 Chai-1,一个面向分子结构预测的多模态基础模型,适用于药物发现等任务 […]

Open Interpreter 推出01 App 能运行在各种硬件上 并通过语音控制来操作设备
Open Interpreter 推出01 App 能运行在各种硬件上 并通过语音控制来操作设备

Open Interpreter团队宣布了一个重要的决定:放弃制造01 Light硬件设备,转而推出01 Ap […]

教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型
教程:无需编程知识 使用自己的照片快速训练一个自己的FLUX.1 图像模型

FLUX.1模型的发布迅速风靡全球,生成的图像质量超越了现有的开源模型,并且支持通过简单的操作进行微调,无需编 […]

WechatFerry:一个开源微信机器人框架 助你轻松开发微信聊天机器人
WechatFerry:一个开源微信机器人框架 助你轻松开发微信聊天机器人

WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器 […]

Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等
Concept Sliders:通过拖到滑块来精确控制特定图像特征 如年龄、性别、眼睛大小等

Concept Sliders 是一种用于扩散模型(如 Stable Diffusion)的LoRA 适配器, […]

iPhone 16 的相机控制按钮:是如何工作的 苹果通过它可以随时将Touch ID带回iPhone
iPhone 16 的相机控制按钮:是如何工作的 苹果通过它可以随时将Touch ID带回iPhone

苹果在所有新款 iPhone 都配备了一个新的按钮引入了一个全新的**“Camera Control”按钮** […]

新工具可检测人工智能制作的虚假科学论文
新工具可检测人工智能制作的虚假科学论文

Binghamton大学的研究人员开发了一款名为 xFakeSci 的机器学习算法,专门用于检测由生成式AI( […]

Mini-Omni 支持“边思考边说话” 具备端到端的实时语音输入和输出能力模型
Mini-Omni 支持“边思考边说话” 具备端到端的实时语音输入和输出能力模型

Mini-Omni是一种多模态大型语言模型,具备端到端的实时语音输入和输出能力。与传统依赖于文本转语音(TTS […]

Roblox 展示了新的 3D AI 工具 实现与游戏玩法直接集成的实时世界构建
Roblox 展示了新的 3D AI 工具 实现与游戏玩法直接集成的实时世界构建

在 2024年Roblox开发者大会(RDC) 上,首席执行官 David Baszucki 宣布了 Robl […]

Replit 发布Replit  Agent AI应用开发助手 0基础编程用户也能开发程序
Replit 发布Replit  Agent AI应用开发助手 0基础编程用户也能开发程序

Replit 发布了一款实验性产品:Replit  Agent ,旨在帮助用户从零开始构建软件项目。它通过理解 […]

Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正
Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

全球最强的开源模型:Reflection 70B。它使用了一种名为“Reflection-Tuning 反思调 […]

DeepMind 新的生物人工智能系统 AlphaProteo:专门设计能够与特定靶标分子结合的蛋白质
DeepMind 新的生物人工智能系统 AlphaProteo:专门设计能够与特定靶标分子结合的蛋白质

DeepMind 发布了一个新的生物人工智能系统,专门设计能够与特定靶标分子结合的蛋白质。这些蛋白质可以与特定 […]

面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来
面壁智能发布 MiniCPM 3.0 声称端侧模型 ChatGPT 时刻到来

MiniCPM3-4B 是 MiniCPM 开发的最新一代边缘端语言模型,其整体性能优于 Phi-3.5-mi […]

科学家研究出一种新方法 只需涂抹特殊溶液 就能使活体动物的组织变得透明
科学家研究出一种新方法 只需涂抹特殊溶液 就能使活体动物的组织变得透明

科学家研究出一种新方法,能够使活体动物的组织暂时变得透明,以便于更好地进行光学成像。这对于医学和生物研究非常有 […]

Loopy:通过音频驱动静态照片生成动态视频 并能生成自然动作,表情变化、头部移动等
Loopy:通过音频驱动静态照片生成动态视频 并能生成自然动作,表情变化、头部移动等

传统的音频驱动肖像动画生成方法通常需要手动设定运动模板,这在生成动态肖像时可能限制其灵活性和自然性。Loopy […]

RapidLayoutRecover:将文档类图像还原成可编辑的文本格式 同时保持版面布局
RapidLayoutRecover:将文档类图像还原成可编辑的文本格式 同时保持版面布局

RapidLayoutRecover 是一个针对文档类图像的版面还原工具。该项目通过整合版面分析、文字识别(O […]


1 4 5 6 7 8 31