首页 > Ai资讯 > Ai日报
n8n推出自托管 AI 入门工具包 可在本地快速部署AI项目和低代码开发环境
n8n推出自托管 AI 入门工具包 可在本地快速部署AI项目和低代码开发环境

n8n推出了Self-Hosted AI Starter Kit 自托管 AI 入门工具包,帮助用户在本地或私 […]

Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达
Moshi:实时语音到语音生成 Transformer 开源模型 160毫秒低延迟 支持随时打断和情感表达

Moshi 是一个多流(multi-stream)的实时语音到语音生成 Transformer 模型,支持全双 […]

Sketch 推出 Smart Animate 新功能 可在原型设计中加入流畅的动画效果
Sketch 推出 Smart Animate 新功能 可在原型设计中加入流畅的动画效果

Sketch 发布 Smart Animate 新功能,用于在设原型计中加入流畅的动画效果。通过 Smart […]

PDF2Audio:将 PDF 文件转换为播客、讲座、摘要等音频内容
PDF2Audio:将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频格式,如播客、讲座或摘要。该项目利用 Ope […]

将TI-84计算器改装连接到互联网 并接入ChatGPT 实现作弊功能
将TI-84计算器改装连接到互联网 并接入ChatGPT 实现作弊功能

这段视频展示了如何修改TI-84计算器,让 TI-84 计算器能够执行如联网聊天、下载作弊小抄、访问 GPT […]

OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式
OpenAI 首席科学家MIT演讲:揭示 o1模型训练核心 激励模型学习是培养 AGI 的最佳方式

OpenAI 首席科学家,也是OpenAI o1模型团队的主要成员Hyung Won Chung,在 MIT […]

TurboEdit:基于文本提示实现亚秒级实时图像编辑 相比传统方法实现了 6到630倍的速度提升
TurboEdit:基于文本提示实现亚秒级实时图像编辑 相比传统方法实现了 6到630倍的速度提升

扩散模型(Diffusion Models)在文本引导图像生成领域中表现出强大的生成能力,允许用户通过自然语言 […]

Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话
Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话

Deepgram推出了全新的AI语音代理API,这是一个统一的语音对话API,旨在让AI代理能够进行自然的对话 […]

StoryMaker:一致性角色图像解决方案 能同时保持面部、服装、发型和身体姿态一致性
StoryMaker:一致性角色图像解决方案 能同时保持面部、服装、发型和身体姿态一致性

StoryMaker是一个旨在生成一致性角色图像的个性化解决方案。它不仅可以在多人物场景中保持角色的面部一致性 […]

LVCD:专门为动画视频线稿上色工具 把黑白线稿自动转化为彩色动画视频
LVCD:专门为动画视频线稿上色工具 把黑白线稿自动转化为彩色动画视频

LVCD 是一个专门为动画视频线稿上色设计的工具。它通过一种新的方法,把黑白线稿自动转化为彩色动画视频。 传统 […]

Claude 引入上下文检索技术 大幅提高RAG的性能和检索准确率
Claude 引入上下文检索技术 大幅提高RAG的性能和检索准确率

为了让 AI 模型在特定环境中更有用,它往往需要访问背景知识。例如,客户支持聊天机器人需要了解它所服务的具体业 […]

阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型
阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

阿里云发布Qwen2.5 系列模型,最新发布的 Qwen2.5 系列中包括普通的大语言模型 (LLM) 以及针 […]

Libcimbar:无需联网、蓝牙、NFC 扫描二维码即可传输文件
Libcimbar:无需联网、蓝牙、NFC 扫描二维码即可传输文件

Libcimbar 是一个用于数据传输的工具,通过一种特殊的二维条码格式(色彩图标矩阵条码)来进行隔空数据传输 […]

YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频
YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频

YouTube Shorts 将引入Google DeepMind的Veo模型,它允许创作者制作6秒的独立视频 […]

微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能
微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能

微软推出了 Microsoft 365 Copilot 的第二波更新,将网页、工作和 Pages 整合为一个新 […]

Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐
Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐

Seed-Music是一个由字节跳动研发的音乐生成模型,用户可以通过输入多模态数据(如文本描述、音频参考、乐谱 […]

Snap 发布第五代 Spectacles AR 眼镜 内置AI 可通过语音提示直接生成 3D 动画
Snap 发布第五代 Spectacles AR 眼镜 内置AI 可通过语音提示直接生成 3D 动画

Snap公司发布了第五代SpectaclesAR 眼镜,新版Spectacles具备更高质量的显示效果和更长的 […]

Luma AI 推出 Dream Machine API 开发者可将AI视频生成能力无缝集成到自己的产品中
Luma AI 推出 Dream Machine API 开发者可将AI视频生成能力无缝集成到自己的产品中

Luma AI 正式发布其创新产品 Dream Machine API。该 API 为开发者提供了世界上最受欢 […]

Runway推出其视频生成模型的API 方便开发者集成到应用中 但是有一些特殊要求
Runway推出其视频生成模型的API 方便开发者集成到应用中 但是有一些特殊要求

Runway宣布推出其视频生成模型的API。该API旨在帮助开发者和公司将Runway的生成式AI模型集成到第 […]

Playground v3 技术报告 :完全整合了大语言模型的图像生成模型 精细的图像生成与控制能力
Playground v3 技术报告 :完全整合了大语言模型的图像生成模型 精细的图像生成与控制能力

Playground v3(PGv3)是由Playground开发的一种文本到图像生成模型,其基于最新的大语言 […]

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链
g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1 是一个使用 Llama-3.1 70b 模型在 Groq 上创建类似 o1 的推理链的实验性应用。其主要 […]

StoryTribe :一个免费的在线故事板制作工具 无需绘画技能轻松制作故事板
StoryTribe :一个免费的在线故事板制作工具 无需绘画技能轻松制作故事板

故事板是一种视觉工具,用于通过一系列框架描绘故事或概念,类似于漫画。它最初用于电影行业,帮助有效规划和传达想法 […]

李飞飞的空间智能公司World Labs正式成立 获得 2.3 亿美元融资 估值10亿美金
李飞飞的空间智能公司World Labs正式成立 获得 2.3 亿美元融资 估值10亿美金

斯坦福大学教授李飞飞的新公司 World Labs 成功融资 2.3 亿美元。李飞飞被誉为“AI教母”,她的公 […]

GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务
GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务

GOT-OCR2.0 是一种用于光学字符识别(OCR)任务的通用模型,旨在解决传统OCR系统(OCR-1.0) […]

PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征
PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征

PuLID(Pure and Lightning ID Customization via Contrasti […]

GameGen-O:可以生成开放世界游戏的模型 自动生成角色、场景、动作和事件
GameGen-O:可以生成开放世界游戏的模型 自动生成角色、场景、动作和事件

GameGen-O是一个专为生成开放世界视频游戏而设计的Diffusion Transforme模型。该模型能 […]

使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题
使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

随着大语言模型(如GPT-4、Claude等)的发展,LLM在处理数学问题上取得了显著进展。然而,这些模型的能 […]

OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解
OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解

OpenAI发布了全新的o1-preview” 推理模型系列,这是一个设计用于解决复杂问题的 AI 系列,能够 […]

OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反

OpenAI公布了其最新的o1 模型官方提示词建议,OpenAI明确表示模型在简单的提示下表现最佳。一些提示工 […]

Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格
Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格

Suno推出Covers功能,通过Cover功能,你可以将任何音频,从简单的录音到完整制作的歌曲,转化为一种全 […]


1 3 4 5 6 7 31