首页 > Ai资讯
XX来信: 智能体设计模式2:Reflection
XX来信: 智能体设计模式2:Reflection

亲爱的朋友们, 之前我介绍了AI智能体工作流的四种设计模式,我相信它们将在今年推动重大进展:Reflectio […]

使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化

Dify 团队推出了包含 AI Workflow 新功能的v0.6.0[2],这个功能虽然从去年年底就在做了, […]

宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家

核电行业是工业场景中相对复杂、安全性能要求极高的场景。如果 AI 大模型在如此复杂的场景中被验证可行,其经验将 […]

Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向
Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向

Sieve推出专门用于目光矫正(eye contact correction)的API服务。这一API旨在让讲 […]

炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

突出多模态能力和交互体验的 GPT-4o 强调了其在实际应用中的关键作用,然而它缺乏一个高性能的开源对应物。在 […]

世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!

TurtleBot的机器人操作系统ROS, 开源了!!github开源排名很高 Turtlebot3 的 RO […]

阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具,名为Marco MT。 阿里巴巴称,这款工具在翻译性能 […]

Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作
Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作

现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体 […]

所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用

AlphaFold 3再登Nature! 这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所 […]

Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能,尤其是名为Generative Exte […]

Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来
Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具,旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统
F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音(Text-to-Speech, TTS)系统,该系统基于流匹配技 […]

One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

为什么大佬都在说Agent是未来?换个角度来谈一谈
为什么大佬都在说Agent是未来?换个角度来谈一谈

很多AI领域大佬,如吴恩达,Karpathy都表示看好Agent,将其作为未来最有潜力的方向。有关这样的文章也 […]

微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!

微软最近推出了一款新的小型人工智能模型,名为 Phi-3 Mini。这个模型在多项性能测试中均比之前公认的顶尖 […]

@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作
OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架,专门用于构建、编排 […]

Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁
Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁

Anthropic 的 CEO Dario Amodei发表了一篇名为《机器爱的恩宠》的文章,讨论了强大人工智 […]

Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构
Meta AI推出 Meta MovieGen AI 视频生成模型 抛弃扩散模型 使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型,用于创建沉浸式视频和音频内容。它是媒体生成 […]

Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成
Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成

StackBlitz 推出了 Bolt․new,这是一款结合了 AI 与 WebContainers 技术的强 […]

人工智能能否读取你的思想?
人工智能能否读取你的思想?

在这一期 TED AI Show 中,伦理学家兼法律学者 Nita Farahany 讨论了神经技术的快速发展 […]

PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人

PimEyes 是一个人脸识别搜索引擎和反向图像搜索工具,旨在帮助用户找到哪些网站发布了他们的照片。它允许用户 […]

Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具
Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具

Voice-Pro 是一个基于Gradio Web-UI的集成解决方案,专注于语音转录、翻译和文本转语音(TT […]

采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域
采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域

陶哲轩(Terence Tao),加州大学洛杉矶分校(UCLA)的数学教授,被誉为“数学界的莫扎特”,他被广泛 […]

使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势
使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势

手语是聋哑人之间以及他们与外界沟通的重要工具,然而,许多不会手语的人无法与他们有效交流。这个项目的目标是通过自 […]

Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆 […]

TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]

PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度

PMRF(Posterior-Mean Rectified Flow,后验均值修正流)是一种新提出的图像恢复算 […]

Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容
Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy-Demo 是一个开源的 Python 项目,可以将各种文本内容(例如网页、PDF 文档)转 […]

Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%
Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50%

Anthropic 推出的 Message Batches API ,专门用于帮助开发者批量处理大量请求。它的 […]


1 3 4 5 6 7 129