Ai资讯 - 第 5 页 - 智汇宝库

首页 > Ai资讯

XX来信：智能体设计模式2：Reflection

XX来信：智能体设计模式2：Reflection

亲爱的朋友们, 之前我介绍了AI智能体工作流的四种设计模式，我相信它们将在今年推动重大进展：Reflectio […]

使用 Dify 和 Moonshot API 构建你的 AI 工作流（一）：让不 AI 的应用 AI 化

使用 Dify 和 Moonshot API 构建你的 AI 工作流（一）：让不 AI 的应用 AI 化

Dify 团队推出了包含 AI Workflow 新功能的v0.6.0[2]，这个功能虽然从去年年底就在做了， […]

宁德核电推出全球参数量最大的核工业大模型｜InfoQ 独家

宁德核电推出全球参数量最大的核工业大模型｜InfoQ 独家

核电行业是工业场景中相对复杂、安全性能要求极高的场景。如果 AI 大模型在如此复杂的场景中被验证可行，其经验将 […]

Eye Contact：目光矫正 API 自动调整视频、直播中眼睛的视线方向

Eye Contact：目光矫正 API 自动调整视频、直播中眼睛的视线方向

Sieve推出专门用于目光矫正（eye contact correction）的API服务。这一API旨在让讲 […]

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

突出多模态能力和交互体验的 GPT-4o 强调了其在实际应用中的关键作用，然而它缺乏一个高性能的开源对应物。在 […]

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

TurtleBot的机器人操作系统ROS，开源了！！github开源排名很高 Turtlebot3 的 RO […]

阿里巴巴推出升级版AI翻译工具：Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴推出升级版AI翻译工具：Marco MT 性能超越Google、DeepL和ChatGPT

阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具，名为Marco MT。阿里巴巴称，这款工具在翻译性能 […]

Power-over-Skin “皮肤供电”技术让可穿戴设备无需电池也能工作

Power-over-Skin “皮肤供电”技术让可穿戴设备无需电池也能工作

现代计算设备功能强大且小巧，可以轻松佩戴在身体上。然而，电池成为设计和用户体验的主要障碍，增加了设备的重量和体 […]

所有生命分子一夜皆可AI预测！AlphaFold 3改变人类对生命的理解，全球科学家都能免费使用

所有生命分子一夜皆可AI预测！AlphaFold 3改变人类对生命的理解，全球科学家都能免费使用

AlphaFold 3再登Nature！这次重磅升级，不再仅限于蛋白质结构预测——可以以前所未有的精度预测所 […]

Adobe Premiere Pro 推出多项新的生成式AI功能大幅提高视频编辑效率

Adobe Premiere Pro 推出多项新的生成式AI功能大幅提高视频编辑效率

Adobe Premiere Pro 正在推出多项新的生成式AI功能，尤其是名为Generative Exte […]

Augmented Physics：增强现实你的物理课本让你的物理课本上的图表动起来

Augmented Physics：增强现实你的物理课本让你的物理课本上的图表动起来

Augmented Physics 是一个结合机器学习的创作工具，旨在将传统物理教材中的静态图表转换为互动物理 […]

F5-TTS ：支持多语言切换、速度控制、情感表达具有零样本生成能力的TTS系统

F5-TTS ：支持多语言切换、速度控制、情感表达具有零样本生成能力的TTS系统

F5-TTS 是一种完全非自回归的文本转语音（Text-to-Speech, TTS）系统，该系统基于流匹配技 […]

One-Click Creative Template：创意模型用一张卡通图片总结4张真实人物照片

One-Click Creative Template：创意模型用一张卡通图片总结4张真实人物照片

FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker […]

为什么大佬都在说Agent是未来？换个角度来谈一谈

为什么大佬都在说Agent是未来？换个角度来谈一谈

很多AI领域大佬，如吴恩达，Karpathy都表示看好Agent，将其作为未来最有潜力的方向。有关这样的文章也 […]

微软最新模型Phi-3 Mini开源登场！小模型，大未来！!

微软最新模型Phi-3 Mini开源登场！小模型，大未来！!

微软最近推出了一款新的小型人工智能模型，名为 Phi-3 Mini。这个模型在多项性能测试中均比之前公认的顶尖 […]

@MKBHD ：如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

@MKBHD ：如何在 54 分 19 秒 20 毫秒内制作高质量油管视频

继 MRBEAST 内部培训手册曝光后，YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 […]

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架，专门用于构建、编排 […]

Anthropic CEO ：5到10年内 AI将助力人类扫除几乎所有疾病人类寿命有望翻倍达到150岁

Anthropic CEO ：5到10年内 AI将助力人类扫除几乎所有疾病人类寿命有望翻倍达到150岁

Anthropic 的 CEO Dario Amodei发表了一篇名为《机器爱的恩宠》的文章，讨论了强大人工智 […]

Meta AI推出 Meta MovieGen AI 视频生成模型抛弃扩散模型使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型抛弃扩散模型使用Transformer架构

Meta AI推出 Meta MovieGen AI 视频生成模型，用于创建沉浸式视频和音频内容。它是媒体生成 […]

Bolt․new：AI 帮你自动写代码自动运行并自动部署而且全部在浏览器中完成

Bolt․new：AI 帮你自动写代码自动运行并自动部署而且全部在浏览器中完成

StackBlitz 推出了 Bolt․new，这是一款结合了 AI 与 WebContainers 技术的强 […]

人工智能能否读取你的思想？

人工智能能否读取你的思想？

在这一期 TED AI Show 中，伦理学家兼法律学者 Nita Farahany 讨论了神经技术的快速发展 […]

PimEyes ：人脸识别搜索引擎和反向图像搜索工具上传照片帮你追踪照片上的人

PimEyes ：人脸识别搜索引擎和反向图像搜索工具上传照片帮你追踪照片上的人

PimEyes 是一个人脸识别搜索引擎和反向图像搜索工具，旨在帮助用户找到哪些网站发布了他们的照片。它允许用户 […]

Voice-Pro：支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具

Voice-Pro：支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具

Voice-Pro 是一个基于Gradio Web-UI的集成解决方案，专注于语音转录、翻译和文本转语音（TT […]

采访当今最伟大的数学家对AI的看法陶哲轩：我们正踏入数学的全新领域

采访当今最伟大的数学家对AI的看法陶哲轩：我们正踏入数学的全新领域

陶哲轩（Terence Tao），加州大学洛杉矶分校（UCLA）的数学教授，被誉为“数学界的莫扎特”，他被广泛 […]

使用 YOLOv 11 模型实现实时手语检测可同时识别多个手语手势

使用 YOLOv 11 模型实现实时手语检测可同时识别多个手语手势

手语是聋哑人之间以及他们与外界沟通的重要工具，然而，许多不会手语的人无法与他们有效交流。这个项目的目标是通过自 […]

Ebook2Audiobook：将电子书自动转换为有声书支持语音克隆、多种语言

Ebook2Audiobook：将电子书自动转换为有声书支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目，旨在将电子书自动转换为有声书，并支持多种语言、语音克隆 […]

TxT360：一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360：一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens

TxT360 是由 LLM360 创建的一个 Hugging Face 上用于大语言模型训练的数据集。该数据集 […]

PMRF：一种新的图像恢复算法高质量修复图像降低图像失真还原跟自然逼真度

PMRF：一种新的图像恢复算法高质量修复图像降低图像失真还原跟自然逼真度

PMRF（Posterior-Mean Rectified Flow，后验均值修正流）是一种新提出的图像恢复算 […]

Podcastfy：将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy：将任何网页、PDF和文本内容自动生成播客音频内容

Podcastfy-Demo 是一个开源的 Python 项目，可以将各种文本内容（例如网页、PDF 文档）转 […]

Anthropic 推出的 Message Batches API 可以批量处理大量请求价格便宜50%

Anthropic 推出的 Message Batches API 可以批量处理大量请求价格便宜50%

Anthropic 推出的 Message Batches API ，专门用于帮助开发者批量处理大量请求。它的 […]

1 … 3 4 5 6 7 … 129