Ai资讯 - 第 7 页 - 智汇宝库

首页 > Ai资讯

2VEdit ：一种基于图像到视频扩散模型视频编辑方法只需编辑第一帧即可应用到整个视频效果

2VEdit ：一种基于图像到视频扩散模型视频编辑方法只需编辑第一帧即可应用到整个视频效果

2VEdit 是一种基于图像到视频扩散模型的视频编辑方法，其核心思想是通过编辑视频中的单个画面（第一帧），然后 […]

RAG 2.0，终于把RAG做对了！

RAG 2.0，终于把RAG做对了！

RAG 2.0，终于把RAG做对了！原文链接：https://pub.towardsai.net/rag-2 […]

高效选择：Ollama与LM Studio深度对比

高效选择：Ollama与LM Studio深度对比

Ollama与LM Studio 在IT行业，选择合适的工具就像挑选一把适合自己手型的瑞士军刀，既需要精准又 […]

Notion 发布全新的Notion AI 集成搜索、生成内容、分析数据和智能聊天等功能

Notion 发布全新的Notion AI 集成搜索、生成内容、分析数据和智能聊天等功能

新的 Notion AI 集成了搜索、生成内容、分析数据和智能聊天等功能，所有操作都可以在 Notion 内部 […]

Meta AI 发布Orion AR眼镜眼镜集成了能够感知周围环境的AI 目标是替代智能手机

Meta AI 发布Orion AR眼镜眼镜集成了能够感知周围环境的AI 目标是替代智能手机

Meta AI 发布Orion AR眼镜，这是是一款具有潜力的增强现实设备，旨在替代智能手机。Meta 公司介 […]

Meta AI 发布 Llama 3.2 多模态AI模型性能与GPT4o-mini 相当能够在边缘设备上高效运行

Meta AI 发布 Llama 3.2 多模态AI模型性能与GPT4o-mini 相当能够在边缘设备上高效运行

Meta AI 发布 Llama 3.2多模态AI模型，旨在提供强大的自然语言处理和图像理解能力。其设计目标是 […]

Molmo 一个完全开源的多模态模型支持2D指向交互性能仅次于GPT-4o

Molmo 一个完全开源的多模态模型支持2D指向交互性能仅次于GPT-4o

Molmo 一个开源的先进多模态人工智能模型，旨在提高开放系统在性能上与专有系统（如商业模型）之间的竞争力，特 […]

换脸应用 FaceFusion 升级为 “面部操控平台” 支持面部表情恢复迁移编辑

换脸应用 FaceFusion 升级为 “面部操控平台” 支持面部表情恢复迁移编辑

FaceFusion 是一个用于面部交换、深度伪造的项目，在经历了四个月的高强度工作后，FaceFusion宣 […]

Google发布全球185个各大企业的生成式AI实际应用落地案例

Google发布全球185个各大企业的生成式AI实际应用落地案例

Google发布了一篇文章，详细介绍了185个来自全球各大企业的生成式AI实际应用案例。这些案例展示了生成式 […]

数字人起飞！字节Loopy对口型功能在即梦上线可根据语境匹配表情和情绪

数字人起飞！字节Loopy对口型功能在即梦上线可根据语境匹配表情和情绪

还记得月初刚发布时就让大家惊艳不已的字节新项目Loopy吗? 这个让数字人声音完美匹配画面还匹配表情和情绪的对 […]

Agent具体实现

Agent具体实现

1 适用场景 · 需要多步组合、选择路径的复杂问题。 · · 该问题可以被拆分成多个子模块，每个子模块都能清晰 […]

搞了一个Dify开源知识库

搞了一个Dify开源知识库

不久前，dify发布了新的workflow，于是乎我写了这样一篇文章： · Dify Workflow：打造你 […]

RAGFlow：开源的RAG引擎，专注于深入的文档理解，支持处理各种复杂格式的非结构化数据

RAGFlow：开源的RAG引擎，专注于深入的文档理解，支持处理各种复杂格式的非结构化数据

项目简介 RAGFlow是一个开源的RAG引擎，专注于深入的文档理解。该项目提供了一个简化的RAG工作流，适用 […]

MIMO：给定一个参考图像、视频几分钟即可生成一个可以控制动作和场景的动画人物

MIMO：给定一个参考图像、视频几分钟即可生成一个可以控制动作和场景的动画人物

MIMO是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息（如图片、动作序列或视频），生成 […]

Cloudflare WARP+新增 MASQUE 加密协议！无限流量，不限速！！

Cloudflare WARP+新增 MASQUE 加密协议！无限流量，不限速！！

使用前重要提醒：需彻底关闭之前的WARP+软件客户端和进程，旧版本要升级到最新版 1、WARP+ 最新版官 […]

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

从科技圈最新动态来看，最近AI代码生成概念实火。可是，小伙伴们有没有感觉，AI刷程序题比较亮眼，到了企业真实 […]

从零开始：构建你的首个ComfyUI工作流

从零开始：构建你的首个ComfyUI工作流

大家好，我是言川。我今天又来给大家分享AI教程了，本期教程主角就是ComfyUI入门教程，本篇长文教程也是为了 […]

OpenAI 推理模型 o1 评估研究报告准确率高达 97.8% 远超其他 LLM 模型但成本很高

OpenAI 推理模型 o1 评估研究报告准确率高达 97.8% 远超其他 LLM 模型但成本很高

随着o1 模型的发布，OpenAI提出了一种全新的大规模推理模型（Large Reasoning Model， […]

字节跳动发布一些列新的模型包括基于DIT的视频生成模型、音乐模型，同声传译模型等

字节跳动发布一些列新的模型包括基于DIT的视频生成模型、音乐模型，同声传译模型等

字节跳动今天发布一些列新的模型。包括音乐模型，同声传译模型、文生图2.0模型、新的基于DIT的视频生成模型、豆 […]

Google DeepMind 推出通过强化学习实现自我纠正（SCoRe）的训练方法提高模型在复杂数学和编码任务中的准确性

Google DeepMind 推出通过强化学习实现自我纠正（SCoRe）的训练方法提高模型在复杂数学和编码任务中的准确性

大语言模型（LLMs）在数学问题解决和代码生成等推理和科学领域展现了强大的能力。然而，当前的LLMs在“自我纠 […]

n8n推出自托管 AI 入门工具包可在本地快速部署AI项目和低代码开发环境

n8n推出自托管 AI 入门工具包可在本地快速部署AI项目和低代码开发环境

n8n推出了Self-Hosted AI Starter Kit 自托管 AI 入门工具包，帮助用户在本地或私 […]

RAG 修炼手册｜一文讲透 RAG 背后的技术

RAG 修炼手册｜一文讲透 RAG 背后的技术

今天我们继续剖析 RAG，将为大家详细介绍 RAG 背后的例如 Embedding、Transformer、 […]

Moshi：实时语音到语音生成 Transformer 开源模型 160毫秒低延迟支持随时打断和情感表达

Moshi：实时语音到语音生成 Transformer 开源模型 160毫秒低延迟支持随时打断和情感表达

Moshi 是一个多流（multi-stream）的实时语音到语音生成 Transformer 模型，支持全双 […]

Sketch 推出 Smart Animate 新功能可在原型设计中加入流畅的动画效果

Sketch 推出 Smart Animate 新功能可在原型设计中加入流畅的动画效果

Sketch 发布 Smart Animate 新功能，用于在设原型计中加入流畅的动画效果。通过 Smart […]

不用再羡慕Prompt大神了！看了这篇文章，你只需10秒钟，就能拥有自己想要的专业级Prompt！

不用再羡慕Prompt大神了！看了这篇文章，你只需10秒钟，就能拥有自己想要的专业级Prompt！

看到各种专业的Prompt,你是不是很羡慕？写一份专业的Prompt，你觉得需要多久呢？今天，我来分享一个 […]

PDF2Audio：将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio：将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio 是一个开源项目，旨在将 PDF 文件转换为音频格式，如播客、讲座或摘要。该项目利用 Ope […]

将TI-84计算器改装连接到互联网并接入ChatGPT 实现作弊功能

将TI-84计算器改装连接到互联网并接入ChatGPT 实现作弊功能

这段视频展示了如何修改TI-84计算器，让 TI-84 计算器能够执行如联网聊天、下载作弊小抄、访问 GPT […]

Flux.1【Lora 真人模型】轻松生成真实质感的美图！

Flux.1【Lora 真人模型】轻松生成真实质感的美图！

1、ComfyUI Flux.1 【点击获取】 2、Lora 真人模型【点击下载】 3、工作流【点击下载 […]

OpenAI 首席科学家MIT演讲：揭示 o1模型训练核心激励模型学习是培养 AGI 的最佳方式

OpenAI 首席科学家MIT演讲：揭示 o1模型训练核心激励模型学习是培养 AGI 的最佳方式

OpenAI 首席科学家，也是OpenAI o1模型团队的主要成员Hyung Won Chung，在 MIT […]

TurboEdit：基于文本提示实现亚秒级实时图像编辑相比传统方法实现了 6到630倍的速度提升

TurboEdit：基于文本提示实现亚秒级实时图像编辑相比传统方法实现了 6到630倍的速度提升

扩散模型（Diffusion Models）在文本引导图像生成领域中表现出强大的生成能力，允许用户通过自然语言 […]

1 … 5 6 7 8 9 … 129