2VEdit 是一种基于图像到视频扩散模型的视频编辑方法,其核心思想是通过编辑视频中的单个画面(第一帧),然后 […]
RAG 2.0,终于把RAG做对了! 原文链接:https://pub.towardsai.net/rag-2 […]
Ollama与LM Studio 在IT行业,选择合适的工具就像挑选一把适合自己手型的瑞士军刀,既需要精准又 […]
新的 Notion AI 集成了搜索、生成内容、分析数据和智能聊天等功能,所有操作都可以在 Notion 内部 […]
Meta AI 发布Orion AR眼镜,这是是一款具有潜力的增强现实设备,旨在替代智能手机。Meta 公司介 […]
Meta AI 发布 Llama 3.2多模态AI模型,旨在提供强大的自然语言处理和图像理解能力。其设计目标是 […]
Molmo 一个开源的先进多模态人工智能模型,旨在提高开放系统在性能上与专有系统(如商业模型)之间的竞争力,特 […]
FaceFusion 是一个用于面部交换、深度伪造的项目,在经历了四个月的高强度工作后,FaceFusion宣 […]
Google发布了一篇文章,详细介绍了185个来自全球各大企业的生成式AI实际应用案例。 这些案例展示了生成式 […]
还记得月初刚发布时就让大家惊艳不已的字节新项目Loopy吗? 这个让数字人声音完美匹配画面还匹配表情和情绪的对 […]
1 适用场景 · 需要多步组合、选择路径的复杂问题。 · · 该问题可以被拆分成多个子模块,每个子模块都能清晰 […]
不久前,dify发布了新的workflow,于是乎我写了这样一篇文章: · Dify Workflow:打造你 […]
项目简介 RAGFlow是一个开源的RAG引擎,专注于深入的文档理解。该项目提供了一个简化的RAG工作流,适用 […]
MIMO是一个生成虚拟角色动画的工具。它能够让用户通过一张图片和简单的动作信息(如图片、动作序列或视频),生成 […]
使用前重要提醒:需彻底关闭之前的WARP+软件客户端和进程,旧版本要升级到最新版 1、WARP+ 最新版官 […]
从科技圈最新动态来看,最近AI代码生成概念实火。 可是,小伙伴们有没有感觉,AI刷程序题比较亮眼,到了企业真实 […]
大家好,我是言川。我今天又来给大家分享AI教程了,本期教程主角就是ComfyUI入门教程,本篇长文教程也是为了 […]
随着o1 模型的发布,OpenAI提出了一种全新的大规模推理模型(Large Reasoning Model, […]
字节跳动今天发布一些列新的模型。包括音乐模型,同声传译模型、文生图2.0模型、新的基于DIT的视频生成模型、豆 […]
大语言模型(LLMs)在数学问题解决和代码生成等推理和科学领域展现了强大的能力。然而,当前的LLMs在“自我纠 […]
n8n推出了Self-Hosted AI Starter Kit 自托管 AI 入门工具包,帮助用户在本地或私 […]
今天我们继续剖析 RAG,将为大家详细介绍 RAG 背后的例如 Embedding、Transformer、 […]
Moshi 是一个多流(multi-stream)的实时语音到语音生成 Transformer 模型,支持全双 […]
Sketch 发布 Smart Animate 新功能,用于在设原型计中加入流畅的动画效果。通过 Smart […]
看到各种专业的Prompt,你是不是很羡慕? 写一份专业的Prompt,你觉得需要多久呢? 今天,我来分享一个 […]
PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频格式,如播客、讲座或摘要。该项目利用 Ope […]
这段视频展示了如何修改TI-84计算器,让 TI-84 计算器能够执行如联网聊天、下载作弊小抄、访问 GPT […]
1、ComfyUI Flux.1 【点击获取】 2、Lora 真人模型【点击下载】 3、工作流 【点击下载 […]
OpenAI 首席科学家,也是OpenAI o1模型团队的主要成员Hyung Won Chung,在 MIT […]
扩散模型(Diffusion Models)在文本引导图像生成领域中表现出强大的生成能力,允许用户通过自然语言 […]
2VEdit 是一种基于图像到视频扩散模型的视频编辑方法,其核心思想是通过编辑视频中的单个画面(第一帧),然后 […]