Salesforce AI宣布开源🍃MINT-1T,这是首个拥有一万亿个Token的多模态交织数据集。包含一万 […]
Diffree是一种基于扩散模型的图像编辑工具,专门用于在图像中通过文本描述添加对象。它不需要用户手动绘制任何 […]
谷歌研究团队开发了一种名为“Alchemist”的方法,允许用户在保持照片真实感的同时,对图像中对象的材料属性 […]
ViPer(Visual Personalization of Generative Models via I […]
Surgical Robot Transformer (SRT) 是一个通过模仿学习在达芬奇手术机器人(da […]
Synchron的脑机接口(BCI)正在试验将ChatGPT整合到其脑机系统中,以使瘫痪患者更容易控制他们的数 […]
Meta AI 宣布推出新一代的Segment Anything Model (SAM) 2,能够在视频和图像 […]
该项目是一个实时打字翻译软件,提供语音实时打字、语音实时翻译功能,尤其适用于游戏(如LOL)的语音打字输入。其 […]
Meta AI推出 AI Studio 平台,让用户可以创建、分享和发现 AI 角色。这个平台基于 Llam […]
生数科技的 Vidu 模型直接开放了 官方称不到30秒可以生成一个4秒钟的视频… 根据演示视频来看,效果还不错 […]
7月23日消息,Mozilla公司的Thunderbird团队在时隔24年后,终于为使用GNOME和KDE桌面 […]
经过近一年的调查,英特尔终于找到了第 13/14 代桌面处理器在某些情况下出现不稳定甚至崩溃的原因。这些问题通 […]
四月份时有消息称,Telegram 桌面版存在一个高危安全漏洞,攻击者只需发送特制的媒体文件,就能在无需用户交 […]
最近,全球范围内因CrowdStrike导致的大规模BSOD(蓝屏死机)事件引发热议。各地企业遭遇蓝屏问题,造 […]
为了平衡广告网络与隐私保护之间的矛盾,谷歌多年前宣布将逐步淘汰第三方Cookies,避免广告网络直接追踪用户。 […]
正如预期的那样,Meta 今天发布了 Llama 3.1 系列 AI 模型。Llama 3.1 系列包括三种模 […]
一、下载官方的FFmpeg 访问 FFmpeg的官网链接:https://ffmpeg.org ,然后点击右侧 […]
视频播放器 https://liveportrait.github.io/src/video/all_cros […]
5 月,网上开始流传 OpenAI 即将在 5 月 13 日的春季媒体发布会上推出自己的搜索引擎的传言。这些报 […]
1.配置系统应答文件:【点击前往】 2.系统镜像编辑器:【点击下载】 3.Windows 系统镜像官方下载 […]
1.本地电脑安装的硬件要求: Windows:3060以上显卡+8G以上显存+16G内存,硬盘空间至少20 […]
微软本周已为Beta、Canary和Release Preview频道发布了新的 Windows 11 Ins […]
Llama系列大语言模型是由MetaAI开源的一系列大语言模型。作为最早开源的大语言模型,Llama系列对大模 […]
大型语言模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。然而,协调智能体合 […]
Mem0为大语言模型提供了一层智能的、自我改进的记忆层,用于大语言模型(LLM),以实现跨应用程序的个性化AI […]
多模态大语言模型(MLLMs)已经在理解图像和文本方面取得了很大的进展,但在如何表示和整合这两种类型的信息方面 […]
Live_Portrait_Monitor 基于快手的这个 LivePortrait 项目,实现了摄像头驱动图 […]
前几天介绍了Quivr,一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。不过Quivr侧重的是将你已有 […]
WayveScenes101 是一个用于自动驾驶应用的高分辨率图像数据集,主要用于新视角合成(novel vi […]
AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频内容转结构化笔记系统。它的主要功能 […]
Salesforce AI宣布开源🍃MINT-1T,这是首个拥有一万亿个Token的多模态交织数据集。包含一万 […]