Ai资讯 - 第 19 页 - 智汇宝库

首页 > Ai资讯

MINT-1T：拥有一万亿Token和34亿张图像的多模态数据集

MINT-1T：拥有一万亿Token和34亿张图像的多模态数据集

Salesforce AI宣布开源🍃MINT-1T，这是首个拥有一万亿个Token的多模态交织数据集。包含一万 […]

Diffree：通过文本描述能自动在图像中找到合适的位置并添加对象

Diffree：通过文本描述能自动在图像中找到合适的位置并添加对象

Diffree是一种基于扩散模型的图像编辑工具，专门用于在图像中通过文本描述添加对象。它不需要用户手动绘制任何 […]

Alchemist：能够在真实图像中随意改变物体的材料属性（粗糙度、金属度、透明度）

Alchemist：能够在真实图像中随意改变物体的材料属性（粗糙度、金属度、透明度）

谷歌研究团队开发了一种名为“Alchemist”的方法，允许用户在保持照片真实感的同时，对图像中对象的材料属性 […]

ViPer：为Stable Diffusion 提供个性化图像生成方法记住你的艺术喜好

ViPer：为Stable Diffusion 提供个性化图像生成方法记住你的艺术喜好

ViPer（Visual Personalization of Generative Models via I […]

斯坦福大学研究成果：让达芬奇机器人能够自动执行外科手术

斯坦福大学研究成果：让达芬奇机器人能够自动执行外科手术

Surgical Robot Transformer (SRT) 是一个通过模仿学习在达芬奇手术机器人（da […]

无需开颅手术 Synchron 将 ChatGPT 整合到其脑机脑机系统中

无需开颅手术 Synchron 将 ChatGPT 整合到其脑机脑机系统中

Synchron的脑机接口（BCI）正在试验将ChatGPT整合到其脑机系统中，以使瘫痪患者更容易控制他们的数 […]

Meta AI 推出新一代SAM 2 可实时在图像或视频中识别出特定对象并进行跟踪

Meta AI 推出新一代SAM 2 可实时在图像或视频中识别出特定对象并进行跟踪

Meta AI 宣布推出新一代的Segment Anything Model (SAM) 2，能够在视频和图像 […]

实时打字翻译工具支持中英文等多种语言的文字和语音实时翻译

实时打字翻译工具支持中英文等多种语言的文字和语音实时翻译

该项目是一个实时打字翻译软件，提供语音实时打字、语音实时翻译功能，尤其适用于游戏（如LOL）的语音打字输入。其 […]

Meta AI推出AI Studio平台基于lama 3.1 用户可以自己创建自己的AI角色

Meta AI推出AI Studio平台基于lama 3.1 用户可以自己创建自己的AI角色

Meta AI推出 AI Studio 平台，让用户可以创建、分享和发现 AI 角色。这个平台基于 Llam […]

生数科技的 Vidu 视频模型开放 Sora架构可模仿真实物理世界开放了API申请

生数科技的 Vidu 视频模型开放 Sora架构可模仿真实物理世界开放了API申请

生数科技的 Vidu 模型直接开放了官方称不到30秒可以生成一个4秒钟的视频… 根据演示视频来看，效果还不错 […]

Thunderbird 终于修复Linux通知bug！该问题存在长达24年

Thunderbird 终于修复Linux通知bug！该问题存在长达24年

7月23日消息，Mozilla公司的Thunderbird团队在时隔24年后，终于为使用GNOME和KDE桌面 […]

历时1年！英特尔终于找到13/14代CPU 不稳定原因，受影响用户可联系更换

历时1年！英特尔终于找到13/14代CPU 不稳定原因，受影响用户可联系更换

经过近一年的调查，英特尔终于找到了第 13/14 代桌面处理器在某些情况下出现不稳定甚至崩溃的原因。这些问题通 […]

Telegram 的高危漏洞！暴露至少五周被黑客利用才被修复

Telegram 的高危漏洞！暴露至少五周被黑客利用才被修复

四月份时有消息称，Telegram 桌面版存在一个高危安全漏洞，攻击者只需发送特制的媒体文件，就能在无需用户交 […]

微软终于推出新的修复工具，排除 CrowdStrike导致的蓝屏死机问题！

微软终于推出新的修复工具，排除 CrowdStrike导致的蓝屏死机问题！

最近，全球范围内因CrowdStrike导致的大规模BSOD（蓝屏死机）事件引发热议。各地企业遭遇蓝屏问题，造 […]

谷歌放弃Chrome隐私计划，遭EFF严厉抨击！

谷歌放弃Chrome隐私计划，遭EFF严厉抨击！

为了平衡广告网络与隐私保护之间的矛盾，谷歌多年前宣布将逐步淘汰第三方Cookies，避免广告网络直接追踪用户。 […]

Llama 3.1 最新开源大模型！全球最大、功能最强大的开放式基础模型，附免费下载链接！

Llama 3.1 最新开源大模型！全球最大、功能最强大的开放式基础模型，附免费下载链接！

正如预期的那样，Meta 今天发布了 Llama 3.1 系列 AI 模型。Llama 3.1 系列包括三种模 […]

FFmpeg 安装教程！超详细，手把手详解整个设置过程

FFmpeg 安装教程！超详细，手把手详解整个设置过程

一、下载官方的FFmpeg 访问 FFmpeg的官网链接：https://ffmpeg.org ，然后点击右侧 […]

LivePortrait 本地部署教程，强大且开源的可控人像AI视频生成

LivePortrait 本地部署教程，强大且开源的可控人像AI视频生成

视频播放器 https://liveportrait.github.io/src/video/all_cros […]

OpenAI 正式发布其搜索引擎 SearchGPT 原型！附最新开通链接

OpenAI 正式发布其搜索引擎 SearchGPT 原型！附最新开通链接

5 月，网上开始流传 OpenAI 即将在 5 月 13 日的春季媒体发布会上推出自己的搜索引擎的传言。这些报 […]

创建无人值守、高度自定义的纯净 Windows 11/10 系统镜像！

创建无人值守、高度自定义的纯净 Windows 11/10 系统镜像！

1.配置系统应答文件：【点击前往】 2.系统镜像编辑器：【点击下载】 3.Windows 系统镜像官方下载 […]

本地部署 Llama3.1 最强开源大模型！支持 Windows、MacOS

本地部署 Llama3.1 最强开源大模型！支持 Windows、MacOS

1.本地电脑安装的硬件要求： Windows：3060以上显卡+8G以上显存+16G内存，硬盘空间至少20 […]

Windows Insider 支持在文件资源管理器中远程访问 Android 手机文件

Windows Insider 支持在文件资源管理器中远程访问 Android 手机文件

微软本周已为Beta、Canary和Release Preview频道发布了新的 Windows 11 Ins […]

重磅！Meta开源4050亿参数的大模型Llama3.1-405B！多项评测结果超GPT-4o和Claude3.5 Sonnet

重磅！Meta开源4050亿参数的大模型Llama3.1-405B！多项评测结果超GPT-4o和Claude3.5 Sonnet

Llama系列大语言模型是由MetaAI开源的一系列大语言模型。作为最早开源的大语言模型，Llama系列对大模 […]

[论文] 阿里提出AgentScope：灵活强大的智能体框架

[论文] 阿里提出AgentScope：灵活强大的智能体框架

大型语言模型（LLMs）的快速发展是的多智能体（Multi-Agent）应用取得了显著进展。然而，协调智能体合 […]

Mem0：为大语言模型提供永久记忆能力实现跨应用程序的个性化AI体验

Mem0：为大语言模型提供永久记忆能力实现跨应用程序的个性化AI体验

Mem0为大语言模型提供了一层智能的、自我改进的记忆层，用于大语言模型（LLM），以实现跨应用程序的个性化AI […]

E5-V：多模态大语言模型的通用嵌入统一不同模态的“嵌入表示”

E5-V：多模态大语言模型的通用嵌入统一不同模态的“嵌入表示”

多模态大语言模型（MLLMs）已经在理解图像和文本方面取得了很大的进展，但在如何表示和整合这两种类型的信息方面 […]

Live_Portrait_Monitor ：利用摄像头驱动静态图像转换为实时动态视频

Live_Portrait_Monitor ：利用摄像头驱动静态图像转换为实时动态视频

Live_Portrait_Monitor 基于快手的这个 LivePortrait 项目，实现了摄像头驱动图 […]

【开源看AI】4.2K star！Reor：AI自动帮你发现知识之间的连接

【开源看AI】4.2K star！Reor：AI自动帮你发现知识之间的连接

前几天介绍了Quivr，一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。不过Quivr侧重的是将你已有 […]

WayveScenes101：一个用于自动驾驶应用的高分辨率图像数据集

WayveScenes101：一个用于自动驾驶应用的高分辨率图像数据集

WayveScenes101 是一个用于自动驾驶应用的高分辨率图像数据集，主要用于新视角合成（novel vi […]

AudioNotes：音视频内容转笔记系统快速提取音视频的内容并转成Markdown笔记

AudioNotes：音视频内容转笔记系统快速提取音视频的内容并转成Markdown笔记

AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频内容转结构化笔记系统。它的主要功能 […]

1 … 17 18 19 20 21 … 129