Ai资讯 - 第 78 页 - 智汇宝库

首页 > Ai资讯

一种革命性的开源系统现在你可以在家训练一个70B的大语言模型了

一种革命性的开源系统现在你可以在家训练一个70B的大语言模型了

Answer.AI发布了一个基于FSDP（Fully Sharded Data Parallel，完全分片数据 […]

SST：对情感的高维度理解和映射让机器更真实地模拟人类情感

SST：对情感的高维度理解和映射让机器更真实地模拟人类情感

Hume AI的博客文章《什么是语义空间理论？》介绍了一个先进的理解情感的方法：语义空间理论（SST）。这种方 […]

SLD：图像生成模型自动校正技术能编辑和修复各类模型生成的图像

SLD：图像生成模型自动校正技术能编辑和修复各类模型生成的图像

SLD是一种自我纠正的LLM控制扩散框架，它通过结合大型语言模型的检测能力，使图像生成模型能够更加精准地根据文 […]

Whomane：不到100美金AI Pin替代一个开源的人工智能可穿戴相机设备

Whomane：不到100美金AI Pin替代一个开源的人工智能可穿戴相机设备

Whomane是一款价格便宜且方便组装的开源可穿戴设备，只需几分钟即可完成组装。它只有四个组件：相机、按钮、电 […]

加拿大国防部和加拿大武装部队发布人工智能战略加速AI战斗部署

加拿大国防部和加拿大武装部队发布人工智能战略加速AI战斗部署

加拿大国防部和加拿大武装部队发布了一个人工智能（AI）战略，目标是到2030年，利用AI技术改善他们的工作和操 […]

Inflection AI发布Inflection-2.5模型只用四成功力就匹敌GPT 4

Inflection AI发布Inflection-2.5模型只用四成功力就匹敌GPT 4

Inflection AI发布Inflection-2.5版本模型只用了四成功力就匹敌GPT 4性能，具有高 […]

Google发布Gemini 1.5 Pro 技术报告：为多模态混合专家模型

Google发布Gemini 1.5 Pro 技术报告：为多模态混合专家模型

Gemini 1.5 Pro 是由 Google Gemini 团队开发的一款多模态混合专家模型，它标志着人工 […]

ELLA：使用LLM来增强扩散模型的语义对齐

ELLA：使用LLM来增强扩散模型的语义对齐

ELLA（Efficient Large Language Model Adapter）是由腾讯开发的一个先进 […]

Paper Piano 纸钢琴：通过摄像头将任何一张纸变成一架钢琴

Paper Piano 纸钢琴：通过摄像头将任何一张纸变成一架钢琴

Paper Piano，通过摄像头捕捉手指的运动，在纸张上实现弹钢琴的功能，让人们无需购买真正的钢琴即可演奏音 […]

Midjourney 角色人物一致性功能上线复杂文本理解能力提升

Midjourney 角色人物一致性功能上线复杂文本理解能力提升

Midjourney 角色人物一致性功能上线适用于 MJ6 和 Niji6 型号 Support autho […]

Google发明了一种新型的模型窃取攻击方法成功攻破ChatGPT

Google发明了一种新型的模型窃取攻击方法成功攻破ChatGPT

Google发表了一篇论文，介绍了一种新型的模型窃取攻击方法，这种方法能够从像OpenAI的ChatGPT或G […]

YOLOv8：目标检测跟踪模型快速准确识别和定位图像中多个对象

YOLOv8：目标检测跟踪模型快速准确识别和定位图像中多个对象

YOLOv8：目标检测跟踪模型 YOLOv8能够在图像或视频帧中快速准确地识别和定位多个对象，还能跟踪它们的移 […]

英伟达推出生成式AI专家认证费用135美元

英伟达推出生成式AI专家认证费用135美元

NVIDIA推出了面向生成式AI和大语言模型（LLMs）的认证项目，名为NCA Generative AI L […]

Command-R：高性能企业级语言模型跨语言交互与自动化工具集成

Command-R：高性能企业级语言模型跨语言交互与自动化工具集成

Command-R是Cohere推出的一种新型大语言模型，旨在实现可扩展的生成模型，专注于检索增强生成（RAG […]

2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台

2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台

Meta 正在打造一套超大规模的人工智能计算平台，他们宣布推出了两个包含 24000GPU 的集群。这些不是普 […]

Devin：全球首位AI软件工程师通过了顶尖 AI 公司真实面试，并能完成真正的工作

Devin：全球首位AI软件工程师通过了顶尖 AI 公司真实面试，并能完成真正的工作

Cognition 实验室发布了世界上第一位完全自主的 AI 软件工程师：Devi。具备自学新语言、开发迭 […]

Perplexity 接入 Yelp 的评论数据融入到其聊天机器人服务中

Perplexity 接入 Yelp 的评论数据融入到其聊天机器人服务中

Perplexity 将 Yelp 的评论数据融入到其聊天机器人服务中当你在考虑去哪家咖啡厅时，Perple […]

Hotshot ACT-1：一个全新的文本转视频模型更贴近生活现实

Hotshot ACT-1：一个全新的文本转视频模型更贴近生活现实

Hotshot ACT-1：一个全新、出色的文本转视频模型 ACT 1 能够以不同的宽高比产生高清视频 Sup […]

Transformer Debugger：OpenAI开源专门研究模型工作原理的工具

Transformer Debugger：OpenAI开源专门研究模型工作原理的工具

OpenAI 的 Superalignment （超级对齐）团队开发开源了一款工具：Transformer D […]

Figure 机器人接入ChatGPT后获得自我推理等惊人能力

Figure 机器人接入ChatGPT后获得自我推理等惊人能力

Figure 展示了他们与OpenAI合作的最新进展，炸裂了 Figure 01接入ChatGPT后获得了惊人 […]

Deepgram Aura：低于250毫秒的实时文本转语音API 可以实时互动

Deepgram Aura：低于250毫秒的实时文本转语音API 可以实时互动

Deepgram 推出了名为 Aura 的全新文本转语音（TTS）API，这是为实时对话 AI 代理和应用程序 […]

完整视频：OpenAI的首席技术官Mira Murati接受华尔街日报采访

完整视频：OpenAI的首席技术官Mira Murati接受华尔街日报采访

OpenAI的首席技术官Mira Murati在接受华尔街日报采访时关于OpenAI的视频生成模型Sora的详 […]

VLOGGER：基于文本和音频驱动，从单张照片生成会说话的人类视频

VLOGGER：基于文本和音频驱动，从单张照片生成会说话的人类视频

VLOGGER是一个利用文本和音频驱动的方法，可以从人的单张照片生成说话的人视频。给定一张人的单张输入图像和 […]

Reor：一个基于AI的开源桌面笔记应用构建你的“第二大脑”。

Reor：一个基于AI的开源桌面笔记应用构建你的“第二大脑”。

Reor：一个基于AI的开源桌面笔记应用 Reor可以作为个人知识管理工具，帮助你构建自己的“第二大脑”。 S […]

ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型

ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型

ChatMusician: 能够理解和生成音乐的大语言模型通过根据给定的文本提示、和弦序列、旋律线索、音乐主 […]

Follow-Your-Click：能够根据用户的点击和提示，使图像特定区域动起来

Follow-Your-Click：能够根据用户的点击和提示，使图像特定区域动起来

Follow-Your-Click是一个开放领域区域图像动画项目，该项目由来自香港科技大学（HKUST）、腾讯 […]

OpenAI官方提示指南获得更好结果的六种策略

OpenAI官方提示指南获得更好结果的六种策略

一、获得更好结果的六种策略写清楚说明（Write clear instructions）提供参考文本（P […]

Muse Pro 是一款融合AI专为iPad设计的实时画图应用

Muse Pro 是一款融合AI专为iPad设计的实时画图应用

Muse Pro 是一款专为iPad设计的实时画图应用，通过结合先进的人工智能技术，提供了一种全新的创作体验。 […]

Cartwheel：一个文本转3D动画工具直接文字生成动态3D角色

Cartwheel：一个文本转3D动画工具直接文字生成动态3D角色

Cartwheel：一个文本转3D动画工具只需输入文字提示即可生成视频、游戏、电影、广告、社交或 VR 项目 […]

Glyph-ByT5：提高图像生成中文本渲染的准确性提升近90%

Glyph-ByT5：提高图像生成中文本渲染的准确性提升近90%

Glyph-ByT5项目是由微软亚洲研究院、清华大学、北京大学以及澳大利亚国立大学的研究人员共同开展的。该项目 […]

1 … 76 77 78 79 80 … 129