首页 > Ai资讯 > Ai日报
Google Shopping API :抓取商品详情、评论、规格、优惠信息等
Google Shopping API :抓取商品详情、评论、规格、优惠信息等

Google Shopping API 由 SearchApi 提供,是一个强大的工具,旨在帮助开发者和研究者 […]

OpenAI Sora团队三巨头做客Marques Brownlee播客
OpenAI Sora团队三巨头做客Marques Brownlee播客

主要内容导览: Support authors and subscribe to content This i […]

MeloTTS: 高质量多语言文本转语音(TTS)库 支持中英混合
MeloTTS: 高质量多语言文本转语音(TTS)库 支持中英混合

MeloTTS是由MyShell.ai开发的一款高质量、支持多语言的文本转语音(TTS)库。该库支持英语(美式 […]

H2O:将人类动作实时转换为机器人动作 实时全身遥控机器人
H2O:将人类动作实时转换为机器人动作 实时全身遥控机器人

Human to Humanoid (H2O)由卡内基梅隆大学的研究团队开发,它允许人们通过一个简单的RGB摄 […]

一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了
一种革命性的开源系统 现在你可以在家训练一个70B的大语言模型了

Answer.AI发布了一个基于FSDP(Fully Sharded Data Parallel,完全分片数据 […]

SST:对情感的高维度理解和映射 让机器更真实地模拟人类情感
SST:对情感的高维度理解和映射 让机器更真实地模拟人类情感

Hume AI的博客文章《什么是语义空间理论?》介绍了一个先进的理解情感的方法:语义空间理论(SST)。这种方 […]

SLD:图像生成模型自动校正技术 能编辑和修复各类模型生成的图像
SLD:图像生成模型自动校正技术 能编辑和修复各类模型生成的图像

SLD是一种自我纠正的LLM控制扩散框架,它通过结合大型语言模型的检测能力,使图像生成模型能够更加精准地根据文 […]

Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备
Whomane:不到100美金AI Pin替代 一个开源的人工智能可穿戴相机设备

Whomane是一款价格便宜且方便组装的开源可穿戴设备,只需几分钟即可完成组装。它只有四个组件:相机、按钮、电 […]

加拿大国防部和加拿大武装部队发布人工智能战略 加速AI战斗部署
加拿大国防部和加拿大武装部队发布人工智能战略 加速AI战斗部署

加拿大国防部和加拿大武装部队发布了一个人工智能(AI)战略,目标是到2030年,利用AI技术改善他们的工作和操 […]

Inflection AI发布Inflection-2.5模型 只用四成功力就匹敌GPT 4
Inflection AI发布Inflection-2.5模型 只用四成功力就匹敌GPT 4

Inflection AI发布Inflection-2.5版本模型 只用了四成功力就匹敌GPT 4性能,具有高 […]

Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型
Google发布Gemini 1.5 Pro 技术报告:为多模态混合专家模型

Gemini 1.5 Pro 是由 Google Gemini 团队开发的一款多模态混合专家模型,它标志着人工 […]

ELLA:使用LLM来增强扩散模型的语义对齐
ELLA:使用LLM来增强扩散模型的语义对齐

ELLA(Efficient Large Language Model Adapter)是由腾讯开发的一个先进 […]

Paper Piano 纸钢琴:通过摄像头将任何一张纸变成一架钢琴
Paper Piano 纸钢琴:通过摄像头将任何一张纸变成一架钢琴

Paper Piano,通过摄像头捕捉手指的运动,在纸张上实现弹钢琴的功能,让人们无需购买真正的钢琴即可演奏音 […]

Midjourney 角色人物一致性功能上线 复杂文本理解能力提升
Midjourney 角色人物一致性功能上线 复杂文本理解能力提升

Midjourney 角色人物一致性功能上线 适用于 MJ6 和 Niji6 型号 Support autho […]

Google发明了一种新型的模型窃取攻击方法 成功攻破ChatGPT
Google发明了一种新型的模型窃取攻击方法 成功攻破ChatGPT

Google发表了一篇论文,介绍了一种新型的模型窃取攻击方法,这种方法能够从像OpenAI的ChatGPT或G […]

YOLOv8:目标检测跟踪模型 快速准确识别和定位图像中多个对象
YOLOv8:目标检测跟踪模型 快速准确识别和定位图像中多个对象

YOLOv8:目标检测跟踪模型 YOLOv8能够在图像或视频帧中快速准确地识别和定位多个对象,还能跟踪它们的移 […]

英伟达推出生成式AI专家认证 费用135美元
英伟达推出生成式AI专家认证 费用135美元

NVIDIA推出了面向生成式AI和大语言模型(LLMs)的认证项目,名为NCA Generative AI L […]

Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成
Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成

Command-R是Cohere推出的一种新型大语言模型,旨在实现可扩展的生成模型,专注于检索增强生成(RAG […]

2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台
2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台

Meta 正在打造一套超大规模的人工智能计算平台,他们宣布推出了两个包含 24000GPU 的集群。这些不是普 […]

Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作
Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作

Cognition 实验室发布了 世界上第一位完全自主的 AI 软件工程师:Devi。 具备自学新语言、开发迭 […]

Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中
Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中

Perplexity 将 Yelp 的评论数据融入到其聊天机器人服务中 当你在考虑去哪家咖啡厅时,Perple […]

Hotshot ACT-1:一个全新的文本转视频模型 更贴近生活现实
Hotshot ACT-1:一个全新的文本转视频模型 更贴近生活现实

Hotshot ACT-1:一个全新、出色的文本转视频模型 ACT 1 能够以不同的宽高比产生高清视频 Sup […]

Transformer Debugger:OpenAI开源专门研究模型工作原理的工具
Transformer Debugger:OpenAI开源专门研究模型工作原理的工具

OpenAI 的 Superalignment (超级对齐)团队开发开源了一款工具:Transformer D […]

Figure 机器人接入ChatGPT后获得自我推理等惊人能力
Figure 机器人接入ChatGPT后获得自我推理等惊人能力

Figure 展示了他们与OpenAI合作的最新进展,炸裂了 Figure 01接入ChatGPT后获得了惊人 […]

Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动
Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

Deepgram 推出了名为 Aura 的全新文本转语音(TTS)API,这是为实时对话 AI 代理和应用程序 […]

完整视频:OpenAI的首席技术官Mira Murati接受华尔街日报采访
完整视频:OpenAI的首席技术官Mira Murati接受华尔街日报采访

OpenAI的首席技术官Mira Murati在接受华尔街日报采访时关于OpenAI的视频生成模型Sora的详 […]

VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频
VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频

VLOGGER是一个利用文本和音频驱动的方法,可以从人的单张照片生成说话的人视频。 给定一张人的单张输入图像和 […]

Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。
Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。

Reor:一个基于AI的开源桌面笔记应用 Reor可以作为个人知识管理工具,帮助你构建自己的“第二大脑”。 S […]

ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型
ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型

ChatMusician: 能够理解和生成音乐的大语言模型 通过根据给定的文本提示、和弦序列、旋律线索、音乐主 […]

Follow-Your-Click:能够根据用户的点击和提示,使图像特定区域动起来
Follow-Your-Click:能够根据用户的点击和提示,使图像特定区域动起来

Follow-Your-Click是一个开放领域区域图像动画项目,该项目由来自香港科技大学(HKUST)、腾讯 […]


1 18 19 20 21 22 29