首页 > Ai资讯
Paper Piano 纸钢琴:通过摄像头将任何一张纸变成一架钢琴
Paper Piano 纸钢琴:通过摄像头将任何一张纸变成一架钢琴

Paper Piano,通过摄像头捕捉手指的运动,在纸张上实现弹钢琴的功能,让人们无需购买真正的钢琴即可演奏音 […]

Midjourney 角色人物一致性功能上线 复杂文本理解能力提升
Midjourney 角色人物一致性功能上线 复杂文本理解能力提升

Midjourney 角色人物一致性功能上线 适用于 MJ6 和 Niji6 型号 Support autho […]

Google发明了一种新型的模型窃取攻击方法 成功攻破ChatGPT
Google发明了一种新型的模型窃取攻击方法 成功攻破ChatGPT

Google发表了一篇论文,介绍了一种新型的模型窃取攻击方法,这种方法能够从像OpenAI的ChatGPT或G […]

YOLOv8:目标检测跟踪模型 快速准确识别和定位图像中多个对象
YOLOv8:目标检测跟踪模型 快速准确识别和定位图像中多个对象

YOLOv8:目标检测跟踪模型 YOLOv8能够在图像或视频帧中快速准确地识别和定位多个对象,还能跟踪它们的移 […]

英伟达推出生成式AI专家认证 费用135美元
英伟达推出生成式AI专家认证 费用135美元

NVIDIA推出了面向生成式AI和大语言模型(LLMs)的认证项目,名为NCA Generative AI L […]

Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成
Command-R:高性能企业级语言模型 跨语言交互与自动化工具集成

Command-R是Cohere推出的一种新型大语言模型,旨在实现可扩展的生成模型,专注于检索增强生成(RAG […]

2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台
2个包含 24000GPU的集群 Meta 正在打造一套超大规模的人工智能计算平台

Meta 正在打造一套超大规模的人工智能计算平台,他们宣布推出了两个包含 24000GPU 的集群。这些不是普 […]

Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作
Devin:全球首位AI软件工程师 通过了顶尖 AI 公司真实面试,并能完成真正的工作

Cognition 实验室发布了 世界上第一位完全自主的 AI 软件工程师:Devi。 具备自学新语言、开发迭 […]

Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中
Perplexity 接入 Yelp 的评论数据 融入到其聊天机器人服务中

Perplexity 将 Yelp 的评论数据融入到其聊天机器人服务中 当你在考虑去哪家咖啡厅时,Perple […]

Hotshot ACT-1:一个全新的文本转视频模型 更贴近生活现实
Hotshot ACT-1:一个全新的文本转视频模型 更贴近生活现实

Hotshot ACT-1:一个全新、出色的文本转视频模型 ACT 1 能够以不同的宽高比产生高清视频 Sup […]

Transformer Debugger:OpenAI开源专门研究模型工作原理的工具
Transformer Debugger:OpenAI开源专门研究模型工作原理的工具

OpenAI 的 Superalignment (超级对齐)团队开发开源了一款工具:Transformer D […]

Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动
Deepgram Aura:低于250毫秒的 实时文本转语音API 可以实时互动

Deepgram 推出了名为 Aura 的全新文本转语音(TTS)API,这是为实时对话 AI 代理和应用程序 […]

Figure 机器人接入ChatGPT后获得自我推理等惊人能力
Figure 机器人接入ChatGPT后获得自我推理等惊人能力

Figure 展示了他们与OpenAI合作的最新进展,炸裂了 Figure 01接入ChatGPT后获得了惊人 […]

完整视频:OpenAI的首席技术官Mira Murati接受华尔街日报采访
完整视频:OpenAI的首席技术官Mira Murati接受华尔街日报采访

OpenAI的首席技术官Mira Murati在接受华尔街日报采访时关于OpenAI的视频生成模型Sora的详 […]

VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频
VLOGGER:基于文本和音频驱动,从单张照片生成会说话的人类视频

VLOGGER是一个利用文本和音频驱动的方法,可以从人的单张照片生成说话的人视频。 给定一张人的单张输入图像和 […]

Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。
Reor:一个基于AI的开源桌面笔记应用 构建你的“第二大脑”。

Reor:一个基于AI的开源桌面笔记应用 Reor可以作为个人知识管理工具,帮助你构建自己的“第二大脑”。 S […]

ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型
ChatMusician: 基于LLaMA 2 能够理解和生成音乐的大语言模型

ChatMusician: 能够理解和生成音乐的大语言模型 通过根据给定的文本提示、和弦序列、旋律线索、音乐主 […]

Follow-Your-Click:能够根据用户的点击和提示,使图像特定区域动起来
Follow-Your-Click:能够根据用户的点击和提示,使图像特定区域动起来

Follow-Your-Click是一个开放领域区域图像动画项目,该项目由来自香港科技大学(HKUST)、腾讯 […]

OpenAI官方提示指南 获得更好结果的六种策略
OpenAI官方提示指南 获得更好结果的六种策略

 一、获得更好结果的六种策略 写清楚说明(Write clear instructions) 提供参考文本(P […]

Muse Pro 是一款融合AI专为iPad设计的实时画图应用
Muse Pro 是一款融合AI专为iPad设计的实时画图应用

Muse Pro 是一款专为iPad设计的实时画图应用,通过结合先进的人工智能技术,提供了一种全新的创作体验。 […]

Cartwheel:一个文本转3D动画工具 直接文字生成动态3D角色
Cartwheel:一个文本转3D动画工具 直接文字生成动态3D角色

Cartwheel:一个文本转3D动画工具 只需输入文字提示即可生成视频、游戏、电影、广告、社交或 VR 项目 […]

Glyph-ByT5:提高图像生成中文本渲染的准确性 提升近90%
Glyph-ByT5:提高图像生成中文本渲染的准确性 提升近90%

Glyph-ByT5项目是由微软亚洲研究院、清华大学、北京大学以及澳大利亚国立大学的研究人员共同开展的。该项目 […]

OpenAI 衍生公司人工智能模型,让机器人像人类一样学习任务
OpenAI 衍生公司人工智能模型,让机器人像人类一样学习任务

在2021年夏天,OpenAI宣布关闭其机器人团队,原因是缺乏必要的数据来训练机器人如何使用人工智能进行移动和 […]

Captury:无标记实时运动捕捉技术 实时创建3D模型
Captury:无标记实时运动捕捉技术 实时创建3D模型

Captury:无标记运动捕捉技术   Captury 发明了一种3D体积扫描技术:CapturyDome,它 […]

苹果发布多模态大语言模型MM1 并公布训练方法和技术细节
苹果发布多模态大语言模型MM1 并公布训练方法和技术细节

MM1模型是一个高性能的多模态大语言模型(MLLM),旨在处理和理解图像和文本数据。该模型通过大规模的预训练, […]

结合解剖学精确的模型 人工智能赋予虚拟果蝇生命
结合解剖学精确的模型 人工智能赋予虚拟果蝇生命

Janelia和Google DeepMind的科学家通过将人工智能融入一个虚拟果蝇模型中,创建了一种能够像真 […]

MediaCrawle:小红书、抖音、快手、B站内容一键抓取工具
MediaCrawle:小红书、抖音、快手、B站内容一键抓取工具

支持小红书、抖音、快手、B站和微博等平台的视频、图片、评论、点赞和转发等信息的抓取。 可以指定特定数据抓取、集 […]

全球最快的人工智能芯片:WSE-3 拥有高达4万亿个晶体管
全球最快的人工智能芯片:WSE-3 拥有高达4万亿个晶体管

Cerebras Systems 推出全球最快的人工智能芯片:WSE-3   拥有高达4万亿个晶体管 关键规格 […]

EVE:一个视频编辑模型 无需训练可对视频进行精准编辑
EVE:一个视频编辑模型 无需训练可对视频进行精准编辑

EVE(Emu Video Edit)是Meta AI开发的一个视频编辑模型 EVE模型通过结合先进的图像处理 […]

奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰
奥特曼:GPT-5的能力提升将超乎想象…许多公司将面临被碾压淘汰

奥特曼:“许多创业公司觉得GPT-5会有提升,这将为他们提供更多的商业机会。   但这是一个错误的假设,如果按 […]


1 76 77 78 79 80 128