Meta Reality Labs开发一套名为“Sapiens”的人工智能模型。主要提供用于处理人类视觉任务的 […]
韩国游戏公司 KRAFTON 打造的全新模拟养成游戏《inZOI》于昨(21)日公开了玩法预告。在这段视频中, […]
传统的多模态生成模型通常需要分别针对文本和图像等不同模态设计专门的处理方法或模型。例如,文本使用语言模型,而图 […]
Captions 宣布推出其最先进的视频生成和编辑功能的API套件。通过这些API,开发者可以大规模地生成、编 […]
北京航空航天大学能源与动力工程学院开发出一种新型的昆虫级别的腿式微型机器人,称为BHMbot,它实现了超快的无 […]
Napkin AI 是一款将文本转换为视觉内容的工具,可以将文本内容转化为丰富的视觉效果。只需通过简单的文本输 […]
英伟达(NVIDIA)推出了Mistral-NeMo-Minitron 8B,这是一款由英伟达与Mistral […]
Ideogram 发布Ideogram 2.0 版本,这是一款功能强大的文字转图像模型,具有行业领先的生成真实 […]
KEEP 是一个专注于让低清晰度的视频变得更清晰,特别是让视频里的人脸看起来更清晰、更真实的方法。 通常来说, […]
Glif 是一个低代码平台,用于创建名为“glifs”的小型AI生成器。一个 glif 可以接收用户输入(如文 […]
Upstash Vector,一个支持可扩展相似性搜索的向量数据库,对 1100 万篇维基百科文章进行了向量化 […]
Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具 可以将视频自动翻译成其他语言并生成字幕 […]
UniPortrait 是一个用于人像图像个性化的统一框架,专注于在单人和多人场景中保持身份一致性的同时,提供 […]
Melodisco 是一个基于 AI 的音乐播放器项目,该项目最初的目标是创建一个 AI 版的网易云音乐,现已 […]
Half_illustration模型是一个用于生成结合摄影和插画涂鸦元素的图像,基于Flux.1 模型训练。 […]
Rendora AI 是一个可以让你快速制作高质量3D形象的AI视频平台。你只需输入文字,就能在几秒钟内生成带 […]
麻省理工学院(MIT)的研究人员创建了一个名为“AI风险库”的数据库,记录了与人工智能(AI)相关的700多项 […]
Mickmumpitz开发的新AI驱动工作流程,旨在轻松地将视频合成到任意背景上。而且可以自动剪切主题,匹配背 […]
AI 学术搜索引擎 Consensus 宣布完成 1150 万美元的 A 轮融资。本轮融资由Union Squ […]
TurboEdit是一个由Adobe Research团队开发的工具,允许用户通过简单的文本描述快速实时编辑图 […]
Seed-ASR 是字节跳动开发的一种先进的自动语音识别(ASR)模型,基于大语言模型(LLM)框架构建。专门 […]
LongWriter 是一个由清华大学数据挖掘研究小组(THUDM)开发的开源项目,旨在利用长上下文大语言模型 […]
研究人员使用了Meta AI 的 Segment Anything Model 2 (SAM 2) 来评估其在 […]
OpenAI 推出 GPT-4o 的微调功能,允许开发者根据特定应用需求定制模型,从而提升性能和准确性。开发者 […]
v0 发布一个基于聊天的网页开发助手,你可以通过聊天的方式与v0互动,让它帮助调试代码、回答开发问题、生成代码 […]
微软发布Phi-3.5-vision 轻量级、多模态的开源模型,其属于Phi-3模型家族。该模型专为需要文本和 […]
随着深度学习技术的进步,神经网络现在能够直接从原始语音数据中学习高质量的通用表示(representation […]
特斯拉正在雇佣员工通过穿戴动作捕捉服来帮助训练其人形机器人Optimus。该职位被称为“数据采集操作员”,时薪 […]
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了其AI语音助手 Gemini Live 。Gemin […]
在 2024 Pixel 谷歌发布会上,Google推出了许多 Pixel 设备——Pixel 9、Pixe […]
Meta Reality Labs开发一套名为“Sapiens”的人工智能模型。主要提供用于处理人类视觉任务的 […]