首页 > Ai资讯 > Ai日报
Meta AI发布 Sapiens 视觉模型 专门用来分析和理解图片或视频中的人和他们的动作
Meta AI发布 Sapiens 视觉模型 专门用来分析和理解图片或视频中的人和他们的动作

Meta Reality Labs开发一套名为“Sapiens”的人工智能模型。主要提供用于处理人类视觉任务的 […]

韩国游戏公司打造全新模拟养成游戏《inZOI》 玩家可将现实中的物品搬到游戏中
韩国游戏公司打造全新模拟养成游戏《inZOI》 玩家可将现实中的物品搬到游戏中

韩国游戏公司 KRAFTON 打造的全新模拟养成游戏《inZOI》于昨(21)日公开了玩法预告。在这段视频中, […]

Transfusion:一种可生成文本和图像的统一多模态模型
Transfusion:一种可生成文本和图像的统一多模态模型

传统的多模态生成模型通常需要分别针对文本和图像等不同模态设计专门的处理方法或模型。例如,文本使用语言模型,而图 […]

Captions 推出一些列AI视频生成和编辑功能的API套件 可克隆自己、自动编辑视频等
Captions 推出一些列AI视频生成和编辑功能的API套件 可克隆自己、自动编辑视频等

Captions 宣布推出其最先进的视频生成和编辑功能的API套件。通过这些API,开发者可以大规模地生成、编 […]

BHMbot:一种新型的超高速昆虫级微型机器人 奔跑速度超过蟑螂
BHMbot:一种新型的超高速昆虫级微型机器人 奔跑速度超过蟑螂

北京航空航天大学能源与动力工程学院开发出一种新型的昆虫级别的腿式微型机器人,称为BHMbot,它实现了超快的无 […]

Napkin AI :一键将任意文本信息图、流程图、图表等视觉内容
Napkin AI :一键将任意文本信息图、流程图、图表等视觉内容

Napkin AI 是一款将文本转换为视觉内容的工具,可以将文本内容转化为丰富的视觉效果。只需通过简单的文本输 […]

轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行
轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行

英伟达(NVIDIA)推出了Mistral-NeMo-Minitron 8B,这是一款由英伟达与Mistral […]

Ideogram 发布2.0 全新版本 写实风格显著提升 接近真实照片 还能生成网页设计页面
Ideogram 发布2.0 全新版本 写实风格显著提升 接近真实照片 还能生成网页设计页面

Ideogram 发布Ideogram 2.0 版本,这是一款功能强大的文字转图像模型,具有行业领先的生成真实 […]

KEEP:能够从低质量的视频帧中进行面部细节修复 恢复出清晰、细节丰富的人脸
KEEP:能够从低质量的视频帧中进行面部细节修复 恢复出清晰、细节丰富的人脸

KEEP 是一个专注于让低清晰度的视频变得更清晰,特别是让视频里的人脸看起来更清晰、更真实的方法。 通常来说, […]

教程:使用 Glif 利用Flux Schnell模型创建四格漫画故事板和分镜头剧本
教程:使用 Glif 利用Flux Schnell模型创建四格漫画故事板和分镜头剧本

Glif 是一个低代码平台,用于创建名为“glifs”的小型AI生成器。一个 glif 可以接收用户输入(如文 […]

Upstash Vector:将维基百科索引成1.44亿向量数据 构建搜索引擎和RAG机器人
Upstash Vector:将维基百科索引成1.44亿向量数据 构建搜索引擎和RAG机器人

Upstash Vector,一个支持可扩展相似性搜索的向量数据库,对 1100 万篇维基百科文章进行了向量化 […]

Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具
Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具

Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具   可以将视频自动翻译成其他语言并生成字幕 […]

UniPortrait:在单人和多人场景中保持身份一致 并进行风格转换和自由编辑
UniPortrait:在单人和多人场景中保持身份一致 并进行风格转换和自由编辑

UniPortrait 是一个用于人像图像个性化的统一框架,专注于在单人和多人场景中保持身份一致性的同时,提供 […]

Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲
Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲

Melodisco 是一个基于 AI 的音乐播放器项目,该项目最初的目标是创建一个 AI 版的网易云音乐,现已 […]

Half_illustration:生成结合摄影和插画涂鸦元素的图像 一半是照片一半是插画
Half_illustration:生成结合摄影和插画涂鸦元素的图像 一半是照片一半是插画

Half_illustration模型是一个用于生成结合摄影和插画涂鸦元素的图像,基于Flux.1 模型训练。 […]

Rendora AI:你只需输入文字 就能在几秒钟内生成逼真的3D AI数字人视频
Rendora AI:你只需输入文字 就能在几秒钟内生成逼真的3D AI数字人视频

Rendora AI 是一个可以让你快速制作高质量3D形象的AI视频平台。你只需输入文字,就能在几秒钟内生成带 […]

麻省理工学院发布包含700多项与AI相关风险的数据库
麻省理工学院发布包含700多项与AI相关风险的数据库

麻省理工学院(MIT)的研究人员创建了一个名为“AI风险库”的数据库,记录了与人工智能(AI)相关的700多项 […]

教程:教您如何轻松将任意视频一键合成到任意背景上 附工作流下载
教程:教您如何轻松将任意视频一键合成到任意背景上 附工作流下载

Mickmumpitz开发的新AI驱动工作流程,旨在轻松地将视频合成到任意背景上。而且可以自动剪切主题,匹配背 […]

AI 学术搜索引擎 Consensus 完成 1150 万美元 A 轮融资 年化收入达150万美元
AI 学术搜索引擎 Consensus 完成 1150 万美元 A 轮融资 年化收入达150万美元

AI 学术搜索引擎 Consensus 宣布完成 1150 万美元的 A 轮融资。本轮融资由Union Squ […]

TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域
TurboEdit:基于文本的即时图像编辑 保持图像整体不变的情况下 实时修改特定区域

TurboEdit是一个由Adobe Research团队开发的工具,允许用户通过简单的文本描述快速实时编辑图 […]

字节跳动 Seed-ASR:自动语音识别模型 可识别不同语言、方言、口音
字节跳动 Seed-ASR:自动语音识别模型 可识别不同语言、方言、口音

Seed-ASR 是字节跳动开发的一种先进的自动语音识别(ASR)模型,基于大语言模型(LLM)框架构建。专门 […]

LongWriter:让LLMs能够生成超过 10000 字甚至20000 字连贯高质量的文本
LongWriter:让LLMs能够生成超过 10000 字甚至20000 字连贯高质量的文本

LongWriter 是一个由清华大学数据挖掘研究小组(THUDM)开发的开源项目,旨在利用长上下文大语言模型 […]

基于 SAM-2 自动识别和分割外科手术视频中的手术工具
基于 SAM-2 自动识别和分割外科手术视频中的手术工具

研究人员使用了Meta AI 的 Segment Anything Model 2 (SAM 2) 来评估其在 […]

OpenAI 推出了 GPT-4o 微调功能,每天免费送100万Token
OpenAI 推出了 GPT-4o 微调功能,每天免费送100万Token

OpenAI 推出 GPT-4o 的微调功能,允许开发者根据特定应用需求定制模型,从而提升性能和准确性。开发者 […]

v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码
v0 发布一个基于聊天的网页开发助手 可生成用户界面、自动编写运行代码

v0 发布一个基于聊天的网页开发助手,你可以通过聊天的方式与v0互动,让它帮助调试代码、回答开发问题、生成代码 […]

微软发布Phi-3.5-vision 轻量级、多模态的开源模型 端侧运行 可进行复杂视觉推理
微软发布Phi-3.5-vision 轻量级、多模态的开源模型 端侧运行 可进行复杂视觉推理

微软发布Phi-3.5-vision 轻量级、多模态的开源模型,其属于Phi-3模型家族。该模型专为需要文本和 […]

谷歌开发出一种名为HeAR的生物声学模型 可通过咳嗽、说话、呼吸检测疾病
谷歌开发出一种名为HeAR的生物声学模型 可通过咳嗽、说话、呼吸检测疾病

随着深度学习技术的进步,神经网络现在能够直接从原始语音数据中学习高质量的通用表示(representation […]

特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金
特斯拉正在招聘人员来进行Optimus机器人训练工作 时薪48美金

特斯拉正在雇佣员工通过穿戴动作捕捉服来帮助训练其人形机器人Optimus。该职位被称为“数据采集操作员”,时薪 […]

谷歌发布 Gemini Live AI 语音助手 对标GPT 4o 可模拟真人连续对话
谷歌发布 Gemini Live AI 语音助手 对标GPT 4o 可模拟真人连续对话

谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了其AI语音助手 Gemini Live 。Gemin […]

Google推出了全新的 Pixel 设备 同时推出更多AI功能 14 件
Google推出了全新的 Pixel 设备 同时推出更多AI功能 14 件

在 2024  Pixel 谷歌发布会上,Google推出了许多 Pixel 设备——Pixel 9、Pixe […]


1 6 7 8 9 10 31