首页 > Ai资讯 > Ai日报
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力

智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行 […]

Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文
Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

Magic团队宣布开发出一种超长上下文AI模型LTM。它能够在推理过程中处理和利用多达1亿个token的上下文 […]

Playground 发布 V3 版本 可以轻松创建和编辑各种图像和文本设计
Playground 发布 V3 版本 可以轻松创建和编辑各种图像和文本设计

Playground v3(测试版)的发布,这是一个强大的图形设计工具,用户可以轻松创建和编辑各种图像和文本设 […]

ChatTTS-Forge :一个提供易于使用WebUI和接入各种TTS API服务的开源项目
ChatTTS-Forge :一个提供易于使用WebUI和接入各种TTS API服务的开源项目

ChatTTS-Forge 是一个围绕 TTS(文本转语音)生成模型开发的项目。为用户提供灵活的 TTS 生成 […]

Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法
Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法

随着学年的到来,Gemini 推出了专门帮助您学习的新功能。旨在提升学生的学习体验,特别适用于18岁及以上的学 […]

腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅
腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅

腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅。 3D虚拟展厅允许用户通过个性化虚 […]

GenWarp:只需一张图像即可生成该图像不同视角的新图像
GenWarp:只需一张图像即可生成该图像不同视角的新图像

GenWarp 是一种能够从一张图像生成该图像不同视角的新图像的方法。通常情况下,生成一个场景的不同视角需要多 […]

Cursor Directory:各种编程语言的Cursor 配置文件和提示词库
Cursor Directory:各种编程语言的Cursor 配置文件和提示词库

“Cursor AI Rules Directory”为Cursor编辑器(一个AI驱动的代码编辑工具)提供最 […]

SuperCraft:通过无限工作流画布 将草图直接转换成真实产品图像 并自动生成3D渲染
SuperCraft:通过无限工作流画布 将草图直接转换成真实产品图像 并自动生成3D渲染

SuperCraft 是一个帮助团队设计优质实物产品的平台。它提供了一个无限的协作画布,用户可以在上面通过手绘 […]

GameNGen:一个完全由神经模型驱动的游戏引擎 根据玩家操作实时生成游戏画面
GameNGen:一个完全由神经模型驱动的游戏引擎 根据玩家操作实时生成游戏画面

GameNGen 是由Google DeepMind 开发的一个完全由神经模型驱动的游戏引擎,可以实时模拟复杂 […]

Anthropic 罕见的主动公布了 Claude 的系统提示词 并承诺将定期更新
Anthropic 罕见的主动公布了 Claude 的系统提示词 并承诺将定期更新

Anthropic 罕见宣布公布了其生成性 AI 模型 Claude 的系统提示,这些提示用来指导模型如何表现 […]

DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体
DiPIR:将任意物体对象插入到图片或视频中 并和图像融为一体

DiPIR:从单张图片中推断出真实的光照条件,从而能在图片或视频中插入虚拟物体,使这些物体看起来像是真的存在于 […]

智能 AI 电话客服 Bland AI 宣布获得1600 万美元 A 轮融资 可自动接打客户电话
智能 AI 电话客服 Bland AI 宣布获得1600 万美元 A 轮融资 可自动接打客户电话

Bland AI宣布,获得了由 Scale Venture Partners 领投的 1600 万美元 A 轮 […]

教程:如何在 Midjourney 中通过混合 srefs 创建双重色彩图像效果
教程:如何在 Midjourney 中通过混合 srefs 创建双重色彩图像效果

在这篇教程中,我们将介绍如何使用Midjourney中的srefs(样式参考)创建不同的图像效果,并通过调整s […]

GPTEngineer:AI 开发工程师 几秒钟内创建一个网站 并可一键部署
GPTEngineer:AI 开发工程师 几秒钟内创建一个网站 并可一键部署

GPTEngineer.app 是一个允许用户与 AI 进行交互,从而快速构建网页应用的工具。用户可以通过简单 […]

教程:使用 Ideogram 2.0 的绘图和 Remix 功能 轻松制作产品海报
教程:使用 Ideogram 2.0 的绘图和 Remix 功能 轻松制作产品海报

Ideogram 2.0 的设计风格大大提高了生成图像中文字的准确性。你可以使用它为贺卡、按需印刷、海报、插图 […]

Meta AI发布 Sapiens 视觉模型 专门用来分析和理解图片或视频中的人和他们的动作
Meta AI发布 Sapiens 视觉模型 专门用来分析和理解图片或视频中的人和他们的动作

Meta Reality Labs开发一套名为“Sapiens”的人工智能模型。主要提供用于处理人类视觉任务的 […]

韩国游戏公司打造全新模拟养成游戏《inZOI》 玩家可将现实中的物品搬到游戏中
韩国游戏公司打造全新模拟养成游戏《inZOI》 玩家可将现实中的物品搬到游戏中

韩国游戏公司 KRAFTON 打造的全新模拟养成游戏《inZOI》于昨(21)日公开了玩法预告。在这段视频中, […]

Transfusion:一种可生成文本和图像的统一多模态模型
Transfusion:一种可生成文本和图像的统一多模态模型

传统的多模态生成模型通常需要分别针对文本和图像等不同模态设计专门的处理方法或模型。例如,文本使用语言模型,而图 […]

Captions 推出一些列AI视频生成和编辑功能的API套件 可克隆自己、自动编辑视频等
Captions 推出一些列AI视频生成和编辑功能的API套件 可克隆自己、自动编辑视频等

Captions 宣布推出其最先进的视频生成和编辑功能的API套件。通过这些API,开发者可以大规模地生成、编 […]

BHMbot:一种新型的超高速昆虫级微型机器人 奔跑速度超过蟑螂
BHMbot:一种新型的超高速昆虫级微型机器人 奔跑速度超过蟑螂

北京航空航天大学能源与动力工程学院开发出一种新型的昆虫级别的腿式微型机器人,称为BHMbot,它实现了超快的无 […]

Napkin AI :一键将任意文本信息图、流程图、图表等视觉内容
Napkin AI :一键将任意文本信息图、流程图、图表等视觉内容

Napkin AI 是一款将文本转换为视觉内容的工具,可以将文本内容转化为丰富的视觉效果。只需通过简单的文本输 […]

轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行
轻量级冠军:英伟达发布最精确的小语言模型 可在移动设备上运行

英伟达(NVIDIA)推出了Mistral-NeMo-Minitron 8B,这是一款由英伟达与Mistral […]

Ideogram 发布2.0 全新版本 写实风格显著提升 接近真实照片 还能生成网页设计页面
Ideogram 发布2.0 全新版本 写实风格显著提升 接近真实照片 还能生成网页设计页面

Ideogram 发布Ideogram 2.0 版本,这是一款功能强大的文字转图像模型,具有行业领先的生成真实 […]

KEEP:能够从低质量的视频帧中进行面部细节修复 恢复出清晰、细节丰富的人脸
KEEP:能够从低质量的视频帧中进行面部细节修复 恢复出清晰、细节丰富的人脸

KEEP 是一个专注于让低清晰度的视频变得更清晰,特别是让视频里的人脸看起来更清晰、更真实的方法。 通常来说, […]

教程:使用 Glif 利用Flux Schnell模型创建四格漫画故事板和分镜头剧本
教程:使用 Glif 利用Flux Schnell模型创建四格漫画故事板和分镜头剧本

Glif 是一个低代码平台,用于创建名为“glifs”的小型AI生成器。一个 glif 可以接收用户输入(如文 […]

Upstash Vector:将维基百科索引成1.44亿向量数据 构建搜索引擎和RAG机器人
Upstash Vector:将维基百科索引成1.44亿向量数据 构建搜索引擎和RAG机器人

Upstash Vector,一个支持可扩展相似性搜索的向量数据库,对 1100 万篇维基百科文章进行了向量化 […]

Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具
Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具

Linly-Dubbing:一个开源的多语言AI配音和视频翻译工具   可以将视频自动翻译成其他语言并生成字幕 […]

UniPortrait:在单人和多人场景中保持身份一致 并进行风格转换和自由编辑
UniPortrait:在单人和多人场景中保持身份一致 并进行风格转换和自由编辑

UniPortrait 是一个用于人像图像个性化的统一框架,专注于在单人和多人场景中保持身份一致性的同时,提供 […]

Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲
Melodisco:AI 版的网易云音乐 一个开源的 AI 播放器 收录了 30 万首 AI 歌曲

Melodisco 是一个基于 AI 的音乐播放器项目,该项目最初的目标是创建一个 AI 版的网易云音乐,现已 […]


1 3 4 5 6 7 29