Ai日报 - 第 22 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

2023-12-21 18:02:32 Twitter

2023-12-21 18:02:32 Twitter

ChatGPT插件将废弃⚠️ OpenAI将引导开发者将ChatGPT插件迁移到GPTs… Support a […]

InstanceDiffusion：允许用户以前所未有的精度控制图片中每个细节

InstanceDiffusion：允许用户以前所未有的精度控制图片中每个细节

InstanceDiffusion是一个由BAIR, UC Berkeley和GenAI, Meta共同开发的 […]

由人类细胞构成能够自我移动具有自组装能力的微小活体机器人

由人类细胞构成能够自我移动具有自组装能力的微小活体机器人

塔夫茨大学和哈佛大学维斯研究所团队开发出一种能够在实验室培养皿中移动的微小活体机器人。他们将这些创造物称为“ […]

Design2Code：利用大语言模型将视觉设计自动转换为前端代码

Design2Code：利用大语言模型将视觉设计自动转换为前端代码

Design2Code项目探索了利用生成式人工智能，特别是多模态大语言模型（LLMs），将视觉设计自动转换为前 […]

01.AI发布新一代开源模型：Yi-9B 专为中英双语场景优化

01.AI发布新一代开源模型：Yi-9B 专为中英双语场景优化

01.AI发布新一代开源大语言模型：Yi-9B，特别针对双语（中英文）场景进行训练，拥有强大的语言理解、常识推 […]

ResAdapter：一致性分辨率适配器可以生成任意分辨率和纵横比的图像

ResAdapter：一致性分辨率适配器可以生成任意分辨率和纵横比的图像

ResAdapter是一个由字节跳动开发的领域一致性分辨率适配器，它能让扩散模型、生成不同分辨率和比例的图像， […]

如何使用Midjourney v6 创建自己的服装品牌

如何使用Midjourney v6 创建自己的服装品牌

如何使用Midjourney v6 创建自己的服装品牌博主Hugo Ventura分享了他使用Midjour […]

更改图像风格但保持角色和姿势一致的简单方法

更改图像风格但保持角色和姿势一致的简单方法

Chase Lean @chaseleantj 在X上分享了一种简单的方法，用于改变图像的风格同时保持角色和姿 […]

MovieLLM: 用AI合成电影数据用来训练AI对长视频理解

MovieLLM: 用AI合成电影数据用来训练AI对长视频理解

MovieLLM 是由复旦大学和腾讯PCG的研究人员共同开发的一个新颖框架，能够从简单的文本提示中生成高质量、 […]

SaulLM-7B：一款专为法律领域定制的大语言模型

SaulLM-7B：一款专为法律领域定制的大语言模型

SaulLM-7B，这是一款专为法律领域定制的大语言模型（LLM）。拥有70亿参数，SaulLM-7B是首个专 […]

Figma推出Multi-edit功能：让设计更简单，批量编辑轻松搞定

Figma推出Multi-edit功能：让设计更简单，批量编辑轻松搞定

Figma推出一个强大的功能——多重编辑（Multi-edit），这项功能极大地简化了在Figma中跨多个框架 […]

RT-H：让机器人学会根据人类语言描述执行任务

RT-H：让机器人学会根据人类语言描述执行任务

RT-H是一个利用视觉语言模型（VLM）通过语言来预测动作层次结构的模型，由Google DeepMind的研 […]

Optimizer AI：专为视频自动生成音效的AI工具可为视频自动配音

Optimizer AI：专为视频自动生成音效的AI工具可为视频自动配音

OptimizerAI是一个AI声音效果生成器，专注于为创作者、游戏制作者、艺术家和视频制作者生成声音效果的平 […]

传奇芯片架构师领导的公司Tenstorrent 推出了Grayskull 替代传统GPU

传奇芯片架构师领导的公司Tenstorrent 推出了Grayskull 替代传统GPU

由传奇芯片架构师吉姆·凯勒（Jim Keller）领导的公司Tenstorrent，发布了其首款硬件产品Gra […]

The Pile: 用于语言模型的800GB多样化文本数据集

The Pile: 用于语言模型的800GB多样化文本数据集

The Pile是一个由EleutherAI提供的825 GiB大小的多样化、开源语言建模数据集，它由22个较 […]

Magi: 自动将漫画转录成文字并自动生成剧本

Magi: 自动将漫画转录成文字并自动生成剧本

Magi模型，由牛津大学工程科学系的视觉几何组开发。这项研究的核心目标是通过人工智能技术自动为漫画生成文字剧本 […]

Cradle：仅靠屏幕图像输入 AI模仿人类玩《荒野大镖客2》

Cradle：仅靠屏幕图像输入 AI模仿人类玩《荒野大镖客2》

Cradle，一个具有强大推理能力的代理框架，旨在探索通用计算机控制领域，以《荒野大镖客2》（Red Dead […]

AIwechat-Vercel：无需服务器无需备案将GPT接入微信公众号

AIwechat-Vercel：无需服务器无需备案将GPT接入微信公众号

AIwechat-Vercel利用 Vercel 的 Serverless Functions 提供后端服务， […]

2024年哈佛大学CS50x计算机科学课程详解

2024年哈佛大学CS50x计算机科学课程详解

哈佛大学CS50x 2024课程 CS50简介：这是哈佛大学的一门计算机科学和编程入门课程，适合专业学生和非 […]

PIXART-Σ：利用Diffusion Transformer（DiT）直接生成4K分辨率图像

PIXART-Σ：利用Diffusion Transformer（DiT）直接生成4K分辨率图像

PIXART-Σ是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员共同开发的一个基于Diffusion […]

Pika 推出根据视频内容自动生成音效功能可以给视频自动配音

Pika 推出根据视频内容自动生成音效功能可以给视频自动配音

Pika平台发布了一项新功能，允许用户为视频无缝生成和集成音效，用户可以指定想要的声音或让平台根据视频内容自动 […]

WhiteRabbitNeo：网络安全领域专用模型可识别安全威胁和漏洞

WhiteRabbitNeo：网络安全领域专用模型可识别安全威胁和漏洞

WhiteRabbitNeo发布WhiteRabbitNeo-7B-v1.5a 模型，该模型属于文本生成领域， […]

Google Shopping API ：抓取商品详情、评论、规格、优惠信息等

Google Shopping API ：抓取商品详情、评论、规格、优惠信息等

Google Shopping API 由 SearchApi 提供，是一个强大的工具，旨在帮助开发者和研究者 […]

OpenAI Sora团队三巨头做客Marques Brownlee播客

OpenAI Sora团队三巨头做客Marques Brownlee播客

主要内容导览： Support authors and subscribe to content This i […]

MeloTTS: 高质量多语言文本转语音(TTS)库支持中英混合

MeloTTS: 高质量多语言文本转语音(TTS)库支持中英混合

MeloTTS是由MyShell.ai开发的一款高质量、支持多语言的文本转语音(TTS)库。该库支持英语（美式 […]

H2O：将人类动作实时转换为机器人动作实时全身遥控机器人

H2O：将人类动作实时转换为机器人动作实时全身遥控机器人

Human to Humanoid (H2O)由卡内基梅隆大学的研究团队开发，它允许人们通过一个简单的RGB摄 […]

一种革命性的开源系统现在你可以在家训练一个70B的大语言模型了

一种革命性的开源系统现在你可以在家训练一个70B的大语言模型了

Answer.AI发布了一个基于FSDP（Fully Sharded Data Parallel，完全分片数据 […]

SST：对情感的高维度理解和映射让机器更真实地模拟人类情感

SST：对情感的高维度理解和映射让机器更真实地模拟人类情感

Hume AI的博客文章《什么是语义空间理论？》介绍了一个先进的理解情感的方法：语义空间理论（SST）。这种方 […]

SLD：图像生成模型自动校正技术能编辑和修复各类模型生成的图像

SLD：图像生成模型自动校正技术能编辑和修复各类模型生成的图像

SLD是一种自我纠正的LLM控制扩散框架，它通过结合大型语言模型的检测能力，使图像生成模型能够更加精准地根据文 […]

Whomane：不到100美金AI Pin替代一个开源的人工智能可穿戴相机设备

Whomane：不到100美金AI Pin替代一个开源的人工智能可穿戴相机设备

Whomane是一款价格便宜且方便组装的开源可穿戴设备，只需几分钟即可完成组装。它只有四个组件：相机、按钮、电 […]

1 … 20 21 22 23 24 … 32