Ai资讯 - 第 8 页 - 智汇宝库

首页 > Ai资讯

Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话

Deepgram 推出了全新的AI语音代理API 能够进行实时自然的语音对话

Deepgram推出了全新的AI语音代理API，这是一个统一的语音对话API，旨在让AI代理能够进行自然的对话 […]

StoryMaker：一致性角色图像解决方案能同时保持面部、服装、发型和身体姿态一致性

StoryMaker：一致性角色图像解决方案能同时保持面部、服装、发型和身体姿态一致性

StoryMaker是一个旨在生成一致性角色图像的个性化解决方案。它不仅可以在多人物场景中保持角色的面部一致性 […]

LVCD：专门为动画视频线稿上色工具把黑白线稿自动转化为彩色动画视频

LVCD：专门为动画视频线稿上色工具把黑白线稿自动转化为彩色动画视频

LVCD 是一个专门为动画视频线稿上色设计的工具。它通过一种新的方法，把黑白线稿自动转化为彩色动画视频。传统 […]

开心电视助手【最新版】安卓TV必备的神器！

开心电视助手【最新版】安卓TV必备的神器！

开心电视助手，是一款专门针对安卓设备打造的远程管理工具，可以轻松实现：管理电视/机顶盒/投影仪等设备，还可 […]

mytv-android 目前最好用的安卓TV电视直播软件

mytv-android 目前最好用的安卓TV电视直播软件

我的电视使用Android原生开发的电视直播软件下载方式 1、Github 项目：【点击前往】 2、网 […]

Meta无限长文本大模型来了：参数仅7B，已开源

Meta无限长文本大模型来了：参数仅7B，已开源

谷歌之后，Meta 也来卷无限长上下文。 Transformers 的二次复杂度和弱长度外推限制了它们扩展到长 […]

Claude 引入上下文检索技术大幅提高RAG的性能和检索准确率

Claude 引入上下文检索技术大幅提高RAG的性能和检索准确率

为了让 AI 模型在特定环境中更有用，它往往需要访问背景知识。例如，客户支持聊天机器人需要了解它所服务的具体业 […]

阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

阿里云发布Qwen2.5 系列基础开源模型和Qwen2.5-Coder 和 Qwen2.5-Math专有模型

阿里云发布Qwen2.5 系列模型，最新发布的 Qwen2.5 系列中包括普通的大语言模型 (LLM) 以及针 […]

StableDiffusion模型推荐系列（功能型）

StableDiffusion模型推荐系列（功能型）

前两天，我分享了SDXL的通用模型，这些模型不仅在生成高质量图像和艺术作品方面表现出色，搭配上LoRA模型还能 […]

Libcimbar：无需联网、蓝牙、NFC 扫描二维码即可传输文件

Libcimbar：无需联网、蓝牙、NFC 扫描二维码即可传输文件

Libcimbar 是一个用于数据传输的工具，通过一种特殊的二维条码格式（色彩图标矩阵条码）来进行隔空数据传输 […]

AI换脸：FaceFusion 3.5.0更新，解决老版本无法使用问题！

AI换脸：FaceFusion 3.5.0更新，解决老版本无法使用问题！

好久不见！闲话不多说，今天主要是通知一下FaceFusion两个版本的更新。更新内容如下： V3.5.0 […]

LLM Agent最常见的九种设计模式(图解+代码)

LLM Agent最常见的九种设计模式(图解+代码)

引言先来一张图镇楼，欢迎大家积极转发、收藏。接下来讲讲每个模式的原理，以及代码实现(看代码能帮助产品经理加 […]

YouTubeVeo 引入Google DeepMind 的 Veo 模型创作者可使用Veo创作视频

YouTubeVeo 引入Google DeepMind 的 Veo 模型创作者可使用Veo创作视频

YouTube Shorts 将引入Google DeepMind的Veo模型，它允许创作者制作6秒的独立视频 […]

Deep Live Cam：AI实时换脸直播！效果惊人，支持 Windows+Mac

Deep Live Cam：AI实时换脸直播！效果惊人，支持 Windows+Mac

最近 Deep Live Cam这款实时AI换脸神器，在GitHub上火爆得一塌糊涂！现在就跟着我一起来看看， […]

比GPT-4快18倍，世界最快大模型Groq登场！每秒500 token破纪录，自研LPU是英伟达GPU 10倍

比GPT-4快18倍，世界最快大模型Groq登场！每秒500 token破纪录，自研LPU是英伟达GPU 10倍

新智元报道【新智元导读】卷疯了！世界最快的大模型Groq一夜之间爆火，能够每秒输出近500个token。如此 […]

微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能

微软Office全家桶大更新 Excel 中集成 Python 推出 Pages和Copilot Agents等众多功能

微软推出了 Microsoft 365 Copilot 的第二波更新，将网页、工作和 Pages 整合为一个新 […]

Seed-Music：字节跳动开发的音乐生成模型支持多种数据输入生成和编辑音乐

Seed-Music：字节跳动开发的音乐生成模型支持多种数据输入生成和编辑音乐

Seed-Music是一个由字节跳动研发的音乐生成模型，用户可以通过输入多模态数据（如文本描述、音频参考、乐谱 […]

Snap 发布第五代 Spectacles AR 眼镜内置AI 可通过语音提示直接生成 3D 动画

Snap 发布第五代 Spectacles AR 眼镜内置AI 可通过语音提示直接生成 3D 动画

Snap公司发布了第五代SpectaclesAR 眼镜，新版Spectacles具备更高质量的显示效果和更长的 […]

Luma AI 推出 Dream Machine API 开发者可将AI视频生成能力无缝集成到自己的产品中

Luma AI 推出 Dream Machine API 开发者可将AI视频生成能力无缝集成到自己的产品中

Luma AI 正式发布其创新产品 Dream Machine API。该 API 为开发者提供了世界上最受欢 […]

Runway推出其视频生成模型的API 方便开发者集成到应用中但是有一些特殊要求

Runway推出其视频生成模型的API 方便开发者集成到应用中但是有一些特殊要求

Runway宣布推出其视频生成模型的API。该API旨在帮助开发者和公司将Runway的生成式AI模型集成到第 […]

Playground v3 技术报告：完全整合了大语言模型的图像生成模型精细的图像生成与控制能力

Playground v3 技术报告：完全整合了大语言模型的图像生成模型精细的图像生成与控制能力

Playground v3（PGv3）是由Playground开发的一种文本到图像生成模型，其基于最新的大语言 […]

StableDiffusion模型推荐系列（全能型）

StableDiffusion模型推荐系列（全能型）

今天，我们要聊一聊AI绘画领域里的一个超有趣的话题：为什么Midjourney能用一个5.2模型轻松驾驭各种风 […]

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1: 在 Groq 上使用 Llama-3.1 70b 创建类似OpenAI o1 的推理链

g1 是一个使用 Llama-3.1 70b 模型在 Groq 上创建类似 o1 的推理链的实验性应用。其主要 […]

StoryTribe ：一个免费的在线故事板制作工具无需绘画技能轻松制作故事板

StoryTribe ：一个免费的在线故事板制作工具无需绘画技能轻松制作故事板

故事板是一种视觉工具，用于通过一系列框架描绘故事或概念，类似于漫画。它最初用于电影行业，帮助有效规划和传达想法 […]

李飞飞的空间智能公司World Labs正式成立获得 2.3 亿美元融资估值10亿美金

李飞飞的空间智能公司World Labs正式成立获得 2.3 亿美元融资估值10亿美金

斯坦福大学教授李飞飞的新公司 World Labs 成功融资 2.3 亿美元。李飞飞被誉为“AI教母”，她的公 […]

GOT-OCR2.0：端到端的 OCR 模型可以处理各种复杂的光学字符任务

GOT-OCR2.0：端到端的 OCR 模型可以处理各种复杂的光学字符任务

GOT-OCR2.0 是一种用于光学字符识别（OCR）任务的通用模型，旨在解决传统OCR系统（OCR-1.0） […]

PuLID：通过一张参考照片使用文本描述快速更改图像中人物的外貌和身份特征

PuLID：通过一张参考照片使用文本描述快速更改图像中人物的外貌和身份特征

PuLID（Pure and Lightning ID Customization via Contrasti […]

腾讯出品！开源AI数字人框架！号称可以不限时长

腾讯出品！开源AI数字人框架！号称可以不限时长

如今数字媒体和虚拟现实技术飞速发展，对数字人的需求不断增加！今天，介绍一个开源创新的虚拟人视频生成框架：Mu […]

深度｜万字访谈！Open AI Sora作者，亲自揭秘Sora原理，Sora能带我们通往AGI吗？

深度｜万字访谈！Open AI Sora作者，亲自揭秘Sora原理，Sora能带我们通往AGI吗？

本文精心编译自 OpenAI Sora 的主要作者Tim Brooks 和 Bill Peebles 在AGI […]

GameGen-O：可以生成开放世界游戏的模型自动生成角色、场景、动作和事件

GameGen-O：可以生成开放世界游戏的模型自动生成角色、场景、动作和事件

GameGen-O是一个专为生成开放世界视频游戏而设计的Diffusion Transforme模型。该模型能 […]

1 … 6 7 8 9 10 … 129