首页 > Ai资讯
微软发布 AutoGen Studio:一个无需编写代码即快速构建和设计多代理的系统
微软发布 AutoGen Studio:一个无需编写代码即快速构建和设计多代理的系统

AutoGen Studio 是微软研究院开发的一款低代码工具,旨在帮助开发者快速原型设计、调试和评估由多个人 […]

FLUX.1-dev-LoRA:一个混合现实与插画风格模型 可以生成融合了现实与插画元素的图像
FLUX.1-dev-LoRA:一个混合现实与插画风格模型 可以生成融合了现实与插画元素的图像

FLUX.1-dev-LoRA是一个混合现实与插画风格模型。该模型可以生成融合了现实与插画元素的图像。它基于F […]

Kimichat炒股:7个提示词案例
Kimichat炒股:7个提示词案例

了解股票投资基本概念和知识 什么是有息负债率?用浅显明白的话语针对没有财务会计基础的小白进行解释 Kimi的回 […]

成立两年首次亮相就放王炸 MiniMax发布三款模型 语音模型、音乐模型和类似Sora视频模型
成立两年首次亮相就放王炸 MiniMax发布三款模型 语音模型、音乐模型和类似Sora视频模型

成立两年半的 MiniMax 一直悄无声息的,低调前行。但在刚刚结束的MiniMax Link伙伴日上Mini […]

Windows 电脑安装动态壁纸的方法和素材
Windows 电脑安装动态壁纸的方法和素材

  1,首先我们需要安装 Lively Wallpaper 电脑屏保软件,这是一款完全免费开源的软件!在202 […]

卡巴斯基曝光:钉钉、微信遭黑客入侵,米哈游服务器沦为帮凶!
卡巴斯基曝光:钉钉、微信遭黑客入侵,米哈游服务器沦为帮凶!

卡巴斯基实验室近日在博客中发布了一份关于 HZ Rat 后门程序的调查报告。该后门程序主要针对阿里巴巴旗下的企 […]

Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型
Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型

Jina AI发布 Jina ColBERT v2版本, Jina ColBERT v2是一个多语言的晚期交互 […]

HivisionIDPhotos :轻量级且高效的AI证件照制作工具 可以生成各种标准证件照
HivisionIDPhotos :轻量级且高效的AI证件照制作工具 可以生成各种标准证件照

HivisionIDPhotos 是一个轻量级且高效的AI证件照制作工具,旨在为用户提供便捷的证件照生成方案。 […]

Kotaemon:一个开源、干净且可定制的 RAG UI 可以于与你的文档聊天
Kotaemon:一个开源、干净且可定制的 RAG UI 可以于与你的文档聊天

Kotaemon 是一个基于检索增强生成(RAG)的开源工具,旨在实现与文档对话的功能。该工具为最终用户和开发 […]

EZ-Work:一个开源的AI文档翻译助手 支持多种文档格式的翻译
EZ-Work:一个开源的AI文档翻译助手 支持多种文档格式的翻译

EZ-Work 是一个开源的AI文档翻译助手,设计目的是帮助用户快速、低成本地利用OpenAI等大语言模型AP […]

Runway 突然删库跑路,究竟发生了什么事?
Runway 突然删库跑路,究竟发生了什么事?

Runway这下真的人如其名:Run(跑)way(路)了! 就在昨天,也就是8月30日,著名AI视频创企Run […]

微软正在修复 Windows 11 中糟糕的“帐户管理器”
微软正在修复 Windows 11 中糟糕的“帐户管理器”

最近,微软为 Windows 11推出了所谓的“帐户管理器” ——当您单击“开始”菜单中的个人资料图标时,屏幕 […]

阿里云发布Qwen2-VL 最新视觉语言模型 能够理解长达20分钟以上的视频内容
阿里云发布Qwen2-VL 最新视觉语言模型 能够理解长达20分钟以上的视频内容

阿里云发布Qwen2-VL 最新视觉语言模型版本,较其前代Qwen-VL有显著提升。 Qwen2-VL具备多分 […]

新测试基准发布,最强开源Llama 3尴尬了
新测试基准发布,最强开源Llama 3尴尬了

如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5 […]

智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力
智谱AI发布其最新GLM-4-Plus模型 以及展示了类似GPT 4o的语音视觉能力

智谱AI发布其最新基座大模型GLM-4-Plus以及展示了类似OpenAI GPT 4o模型的视觉能力,能进行 […]

Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文
Magic团队开发出一种超长上下文 AI 模型 LTM 可处理 1 亿个Token的上下文

Magic团队宣布开发出一种超长上下文AI模型LTM。它能够在推理过程中处理和利用多达1亿个token的上下文 […]

腾讯开源的数字人MuseTalk到底行不行?
腾讯开源的数字人MuseTalk到底行不行?

MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的音频驱动唇部同步模型。该模型能够根据输入的音频 […]

Playground 发布 V3 版本 可以轻松创建和编辑各种图像和文本设计
Playground 发布 V3 版本 可以轻松创建和编辑各种图像和文本设计

Playground v3(测试版)的发布,这是一个强大的图形设计工具,用户可以轻松创建和编辑各种图像和文本设 […]

智谱AI静悄悄的上线了一大波新模型,过年了,真的
智谱AI静悄悄的上线了一大波新模型,过年了,真的

原创数字生命卡兹克数字生命卡兹克 2024年08月29日 21:56北京 智谱今天下午在KDD 2024上面, […]

ChatTTS-Forge :一个提供易于使用WebUI和接入各种TTS API服务的开源项目
ChatTTS-Forge :一个提供易于使用WebUI和接入各种TTS API服务的开源项目

ChatTTS-Forge 是一个围绕 TTS(文本转语音)生成模型开发的项目。为用户提供灵活的 TTS 生成 […]

Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法
Gemini 推出了专门提升学生的学习体验新功能 5 种帮助学生更聪明地学习的方法

随着学年的到来,Gemini 推出了专门帮助您学习的新功能。旨在提升学生的学习体验,特别适用于18岁及以上的学 […]

腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅
腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅

腾讯云媒体服务发布一个基于Web 3D技术构建的在线互动平台:3D虚拟展厅。 3D虚拟展厅允许用户通过个性化虚 […]

GenWarp:只需一张图像即可生成该图像不同视角的新图像
GenWarp:只需一张图像即可生成该图像不同视角的新图像

GenWarp 是一种能够从一张图像生成该图像不同视角的新图像的方法。通常情况下,生成一个场景的不同视角需要多 […]

Github上Star数最多的大模型应用基础服务:Dify 深度解读
Github上Star数最多的大模型应用基础服务:Dify 深度解读

背景介绍 接触过大模型应用开发的研发同学应该都或多或少地听过 Dify 这个大模型应用基础服务,这个项目自从 […]

生成式AI与大语言模型的区别
生成式AI与大语言模型的区别

生成式人工智能与大型语言模型(LLMs): 这两项尖端人工智能技术听起来就像是两种截然不同、无法相提并论的东西 […]

Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT

ChatOllama是一款ollama图形化管理工具,集成了ollama,OpenAI,可以实现ollama的 […]

2024年值得关注的Agent框架
2024年值得关注的Agent框架

​在2024年,有几个引人注目的Agent框架值得关注。它们在规划、用户体验、记忆和大模型调用等方面表现出色。 […]

从 GPT-4o 到 LiveKit:实时语音交互的开源实现
从 GPT-4o 到 LiveKit:实时语音交互的开源实现

今天我们来聊聊OpenAI 发布会提到的实时对话语音技术。今天不讨论 GPT-4o 的炸裂或颠覆,而是探讨如何 […]

第一个StableCascade动漫大模型上架了
第一个StableCascade动漫大模型上架了

在Sora发布的时候,StabilityAI默默的发布了StableCascade,随后发布了Stable D […]

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向A […]


1 7 8 9 10 11 126