首页 > Ai资讯
GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务
GOT-OCR2.0:端到端的 OCR 模型 可以处理各种复杂的光学字符任务

GOT-OCR2.0 是一种用于光学字符识别(OCR)任务的通用模型,旨在解决传统OCR系统(OCR-1.0) […]

PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征
PuLID:通过一张参考照片 使用文本描述快速更改图像中人物的外貌和身份特征

PuLID(Pure and Lightning ID Customization via Contrasti […]

腾讯出品!开源AI数字人框架!号称可以不限时长
腾讯出品!开源AI数字人框架!号称可以不限时长

如今数字媒体和虚拟现实技术飞速发展,对数字人的需求不断增加! 今天,介绍一个开源创新的虚拟人视频生成框架:Mu […]

深度|万字访谈!Open AI Sora作者,亲自揭秘Sora原理,Sora能带我们通往AGI吗?
深度|万字访谈!Open AI Sora作者,亲自揭秘Sora原理,Sora能带我们通往AGI吗?

本文精心编译自 OpenAI Sora 的主要作者Tim Brooks 和 Bill Peebles 在AGI […]

GameGen-O:可以生成开放世界游戏的模型 自动生成角色、场景、动作和事件
GameGen-O:可以生成开放世界游戏的模型 自动生成角色、场景、动作和事件

GameGen-O是一个专为生成开放世界视频游戏而设计的Diffusion Transforme模型。该模型能 […]

使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题
使用AI 辅助合成数学数据集 生成高质量、复杂的困难数学题

随着大语言模型(如GPT-4、Claude等)的发展,LLM在处理数学问题上取得了显著进展。然而,这些模型的能 […]

万字长文震撼来袭!揭秘Transformer——吐血解读自注意力机制的革命性突破
万字长文震撼来袭!揭秘Transformer——吐血解读自注意力机制的革命性突破

万字长文深度解读Transformer:《Attention is All You Need》——揭秘自注意力 […]

OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解
OpenAI发布了全新的 o1 推理模型 工作原理及技术报告详解

OpenAI发布了全新的o1-preview” 推理模型系列,这是一个设计用于解决复杂问题的 AI 系列,能够 […]

OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反
OpenAI公布其最新的o1 模型官方提示词建议 提示越简洁越好 链式思维提示可能适得其反

OpenAI公布了其最新的o1 模型官方提示词建议,OpenAI明确表示模型在简单的提示下表现最佳。一些提示工 […]

Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格
Suno推出 Covers 翻唱功能 可以将任何音频、歌曲转化为另一种全新的风格

Suno推出Covers功能,通过Cover功能,你可以将任何音频,从简单的录音到完整制作的歌曲,转化为一种全 […]

苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源

不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级 […]

DataGemma:利用真实世界数据解决人工智能幻觉
DataGemma:利用真实世界数据解决人工智能幻觉

Google最新推出的DataGemma模型旨在通过与Google Data Commons(数据共享平台)的 […]

Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中
Adobe 将推出新的生成式 AI 视频模型 Firefly Video Model 集成到其视频工具中

Adobe 将推出新的生成式 AI 视频模型Adobe Firefly Video Model ,专门用于视频 […]

Hume AI推出 EVI 2 全新的基础语音到语音模型 可进行极其人性化的语音对话
Hume AI推出 EVI 2 全新的基础语音到语音模型 可进行极其人性化的语音对话

Hume AI 推出的全新语音对话基础模型:EVI 2 ,能够与用户进行极其人性化的语音对话。它可以快速流畅地 […]

Vchitect 2.0:上海人工智能实验室开发的视频生成模型 金额生成5 到 20 秒的高清短视频
Vchitect 2.0:上海人工智能实验室开发的视频生成模型 金额生成5 到 20 秒的高清短视频

Vchitect 2.0 是由上海人工智能实验室开发的视频生成模型,它支持通过文本和图像生成5 到 20 秒的 […]

Google NotebookLM推出 “Audio Overview” 的功能 可以将任意文档转换成播客对话
Google NotebookLM推出 “Audio Overview” 的功能 可以将任意文档转换成播客对话

Google 推出的 NotebookLM 新增了一项名为 “Audio Overview” 的功能,允许用户 […]

Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务
Mistral 推出了其首个多模态模型 Pixtral 12B 可以处理图像和文本任务

法国 AI 初创公司 Mistral 推出了其首个多模态模型 Pixtral 12B,该模型具有120 亿参数 […]

中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹

OpenAI后,大模型新增长曲线来了。 大语言模型的效率,正在被这家「清华系」创业公司发展到新高度。 从 Ch […]

国产“小钢炮”MiniCPM3-4B:小参数,大能量!
国产“小钢炮”MiniCPM3-4B:小参数,大能量!

在 AI 大模型浪潮中,国内厂商面壁智能再次突破,推出了其最新的“小钢炮”系列——MiniCPM 3.0。这款 […]

Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型
Jina AI 推出专门将原始 HTML 转换为干净的 Markdown 的小型语言模型

Jina AI 推出的两款专门将原始 HTML 转换为干净的 Markdown 的小型语言模型。 Reader […]

Runway :关于未来AI生成式媒体工具界面和交互的设计原则
Runway :关于未来AI生成式媒体工具界面和交互的设计原则

Runway 发布了一篇文章介绍了他们对 AI 生成媒体的新交互方式的思考。Runway认为应该为生成式媒体创 […]

OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧
OpenAI 分享了5位专业作家利用 ChatGPT 写作的案例方法和技巧

OpenAI 分享了一篇内容,介绍了一些作家如何在创作过程中使用 ChatGPT 的示例。 在这篇文章中,Op […]

吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程
吴恩达AI课程:AI Python 初学者课程 每节课5分钟 1小时学会AI Python编程

这个课程由Andrew Ng主讲,专为初学者设计,帮助学员学习Python编程基础,并将其与AI工具集成进行数 […]

Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段
Vidu发布参考一致性功能 可以让任意主体保持一致 视频生成进入新阶段

Vidu升级其 AI 视频模型,支持让任意主体保持一致 重点在于在生成图像时保持主体的一致性,尤其是针对角色和 […]

软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机
软宣布有史以来性能最优的逻辑量子比特 并将推出世界上最强大的量子计算机

微软宣布了他们在逻辑量子比特领域的突破,展示了性能最好的逻辑量子比特,错误率比物理量子比特低800倍。这一成果 […]

Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用
Chai-1 :一个用于预测分子结构多模态基础模型 解码生命的分子相互作用

Chai Discovery 推出了 Chai-1,一个面向分子结构预测的多模态基础模型,适用于药物发现等任务 […]

深度 | Meta AI助手大测评,市值蒸发万亿都因它?
深度 | Meta AI助手大测评,市值蒸发万亿都因它?

Z Highlights: ·Meta公布的一季报高于预期,但对二季度营收展望低于预期,同时计划大幅增加对开源 […]

如何微调Meta Llama-3 8B
如何微调Meta Llama-3 8B

Meta 推出了 Meta Llama 3 系列 LLM,包括 8 和 70B 大小的预训练和指令调整的生成文 […]

Custom Cursor for Chrome™ – 自定义光标
Custom Cursor for Chrome™ – 自定义光标

Chrome™的自定义光标。 使用大量免费游标或上传自己的游标。   使用我们在 Custom Cursor […]

Chrome、Edge 浏览器最好用的划词翻译插件!
Chrome、Edge 浏览器最好用的划词翻译插件!

一站式划词 / 截图 / 网页全文 / 音视频 AI 翻译扩展,支持谷歌、DeepL、ChatGPT、Clau […]


1 4 5 6 7 8 126