首页 > Ai资讯
英伟达黄仁勋 Computex 2024 演讲全文及精华介绍
英伟达黄仁勋 Computex 2024 演讲全文及精华介绍

6月2日,英伟达联合创始人兼首席执行官黄仁勋在Computex 2024(2024台北国际电脑展)上发表主题演 […]

Video-MME: 首个多模态大模型视频分析综合评估基准
Video-MME: 首个多模态大模型视频分析综合评估基准

Video-MME(Multi-Modal Evaluation benchmark)是首个专门为评估多模态大 […]

NVIDIA 发布全套数字人服务 可根据音频自动生成数字人的身体、面部和姿势
NVIDIA 发布全套数字人服务 可根据音频自动生成数字人的身体、面部和姿势

NVIDIA最近发布了一套名为NVIDIA ACE的生成式AI微服务,这些服务旨在加速数字人(虚拟人)的发展。 […]

教程:如何把自己变成吉卜力电影角色 替换动画片中人物角色
教程:如何把自己变成吉卜力电影角色 替换动画片中人物角色

把自己变成了吉卜力电影角色🤩。这非常简单,只需40分钟!按照以下步骤操作即可。 使用Midjourney生成吉 […]

100 个 Midjourney 随机风格参考 Sref Codes库 以及Sref Codes教程
100 个 Midjourney 随机风格参考 Sref Codes库 以及Sref Codes教程

Sref Codes是什么? Midjourney风格参考种子(srefs)是代表不同风格的独特标识符,通常称 […]

Omost:自动帮你完善提示词并生成符合你预期的图像
Omost:自动帮你完善提示词并生成符合你预期的图像

Omost 是一个使用大语言模型(LLM)生成图像的项目。它通过虚拟画布代理来合成图像,旨在将模型的代码能力转 […]

Spacetop:世界上首款 AR(增强现实) 电脑 100 英寸大屏幕
Spacetop:世界上首款 AR(增强现实) 电脑 100 英寸大屏幕

Spacetop 是一种革命性的笔记本电脑,它取消了传统的物理显示屏,取而代之的是使用 AR(增强现实)眼镜, […]

Phi-3 免费开源的最强大模型!本地一键部署!!
Phi-3 免费开源的最强大模型!本地一键部署!!

Phi-3  Mini Phi-3 Mini 是一个拥有 38 亿参数的轻量级、最先进的开放模型,使用 Phi […]

提高Transformer模型处理复杂算术任务的能力的方法
提高Transformer模型处理复杂算术任务的能力的方法

传统的transformer在处理长数字序列时,难以准确地跟踪和表示每个数字的位置,导致在进行多步骤和复杂运算 […]

Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互
Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互

Anthropic的Claude 3模型现在支持Tool use功能,可以与外部工具和API交互,执行各种任务 […]

AI和脑机接口帮助失语症患者恢复双语交流
AI和脑机接口帮助失语症患者恢复双语交流

加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设 […]

Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像
Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像

Consistent Character 模型,结合多种技术实现角色的一致性图像生成,可以生成给定角色的不同姿 […]

ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音

ElevenLabs推出了一款新的AI音频模型,能够根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 […]

接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布
接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布

影眸团队推出了Rodin Gen-13D生成AI模型。这个模型可以在几十秒内通过文本生成高质量的3D模型,这些 […]

Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本
Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本

Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游 […]

Sonic:基于状态空间模型的低延迟实时推理语音生成模型
Sonic:基于状态空间模型的低延迟实时推理语音生成模型

Sonic 是一个快速、超逼真的语音生成模型,专为实时互动语音而设计,基于下一代状态空间模型(State Sp […]

150枚比特币(价值1000万美金)免费送,拿走不谢!
150枚比特币(价值1000万美金)免费送,拿走不谢!

  这是一个装有150多枚比特币的钱包,目前总价值1020万美金,100%真实!童叟无欺   150枚比特币的 […]

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本
OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

OpenAI推出了ChatGPT Edu,这是一个为大学设计的专用版本,旨在让学生、教职员工、研究人员和校园运 […]

Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages
Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages

Perplexity AI推出Perplexity Pages ,该工具可以帮助你把你搜到的答案自动转化为视觉 […]

ToonCrafter:自动生成卡通动画的中间帧 并根据参考图像对草图自动上色
ToonCrafter:自动生成卡通动画的中间帧 并根据参考图像对草图自动上色

ToonCrafter 是一个帮助动画师生成和优化卡通动画过渡效果的工具。解决了卡通动画中帧与帧之间过渡不自然 […]

V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容
V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容

V-Express 是由南京大学和腾讯AI实验室共同开发的一项可以把单张照片变成视频的技术,并且它能够根据不同 […]

Udio推出新的udio-130音乐生成模型和更多高级功能
Udio推出新的udio-130音乐生成模型和更多高级功能

Udio推出新的udio-130音乐生成模型,可以生成2分钟的音频,帮助创建更具连贯性和结构的曲目。 这意味着 […]

ViViD:视频虚拟试穿技术 可以随意替换视频中人物的衣服
ViViD:视频虚拟试穿技术 可以随意替换视频中人物的衣服

随着互联网和电子商务行业的快速发展,消费者通过在线平台可以方便地接触到各种类型的服装。然而,单纯依赖电商网站上 […]

Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流
Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流

Apten是一种AI驱动的SMS助手,帮助B2C企业通过短信自动化销售、营销和客户服务。Apten可以个性化配 […]

ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文
ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文

ChatTTS 是一个专门为对话场景设计的文本到语音模型,支持中英文,能生成自然流畅的对话语音。这个项目提供了 […]

Llama3-V:500美元的成本构建的基于 Llama3 的多模态模型 性能与GPT-4V相当
Llama3-V:500美元的成本构建的基于 Llama3 的多模态模型 性能与GPT-4V相当

Llama3-V 是基于 Llama3 的多模态模型,能够处理图像输入并生成对应的文本描述,适用于多种多模态任 […]

Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑
Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑

Khoj 是一个开源的、个人化的 AI 助手,旨在充当你的第二大脑。它能够帮助你回答任何问题,不论这些问题是在 […]

StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换
StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换

StreamV2V 是一个可以实现实时视频转换的工具,能够在一个 RTX 4090 显卡上运行。它可以用来做面 […]

Look Once to Hear:全新的降噪耳机 只需注视对方即可放大或者消除对方声音
Look Once to Hear:全新的降噪耳机 只需注视对方即可放大或者消除对方声音

“Look Once to Hear” 是一个智能耳机系统,通过短暂注视目标说话者即可在嘈杂环境中提取其语音并 […]

SignLLM :第一个通过输入文字描述生成手语手势视频的多语言手语模型!
SignLLM :第一个通过输入文字描述生成手语手势视频的多语言手语模型!

SignLLM 是首个多语言手语数据集及其生成模型,旨在通过先进的人工智能技术生成和翻译多种手语。该项目引入了 […]


1 70 71 72 73 74 128