Ai日报 - 第 29 页 - 智汇宝库

首页 > Ai资讯 > Ai日报

Meta 发布开源模型 Llama 3，以及新版本Meta AI 助手

Meta 发布开源模型 Llama 3，以及新版本Meta AI 助手

Meta 发布开源模型 Llama 3，包括预训练和指令调优的8B和70B两种参数的模型以及新版本 AI 助手 […]

Imagine Flash：加速Emu扩散模型提高生成图像的速度和质量

Imagine Flash：加速Emu扩散模型提高生成图像的速度和质量

Meta发表一篇新论文：Imagine Flash：利用逆向蒸馏加速Emu扩散模型 Imagine Flash […]

TeToS：集成多个文本到语音（TTS）服务商的统一接口

TeToS：集成多个文本到语音（TTS）服务商的统一接口

TeToS（Text-to-Speech Operating System）是一个开源项目，提供了一个统一的接 […]

Twitter-Insight-LLM：抓取Twitter数据并可通过自然语言搜索图像

Twitter-Insight-LLM：抓取Twitter数据并可通过自然语言搜索图像

Twitter-Insight-LLM 是一个开源项目，主要功能包括从Twitter抓取数据、基于嵌入的图像搜 […]

如何使用AI工具创建虚拟时尚模特和网红

如何使用AI工具创建虚拟时尚模特和网红

时尚品牌在品牌大使身上投入了大量资金，因为他们拥有完美的外形，符合品牌形象。但现在一切都变了。现在，各品牌都 […]

Mixtral 8X22B：更便宜、更好、更快更强的数学和编码能力

Mixtral 8X22B：更便宜、更好、更快更强的数学和编码能力

Mixtral 发布了 Mixtral 8X22B，它采用了稀疏混合专家（Sparse Mixture-of- […]

Dynamic Typography ：“动态排版”技术可以让文字变成动画

Dynamic Typography ：“动态排版”技术可以让文字变成动画

Dynamic Typography：一种新颖的“动态排版”技术，通过视频扩散先验，将文本字母转化为动画，以增 […]

GPT-Academic：专门针对论文阅读、写作润色优化的学术GPT

GPT-Academic：专门针对论文阅读、写作润色优化的学术GPT

GPT-Academic主要是为了支持学术研究而设计的。它提供了多种工具和功能，特别是针对那些需要处理大量文献 […]

VSR：利用AI算法精确识别一键去除视频中的字幕

VSR：利用AI算法精确识别一键去除视频中的字幕

Video-sSubtitle-Remover (VSR) 一个基于 AI 技术的工具，专门用于从视频和图片中 […]

Nothing公司将ChatGPT引入其新款无线耳机中可召唤ChatGPT

Nothing公司将ChatGPT引入其新款无线耳机中可召唤ChatGPT

Nothing公司计划将聊天机器人ChatGPT引入其顶级无线耳机和手机中，使用户能够与设备对话并获得会话式的 […]

Llama3-8B-Chinese-Chat：基于Llama3-8B微调的中文聊天模型优化中文回答

Llama3-8B-Chinese-Chat：基于Llama3-8B微调的中文聊天模型优化中文回答

Llama3-8B-Chinese-Chat 是基于 Meta-Llama-3-8B-Instruct 模型通 […]

苹果收购法国初创公司Datakalab 专注于AI和计算机视觉技术

苹果收购法国初创公司Datakalab 专注于AI和计算机视觉技术

据报道苹果已经收购了一家位于法国巴黎的初创企业Datakalab，该企业专门从事人工智能压缩和计算机视觉技术。 […]

GPT 4在眼科领域达到专家级临床知识和推理水平

GPT 4在眼科领域达到专家级临床知识和推理水平

英国剑桥大学临床医学院和英国牛津大学临床学术研究生院发表了一个研究报告，评估大语言模型（LLMs），特别是GP […]

Adobe 推出新的 Firefly Image 3 Model 模型

Adobe 推出新的 Firefly Image 3 Model 模型

Adobe 推出了新的 Firefly Image 3 Model模型，这是继 Adobe Firefly 发 […]

Photoshop 升级为 Adobe Firefly Image 3 模型大幅升级

Photoshop 升级为 Adobe Firefly Image 3 模型大幅升级

Adobe Photoshop 利用 Adobe Firefly Image 3 模型的功能推出了新的人工智能 […]

ChatGPT 即将更新的功能曝光新版界面、免费用户也可创建GPTs

ChatGPT 即将更新的功能曝光新版界面、免费用户也可创建GPTs

Tibor Blaho 在 X上曝光了有关 ChatGPT 的即将更新的功能和改进信息人们都在努力寻找 GP […]

微软推出Phi-3 mini系列小型开源语言模型可运行在手机上性能超越Llama 3

微软推出Phi-3 mini系列小型开源语言模型可运行在手机上性能超越Llama 3

微软推出的Phi-3系列小型开源语言模型，在多种语言、推理、编程和数学基准测试中展示了前所未有的性能，超越了相 […]

Hume AI发布其情感智能的语音接口 EVI API 可集成到任何应用中

Hume AI发布其情感智能的语音接口 EVI API 可集成到任何应用中

Hume AI发布了他们的EVI API，这是世界上第一个情感智能的语音AI接口。EVI API可以将情感智能 […]

Meta AI为Ray-Ban Meta智能眼镜集成多模态能力具有视觉能力

Meta AI为Ray-Ban Meta智能眼镜集成多模态能力具有视觉能力

Meta与EssilorLuxottica合作推出的Ray-Ban Meta智能眼镜推出了新功能和新款式，设计 […]

Synthesia：能根据文本语义表达情感和情绪变化的虚拟数字人

Synthesia：能根据文本语义表达情感和情绪变化的虚拟数字人

Synthesia 公司推出能通过脚本就能预测表情的虚拟数字人形象：Expressive-1 AI Avata […]

微信发布一款桌面AI效率工具：小微助手可搜索电脑中所有内容

微信发布一款桌面AI效率工具：小微助手可搜索电脑中所有内容

微信发布一款桌面工作效率的AI工具：小微助手，小微助手提供了灵活的搜索输入方式和广泛的搜索对象支持，使用户能够 […]

Video2Game ：将现实世界的视频自动转换成逼真且可交互的游戏环境

Video2Game ：将现实世界的视频自动转换成逼真且可交互的游戏环境

Video2Game ：它能将单个视频转换成可以实时互动的、逼真的游戏和模拟环境。该项目由伊利诺伊大学香槟分校 […]

OpenVoice：轻松克隆任何声音用多种语言说话并可控制情感口音

OpenVoice：轻松克隆任何声音用多种语言说话并可控制情感口音

由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音，然后能生成多种语言的语音。 […]

HiDiffusion：将扩散模型的图像生成质量提升到4096×4096 速度提高6倍

HiDiffusion：将扩散模型的图像生成质量提升到4096×4096 速度提高6倍

HiDiffusion 是一个无需调整的高分辨率图像生成框架，该项目由来自MEGVII科技和字节跳动的研究团队 […]

DeepFaceLive：可以在直播过程和视频通话时进行实时换脸的工具

DeepFaceLive：可以在直播过程和视频通话时进行实时换脸的工具

DeepFaceLive 是一款专门用于实时面部交换的软件，可以在进行直播过程或视频通话时进行实时面部替换。 […]

IDM-VTON：虚拟试衣技术能够生成高度真实的虚拟试衣图像

IDM-VTON：虚拟试衣技术能够生成高度真实的虚拟试衣图像

IDM-VTON 是一个致力于提升虚拟试衣场景中的图像真实性和细节保留的新方法。让合成的试穿图片更加真实，细节 […]

Humanify：一个Blender插件一键生成高度逼真的人类模型

Humanify：一个Blender插件一键生成高度逼真的人类模型

Humanify 是一个专为Blender设计的插件，它使用户能够一键生成高度逼真的人类模型。这个工具主要面向 […]

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 自然采光

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 自然采光

这个课程为参与者提供了一个全面了解和掌握摄影中各种照明技术的平台，从基本的自然光照到复杂的特效照明，使他们能够 […]

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 人工照明

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 人工照明

这个课程为参与者提供了一个全面了解和掌握摄影中各种照明技术的平台，从基本的自然光照到复杂的特效照明，使他们能够 […]

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 艺术光照

全面了解和掌握 Midjourney 中的各种摄影灯光照明技巧→ 艺术光照

这个课程为参与者提供了一个全面了解和掌握摄影中各种照明技术的平台，从基本的自然光照到复杂的特效照明，使他们能够 […]

1 … 27 28 29 30 31 32