紫东太初大模型
紫东太初,中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。
紫东太初大模型简介
紫东太初,中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。
紫东太初大模型2.0可以做什么
中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。
文本创作
能准确理解用户意图,并生成语意连贯、逻辑通顺的文本内容。覆盖常见的各类型文本创作业务场景如:写文章读后感、岗位招聘JD、信件邮件、邀请函、行程规划等等。
知识问答
能准确理解用户输入的问题语境,并实时地做出对应的知识性问答。包括:生活常识、工作技能、医学知识、历史人文等等。
图文音理解
视觉-文本-语音,更关注图文音三模态数据之间的关联特性,对更广泛、更多样的下游任务提供模型基础支撑。
音乐生成
可以通过给定的文本提示可控生成高保真的音乐,并支持即兴创作多种风格类型和多种乐器演奏的音乐。
3D理解
基于点云数据的3D场景理解和物体感知能力。
信号分析
支持雷达信号鉴别与知识交互,可借助模型快速掌握信号基本来源及参数等。
紫东太初大模型功能总览
“紫东太初2.0” 旨在追求以更全面的问答能力、更丰富的表达能力、多轮多模态问答能力,满足更多复杂业务场景下的对话和创作需求。
1、图像能力
图像描述能力说明:“紫东太初2.0” 能基于用户上传的图片素材,准确理解并回答图片识别类问题,具体地,可以识别图像主体、背景、动作、颜色等等。同时支持上下文信息理解和多轮问答。
示例指令:
上传一张图片,然后发送 “请描述一下这张图片里面有什么”
上传一张图片,然后发送 “请描述一下这张图片里面有哪些颜色”
2、目标检测
能力说明:“紫东太初2.0” 支持丰富品类的目标检测任务,能够判定目标类型、数量和对应的位置信息。
示例指令:
上传一张图片,然后发送“图片中有几个人物”
上传一张图片,然后发送“帮我看看图片中有几种类型的动物”
3、图像检索
能力说明:“紫东太初2.0” 拥有海量的高质图片素材库,能为用户搜索出关联度高的精致图片素材。
示例指令:
“帮我找一张樱花盛开图”
“帮我找一幅上海夜景图”
“汽车长什么样子呢,给我看看图片”
4、图像生成
能力说明:“紫东太初2.0” 能基于用户指令诉求生成对应的精致图片,并可以修改描述微调图片内容。Promote描述小技巧:添加具象的主体特性描述有助于定位到核心场景内容,添加风格或其他特性修饰词描述有助于调整图片整体效果。
示例指令:
“画一幅唯美风格的樱花盛开图”
“生成一张小狗在草地上玩耍的照片”
“帮我画一幅老虎在游泳的图片”
5、文字识别
能力说明:“紫东太初2.0” 能支持多场景、多语种、高精度的文字检测与识别服务,具体业务场景包括:卡证文字识别、票据文字识别、文档图像处理等等。
示例指令:
上传一张图,然后发送“图中有什么文字”
上传一张图,然后发送“帮我识别出图片中的所有文字”
6、语言能力
中文问答
能力说明:“紫东太初2.0” 能准确理解用户输入的问题语境,并能做出准确的知识性问答。包括:生活常识、工作技能、医学知识、历史人文等等。
示例指令:
“考你一下,四大名著有哪些”
“请问一下,世界上最高的山峰是哪一座”
“什么是胃病,有哪些常见的类型和治疗方法?”
“怎样安排个人财务和预算规划?”
7、文本摘要
能力说明:“紫东太初2.0” 能快速理解文章的核心观点,根据长文本提取简洁而准确的摘要。
示例指令:
“帮我提取文章的摘要”+ 输入文章内容
“帮我把这篇文章改得精简一些”+ 输入文章内容
8、文本续写
能力说明:“紫东太初2.0” 能基于用户输入的故事引导自动续写丰富故事内容。
示例指令:
“请续写故事:从前,山上住着3个老和尚”
9、文本创作
能力说明:“紫东太初2.0” 能准确理解用户输入意图,并生成语意连贯、逻辑通顺的文本内容。覆盖常见的各类型文本创作业务场景如:写文章读后感、岗位招聘JD、信件邮件、邀请函、行程规划等等。
示例指令:
“帮我写一个200字人工智能大模型发布会的新闻稿”
“写一篇互联网ai产品经理招聘JD”
“写一篇《三体》的读后感”
“请帮我出一份武汉3日游的行程规划”
“写一封给武汉市政府的感谢信”
10、标题生成
能力说明:“紫东太初2.0” 能基于对文章或者长文本的理解,快速聚合生成精简且概括的标题文案。
示例指令:
“请给这篇文章生成一个标题:”+ 输入文章内容
11、语法分析
能力说明:“紫东太初2.0” 能基于用户上传的中英文文本素材,准确理解并分析句子的语法,提醒语法错误并修改等等。
示例指令:
请把句子修改成正确的语法表达“张总经理和李总工程师正在讨论一个技术改造项目,他同意他的看法。”
请指出句子中的错误,并把它改成正确的表达“A number of students is going to learn a foreign language.”
如果你想要更深入地了解关于智能资讯的内容,可以查看 智汇宝库,这是一个提供智能科技领域最新资讯的网站。
在这个过程中,你可以探索各种智能技术的发展动态,了解智能科技领域的最新进展和趋势。
目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。